Senior Data Engineer/Аnalyst
По договоренности
Мы в поисках специалистов в работу над федеральным проектом — созданием цифровой платформы для тарифного регулирования, которая станет основой для расчёта и контроля регулируемых тарифов и инвестиционных программ по всей стране. Создание федеральной системы является стратегическим проектом для государства.
О КОМПАНИИ
Автоматизируем сферу тарифного регулирования (теплоснабжение, электроэнергетика, водоснабжение). Создаем уникальные технологии, среди направлений - электронный обмен данными, инструменты анализа и прогнозирования данных, автоматизация процессов принятия решений на основе данных, системная интеграция.
Наши разработки используются федеральными ведомствами, такими как ФАС России, Минстрой России, Минэнерго России и крупными корпорациями, включая ПАО «Русгидро», Группа компаний «Интер РАО», Госкорпорация «Росатом» и ООО «Газпром энерго». С нами работают более 92 000 активных пользователей, и их число постоянно растет. В портфеле более 450 успешно реализованных проекта, более 10 продуктов.
ПОЧЕМУ МЫ ОТКРЫЛИ ВАКАНСИЮ:
В настоящее время перед нашей компанией стоит масштабная задача — модернизация федеральной системы тарифного регулирования. Для обеспечения надежной работы системы и качества данных нам необходим опытный Data Engineer для построения и поддержки ETL/ELT-процессов, хранилищ данных и аналитических витрин.
ЗАДАЧИ И ЗОНЫ ОТВЕТСТВЕННОСТИ:
- Проектирование, разработка и поддержка ETL/ELT-пайплайнов и инфраструктуры данных.
- Оптимизация и поддержка многомерных хранилищ данных, обеспечение их производительности и доступности.
- Разработка и поддержка архитектуры данных, моделей данных и витрин для аналитики и отчетности.
- Обеспечение качества, целостности и согласованности данных в различных источниках.
- Автоматизация процессов обработки данных и мониторинг их выполнения.
НАШ СТЕК:
- Базы данных и хранилища: PostgreSQL, MySQL, ClickHouse, Greenplum
- Языки и скрипты: SQL (углубленно), Python (для ETL/автоматизации)
- Инструменты ETL/Orchestration: Apache Airflow, Apache NiFi
- Визуализация и мониторинг: Grafana, Redash
- Инфраструктура и контроль версий: GitLab, Jira
ПРОФЕССИОНАЛЬНЫЕ НАВЫКИ И ТРЕБОВАНИЯ:
- Опыт работы в качестве Data Engineer или в смежной роли (ETL-разработчик, аналитик данных) от 4 лет.
- Уверенное владение SQL (оптимизация запросов, оконные функции, DDL/DML) и опыт работы с реляционными и колоночными СУБД.
- Опыт проектирования, построения и оптимизации ETL/ELT-процессов и пайплайнов данных.
- Глубокое понимание принципов построения хранилищ данных (Data Warehouse).
- Опыт работы с инструментами оркестрации (Apache Airflow) и обработки данных.
- Знание Python для разработки скриптов обработки данных, автоматизации и работы с API.
- Опыт работы с Git (GitLab, GitHub, Bitbucket).
- Понимание жизненного цикла данных и обеспечения качества данных.
Будет плюсом:
- Понимание основ Data Lake и подходов к работе с большими данными.
- Опыт настройки мониторинга пайплайнов и инфраструктуры данных.
- Базовые знания в области машинного обучения и MLOps.
- Опыт управления командой или проектами.
- Знание основ облачных технологий (Yandex Cloud, S3-совместимые хранилища).
ЛИЧНОСТНЫЕ КАЧЕСТВА:
Системность, самостоятельность, стремление во всём наводить порядок, проактивность, нацеленность на результат. Умение работать с сложными системами. Способность быстро погружаться в новые предметные области и технологические стеки.
УСЛОВИЯ:
Официальное оформление по ТК РФ, стабильная белая заработная плата. Удаленный или гибридный формат. Карьерный рост и возможность профессионального развития в сильной команде.
Опубликована 12 часов назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва