Senior Data Engineer (Azure Databricks)
400 000 - 450 000 ₽
Выше средней на 41%
Ищем опытного сотрудника на позицию Senior Data Engineer для работы в DWH команде заказчика (международная фармацевтическая компания). Основной задачей будет разработка и развитие Data Lakehouse на базе Azure Databricks, включая перенос данных из существующих систем (в первую очередь MS SQL Server), построение надежных ingestion-процессов и подготовку данных для аналитики и BI. От кандидата ожидаем готовности к работе с международной data-командой, понимания архитектуры решений и знания лучших практик работы с данным в рамках используемого стека, опыта выполнения аналогичных проектов.
Технологический стек:
- Azure Databricks (Apache Spark, PySpark, Spark SQL, Delta Lake)
- MS SQL Server
- Python, SQL
- Power BI
- Informatica CDGC (Cloud Data Governance & Catalog)
Обязанности:
- Разработка и поддержка data pipelines для загрузки данных в Data Lake на базе Databricks
- Перенос и интеграция данных из MS SQL Server в архитектуру Data Lakehouse
- Проектирование и реализация ingestion pipelines для загрузки данных из различных источников: баз данных, API, файлов (CSV, Excel, JSON), FTP/SFTP
- Разработка процессов загрузки данных в raw (bronze) слой Data Lake с учетом требований к надежности и воспроизводимости
- Реализация трансформации данных и формирование silver и gold слоев для аналитики и BI
- Оптимизация обработки данных и производительности Spark / SQL-запросов
- Разрабатка и внедрение best practices работы с данными в Data Lake (структура данных, стандарты ingestion, контроль качества данных)
- Обеспечение мониторинга, логгирования и обработки ошибок в data pipelines
- Работа с метаданными, каталогом данных и data lineage (Informatica’s CDGC)
Обязательные требования:
- Опыт работы Data Engineer от 5 лет
- Отличное знание SQL и опыт работы с MS SQL Server или другими реляционными базами данных
- Уверенное владение Python и опыт использования систем контроля версий (Git)
- Опыт разработки ETL/ELT pipelines, включая инкрементальные загрузки и обработку ошибок
- Опыт работы с форматами данных Parquet, CSV, JSON и интеграции данных из различных источников (базы данных, API, файлы, FTP)
- Практический опыт работы с Apache Spark (PySpark или Spark SQL)
- Опыт работы с Databricks и Delta Lake
- Опыт работы с Azure или другими облачными платформами
- Понимание принципов построения Data Lake / Lakehouse архитектуры
- Опыт подготовки данных для BI-систем (Power BI, Qlik Sense и др.)
- Уверенное знание английского языка (предполагается частая коммуникация с коллегами из международной data-команды)
Плюсом будет:
- Опыт работы на профильной позиции в международной фармацевтической / FMCG компании
- Опыт работы с data catalog / data governance инструментами
Условия:
- Удаленная работа
- График работы: 5/2 с 09:00 до 18:00 или с 10:00 до 19:00
- Трудоустройство по ТК РФ
- Аккредитованная IT-компания
Сравнение со средней зарплатой в похожих вакансиях:
250k
350k
162k
300k
500k
Опубликована 22 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Сейчас нам нужен Senior Data Engineer, который закладывает основу дата-платформы с полной свободой в ... настроил базовый мониторинг свежести данных и ошибок в Airflow; Взял ownership над ingestion, lakehouse и data ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
21 день назад
Aegis IT — бутик-компания в сфере IT-аутстаффинга, работающая со специалистами с уровня senior и lead ... Сейчас у нас в работе есть несколько проектов на позицию Senior AQA Python Engineer Чем предстоит заниматься ... / Big Data (обязательно): Опыт тестирования ETL-процессов Опыт работы с data-пайплайнами (Spark / Airflow ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
7 дней назад
About the Role As a Senior Backend Engineer at Zentist your work drives the business. ... Your team Develops the automated data flows which power our entire business, saving dental offices significant ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
5 дней назад
250 000 - 600 000 ₽
Выше средней на 41%
Приглашаем Tech Lead ML Engineer (Python) для работы на IT-проектах наших клиентов (в формате аутстафф ... формировании технической экспертизы команды: менторить инженеров, помогать в развитии junior/middle/senior ... Понимание смежных направлений: Data Engineering, Backend, DevOps/MLOps.
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
18 дней назад
... поддержки масштабируемых ETL-пайплайнов; Опыт проектирования и работы с облачными хранилищами (S3, Data ... lake, Data warehouse); Опыт проектирования баз данных (SQL, NoSQL); Опыт работы с Docker и выстраивания ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
3 дня назад
Вакансия в подборках
Похожие вакансии
250 000 - 600 000 ₽