Senior Data Engineer (Azure Databricks)

400 000 - 450 000 ₽

Выше средней на 41%

Ищем опытного сотрудника на позицию Senior Data Engineer для работы в DWH команде заказчика (международная фармацевтическая компания). Основной задачей будет разработка и развитие Data Lakehouse на базе Azure Databricks, включая перенос данных из существующих систем (в первую очередь MS SQL Server), построение надежных ingestion-процессов и подготовку данных для аналитики и BI. От кандидата ожидаем готовности к работе с международной data-командой, понимания архитектуры решений и знания лучших практик работы с данным в рамках используемого стека, опыта выполнения аналогичных проектов.

Технологический стек:

  • Azure Databricks (Apache Spark, PySpark, Spark SQL, Delta Lake)
  • MS SQL Server
  • Python, SQL
  • Power BI
  • Informatica CDGC (Cloud Data Governance & Catalog)

Обязанности:

  • Разработка и поддержка data pipelines для загрузки данных в Data Lake на базе Databricks
  • Перенос и интеграция данных из MS SQL Server в архитектуру Data Lakehouse
  • Проектирование и реализация ingestion pipelines для загрузки данных из различных источников: баз данных, API, файлов (CSV, Excel, JSON), FTP/SFTP
  • Разработка процессов загрузки данных в raw (bronze) слой Data Lake с учетом требований к надежности и воспроизводимости
  • Реализация трансформации данных и формирование silver и gold слоев для аналитики и BI
  • Оптимизация обработки данных и производительности Spark / SQL-запросов
  • Разрабатка и внедрение best practices работы с данными в Data Lake (структура данных, стандарты ingestion, контроль качества данных)
  • Обеспечение мониторинга, логгирования и обработки ошибок в data pipelines
  • Работа с метаданными, каталогом данных и data lineage (Informatica’s CDGC)

Обязательные требования:
  • Опыт работы Data Engineer от 5 лет
  • Отличное знание SQL и опыт работы с MS SQL Server или другими реляционными базами данных
  • Уверенное владение Python и опыт использования систем контроля версий (Git)
  • Опыт разработки ETL/ELT pipelines, включая инкрементальные загрузки и обработку ошибок
  • Опыт работы с форматами данных Parquet, CSV, JSON и интеграции данных из различных источников (базы данных, API, файлы, FTP)
  • Практический опыт работы с Apache Spark (PySpark или Spark SQL)
  • Опыт работы с Databricks и Delta Lake
  • Опыт работы с Azure или другими облачными платформами
  • Понимание принципов построения Data Lake / Lakehouse архитектуры
  • Опыт подготовки данных для BI-систем (Power BI, Qlik Sense и др.)
  • Уверенное знание английского языка (предполагается частая коммуникация с коллегами из международной data-команды)

Плюсом будет:

  • Опыт работы на профильной позиции в международной фармацевтической / FMCG компании
  • Опыт работы с data catalog / data governance инструментами

Условия:
  • Удаленная работа
  • График работы: 5/2 с 09:00 до 18:00 или с 10:00 до 19:00
  • Трудоустройство по ТК РФ
  • Аккредитованная IT-компания

Сравнение со средней зарплатой в похожих вакансиях:

225k

350k

150k

300k

500k


Поделиться:

Опубликована день назад

Похожие вакансии

Сейчас нам нужен Senior Data Engineer, который закладывает основу дата-платформы с полной свободой в ... настроил базовый мониторинг свежести данных и ошибок в Airflow; Взял ownership над ingestion, lakehouse и data ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании YCLIENTS LLCYCLIENTS LLC
  • Москва
день назад
CDC-процессы Ускорять продуктивизацию пользовательских витрин Обеспечивать высокое качество данных Делать Data-продукты ... Clickhouse, Trino, PostgreSQL, Kafka Connect, Debezium, Kubernetes Что для нас важно Опыт работы на роли Data ... Engineer от 5 лет Уверенные навыки работы с нашим стеком: Spark / DeltaLake / Presto / Trino; Clickhouse ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании «UZUM TECHNOLOGIES»«UZUM TECHNOLOGIES»
  • Москва
день назад
Position: Data Engineer Level: Senior Experience: 8+ лет (НЕ фриланс) Stack: NVIDIA Triton Inference ... Server, Amazon SageMaker, GCP Vertex, K8S, Airbyte, Python, ETL, Data Modeling Location: Remote Employment ... : Fulltime Languages: English B2+ КОГО ИЩЕМ: Data AI Engineer с опытом работы с инфраструктурой AI на ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании SimplenightSimplenight
  • Москва
15 дней назад
Мы — команда платформы данных, строим мощную Data-платформу, которая объединяет решения для хранения ... Сейчас мы в поиске разностороннего Data-инженера, который сможет не только проектировать и разрабатывать ... Знакомство с инструментами Data Quality (Great Expectations, Soda, dbt tests).
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
20 дней назад
Ищем DWH Engineer для команды VK Видео — одного из крупнейших и самых популярных видеосервисов в России ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании VKVK
  • Москва
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.