Lead Data Engineer / Ведущий инженер данных

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

Привет! Ищем в Блейз Аналитикс ведущего инженера данных (Lead Data Engineer) на проект Data Lakehouse для госзаказчика. Мы специализируемся на разработке хранилищ данных и BI-аналитике. У нас распределенная команда, низкий уровень бюрократии, прозрачные и понятные процессы, на которые может влиять каждый сотрудник.

Ведущий инженер данных возглавит разработку нашего продукта, поможет развернуть продукт в контуре заказчика (надо будет ездить в офис в центре Москвы), внедрит стандарты разработки и возглавит группу из 2 инженеров данных.

Стек: CedrusData (Trino) + Apache Iceberg, Spark, Airflow + MinIO / VK S3.

Если описанные ниже требования про тебя, ждём твой отклик.

Опыт и технические навыки (обязательные):
- Понимание принципов функционирования распределенных систем/вычислений
- Понимание основ проектирования эффективных приложений для СУБД и подходов к оптимизации
- Опыт разработки PySpark и оптимизации Spark-приложений (must have)
- Опыт разработки на Python
- Опыт работы с одной из СУБД: Postgres, Oracle, Greenplum или аналогичной.
- Опыт работы с Airflow
- Опыт работы с git
- Уверенный пользователь Linux (типовые команды и утилиты)

Желательно:
- Опыт работы с Trino/Hive/Hadoop
- Опыт работы с табличными форматами (предпочтительно Iceberg или DeltaLake/Hudi)
- Опыт работы с Docker и Kubernetes
- Опыт разработки на Java (или понимание основ JVM)
- Опыт работы с инструментами мониторинга (Grafana, Prometheus и аналогичные)

Требования/функции:
- Разработка программных модулей (преимущественно ETL) с использованием PySpark и Airflow
- Создание модулей автоматизации ETL-процедур для переиспользуемого шаблонного кода
- Оптимизация разработанных решений

Организационные и лидерские задачи:
- Управление командой 2-4 человека (постановка задач, соблюдение общих стандартов и валидация результатов)
- Декомпозиция высокоуровневых задач и делегирование разработчикам
- Выстраивание процессов разработки (стандарты, CI/CD, стенды, инструкции развертывания)
- Проведение технических демо разработанного функционала заказчику

Дополнительно

Позиция предполагает гибридный формат работы с периодическими выездами к заказчику (центр Москвы).


Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
до 210 000 ₽
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
14 часов назад
WB Такси развивает экосистему сервисов для клиентов, водителей и операторов поддержки. Мы уже запустили сервис в Беларуси и масштабируемся на рынок РФ и страны СНГ. Наш стек технологий: ClickHouse, Kafka, Airflow, PostgreSQL, MySQL, Tableau, GitLab, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
14 часов назад
Java-подобного языка - Опыт работы с MPP системами (GreenPlum / Hadoop / StarRocks) - Опыт работы с DBT (Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании RUTUBERUTUBE
  • Москва
14 часов назад
... работы с Power BI (другими BI-платформами); Интерес к современным подходам работы с данными (DataOps, Data ... Quality, Data Governance); Интерес к AI/LLM и сценариям использования данных (RAG, data layer для моделей ... системы); Участие в оптимизации производительности обработки данных; Участие в развитии архитектуры data-платформы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ЭрманнЭрманн
  • Москва
14 часов назад
... конвейеры обработки данных, используя стек технологий Hadoop, Apache Spark и другие инструменты Big Data ... Требования Опыт работы в роли Data Engineer (или аналогичной) от 2 лет; Уверенное владение SQL: написание ... или Big Data и участие в профессиональных сообществах, конференциях, open-source проектах.
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
14 часов назад
Мы строим Data Lake House платформу с современным стеком: S3, Trino, Apache Iceberg, DBT, Airflow, Kafka ... реализация в тандеме с архитектором физического уровня архитектуры данных в DWH для всех слоев (raw data ... layer, core data layer, data mart layer); реализация ETL-пайплайнов передачи данных из различных внутренних ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WINLINEWINLINE
  • Москва
14 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.