Data Engineer (команда RecSys)

По договоренности

  • Автозаводская
  • Технопарк
  • Шаболовская

Ищем Data Engineer в направление рекомендаций, который будет совместно с нами строить пайплайны и развивать платформу данных. В нашей команде коллеги быстро растут и получают опыт в разных задачах — от классического ETL для аналитических витрин до потоковой обработки в реальном времени для ML.

В Okko хорошо развиты data-driven процессы: большое количество A/B экспериментов, источников и витрин делает работу Data Engineer особенно важной. Здесь ваш вклад реально виден: коллеги ценят результаты вашей работы, а ваши решения напрямую влияют на качество аналитики и эффективность ML-моделей.

В команде рекомендаций сейчас два Data Engineer, и мы ищем коллег, чтобы поддерживать текущий ритм разработки, а также развивать потоковую обработку данных и функциональность feature store.

Что предстоит делать:

  • поддержка и разработка batch ETL-пайплайнов на Airflow для аналитических витрин и ML;

  • потоковая обработка данных с использованием Spark Streaming, Kafka, MongoDB;

  • развитие feature store как инструмента, наполнение его фичами и интеграция данных для ML-моделей;

  • документирование, оптимизация и мониторинг пайплайнов и потоков данных.

Наш стек:

  • ClickHouse
  • Airflow
  • Spark (Spark Streaming, PySpark, Spark SQL)
  • Kafka
  • MongoDB
  • Hive
  • S3
  • DataHub

Требования:

  • уверенное знание Python и SQL;

  • опыт построения ETL-процессов с использованием перечисленного стека;

  • будет плюсом: опыт работы с CI/CD, Docker, Grafana, базовые знания в области ML (обучение и инференс моделей, работа с feature store).

Условия:

  • Необходимое оборудование и софт для работы.
  • Официальное трудоустройство.

  • ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки.

  • Льготные условия ипотеки в рамках зарплатного проекта.

  • Бесплатная подписка на сервисы партнеров.
  • Корпоративный спорт.
  • Насыщенная корпоративная жизнь.
  • Электронная библиотека издательства МИФ, в которую входят почти 2 тыс. единиц контента по бизнесу, саморазвитию, здоровому образу жизни и другим актуальным темам.

Адрес: Россия, Москва, Варшавское шоссе, 9
Показать на большой карте

Поделиться:

Опубликована день назад

Похожие вакансии

Обязанности: Проектирование и построение архитектуры дата-платформы «с нуля»: слои данных стратегии обработки исторических изменений, медленно меняющиеся измерения; Разработка отказоустойчивых пайплайнов в Airflow: модульная структура, обработка част...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГК «МТ-Интеграция»ГК «МТ-Интеграция»
  • Москва
день назад
ЧТО МЫ ЖДЕМ ОТ КАНДИДАТА: Опыт работы в роли Data Engineer от 2  лет; Продвинутый уровень владения SQL ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
  • Москва
день назад
260 000 - 340 000 ₽
Выше средней на 9%
Построение прототипов хранилищ данных и разработка витрин данных (Data Marts) для аналитики и отчетности ... Опыт работы в экосистеме Hadoop и навыки Data Engineer: знание компонентов HDFS, YARN, Spark, Kafka, ... Опыт коммерческой разработки с использованием ETL-инструментов: SAS DIS (Data Integration Studio) и/или ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании LIANLIAN
  • Москва
день назад
Мы приглашаем Data Engineer присоединиться к нашей амбициозной команде, чтобы вместе реализовывать крупнейшие ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ITFB GroupITFB Group
  • Москва
день назад
... использованием нашего фреймворка Созданием новых и развитием существующих интеграций для загрузки сырых данных в Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МАГНИТ, Розничная сетьМАГНИТ, Розничная сеть
  • Москва
день назад
... Engineer уверенное знание SQL и Python опыт работы с ETL/ELT-инструментами и фреймворками: Apache Airflow ... разбираться в причинах сбоев в пайплайнах особенно важно: понимание и готовность реализовывать принципы Data ... Quality и Data Governance в коде.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МТСМТС
  • Москва
день назад

Похожие вакансии

Логотип компании ГК «МТ-Интеграция»ГК «МТ-Интеграция»
Логотип компании М.Видео-ЭльдорадоМ.Видео-Эльдорадо
260 000 - 340 000 ₽
Логотип компании LIANLIAN
Логотип компании ITFB GroupITFB Group
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.