Data Engineer в Яндекс Еду

По договоренности

  • Киевская
  • Парк Победы
  • Багратионовская

Яндекс Еда — это сервис доставки еды из ресторанов и магазинов. Наша цель — создать лучший фудтех-продукт на рынке, и для этого нам предстоит решить множество непростых и интересных задач.

Мы расширяем команду и ищем дата-инженеров в команду DWH. Служба разработки платформы управления данными (DMP) формирует актуальные и полные данные для сервиса.

Нам нужны инженеры данных, которые вместе с аналитиками будут проектировать и оптимизировать сложные расчёты и алгоритмы, а также разрабатывать инструменты для сотен бизнес-пользователей.

Какие задачи вас ждут

Оптимизация ETL-процессов
Вам предстоит работать с большими массивами данных, выявлять узкие места в пайплайнах обработки и предлагать решения для их ускорения, решать задачи по оптимизации SQL-запросов, настройке распределённых вычислений.

Обработка данных
Вы будете преобразовывать сырые данные в структурированный формат для дальнейшего анализа. Это включает очистку данных, работу с пропусками и аномалиями, а также создание признаков для моделей и отчётов.

End-to-end-управление данными
Вы будете отвечать за полный цикл работы с данными: от их извлечения из источников до трансформации, хранения и конечного использования в аналитике или ML-моделях.

Поддержка и развитие data-решений
Вы будете поддерживать существующие ETL-процессы, оперативно исправлять инциденты и дорабатывать инфраструктуру для повышения отказоустойчивости. Также в зоне ответственности — документирование процессов и настройка мониторинга качества данных.

Мы ждем, что вы

  • Работали с отладчиками и верификаторами
  • Уверенно программируете на Python
  • Разбираетесь в классических алгоритмах и структурах данных
  • Хорошо знаете SQL и понимаете устройство современных реляционных баз данных
  • Понимаете и можете объяснить необходимость непрерывной интеграции и непрерывной доставки (CI/CD), преимущества использования Git и код-ревью

Будет плюсом, если вы

  • Руководили стажёрами или начинающими специалистами
  • Работали по методологии Agile
  • Участвовали в проектировании хранилищ данных
  • Создавали сложные высоконагруженные процессы ETL и ELT (отдельным плюсом будет знание инструментов Luigi и Airflow)
  • Разрабатывали процессы обработки сложных событий (CEP) во времени, приближенном к реальному (Kafka Streams, Spark, Flink)
  • Знакомы со стеком технологий Hadoop, Spark, Hive
  • Работаете со специализированными аналитическими базами данных (Greenplum, Vertica, ClickHouse, Teradata) и аналитическими инструментами на базе Python (Jupyter, Pandas, SciPy, Matplotlib, Bokeh)
  • Программируете на C++

Адрес: Россия, Москва, 1-й Красногвардейский проезд, 22с1
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

... готов осваивать промпт-инжиниринг — нам важно уметь эффективно «общаться» с моделями в контексте Big Data ...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
165 000 - 220 000 ₽
Выше средней на 28%
Платформа ОФД - продуктовая IT-компания, крупнейший в России оператор фискальных данных. Мы создаем полезные и удобные сервисы для предпринимателей, анализируем рынок российского ритейла на данных из магазинных чеков. Приглашаем в команду Дата инжене...
  • Полный день
  • Опыт от 1 года
Логотип компании Платформа ОФДПлатформа ОФД
  • Москва
2 дня назад
... источников в одно хранилище; Проверка корректности данных, отсеивание неполной или ошибочной информации (Data ... БУДЕТ ПЛЮСОМ: Опыт создания и эксплуатации систем проверки качества данных (Data Quality). ... Знание методологии Data Vault Знание облачных технологий.
  • Полный день
  • Опыт от 1 года
Логотип компании BetBoomBetBoom
  • Москва
8 дней назад
Мы — амбициозная команда, которая занимается развитием BI-отчетности, автоматизацией расчетов различных показателей по операционным рискам и подготовкой данных для ML моделей. Мы создаём инновационные продукты, которые повышают эффективность и прозра...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
9 дней назад
... прозрачности: Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов ... Привычка к ведению документации, понимание принципов Data Catalog (что такое глоссарий, метаданные, lineage ...
  • Полный день
  • Опыт от 1 года
Логотип компании OzonOzon
  • Москва
2 дня назад
Команда занимается исследованиями и разработкой регуляторных моделей по заказу Департамента рисков розничного бизнеса. Обязанности постановка задачи на сбор данных (для DE) и участие в подготовке данных для разработки моделей определение «длинного сп...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
8 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.