Data engineer DWH в Маркет

По договоренности

  • Третьяковская
  • Маяковская
  • Тверская

Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.

Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.

Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

  • вести разработку ETL-процессов поставки данных;
  • выявлять неэффективность в существующих процессах и оптимизировать их;
  • проектировать структуру хранения данных;
  • участвовать в развитии фреймворка поставки данных;
  • погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
  • сопровождать разработанные процессы ETL.

Мы ждём, что вы

  • уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
  • знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.

Будет плюсом, если вы

  • проектировали DWH: слои, модели хранения данных, процессы ETL;
  • понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
  • имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
  • умеете работать в командной строке систем Unix-like: Linux, macOS.

Адрес: Россия, Москва, Арбатско-Покровская линия, метро Смоленская
Показать на большой карте

Поделиться:

Опубликована 20 дней назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Нужен Data Engineer, который сможет взять на себя часть непрофильной для аналитиков работы по автоматизации ...
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
10 часов назад
Требования опыт работы в области Data engineering от 2 лет уверенное знание Apache Spark, в целом экосистемы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
10 часов назад
Основные обязанности: анализ и оценка требований к потокам загрузки; обследование источников, системный анализ структур данных источников; разработка интеграционных решений для подключения к новым источникам; проектирование модели данных DWH (stage-о...
  • Полный день
  • Опыт от 3 лет
Логотип компании Вкусно — и точкаВкусно — и точка
  • Москва
3 дня назад
Мы - Команда разработки DATA решений для Программы Лояльности СберСпасибо – отвечаем за промышленную ... обработку данных: Big Data, реальные SLA, живой драйвовый бизнес. ... Требования не менее 2 лет работы в качестве Data Engineer или ETL Developer; отличное знание SQL и современных ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
Автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари • Работать в связке с Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании X5 TechX5 Tech
  • Москва
3 дня назад
В связи с расширением проектов у нас открыта вакансия DATA ENGINEER. ... СТЕК: SQL, Hadoop, Hive, Spark, Python ОТ УСПЕШНОГО КАНДИДАТА МЫ ОЖИДАЕМ : Опыт в роли Data Engineer ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.