Data engineer DWH в Маркет

По договоренности


Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.

Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.

Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

  • вести разработку ETL-процессов поставки данных;
  • выявлять неэффективность в существующих процессах и оптимизировать их;
  • проектировать структуру хранения данных;
  • участвовать в развитии фреймворка поставки данных;
  • погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
  • сопровождать разработанные процессы ETL.

Мы ждём, что вы

  • уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
  • знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.

Будет плюсом, если вы

  • проектировали DWH: слои, модели хранения данных, процессы ETL;
  • понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
  • имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
  • умеете работать в командной строке систем Unix-like: Linux, macOS.

Поделиться:

Опубликована 12 часов назад

Похожие вакансии

Наша команда предоставляет для Банка ТОП-3 сервис обеспечения бизнес-процессов агрегированными и структурированными внешними данными. Разрабатываем дата-продукт внешнего профиля клиента, так же создаем решения под Hadoop+Scala+Spark, осваиваем разраб...
  • Полный день
  • Опыт от 1 года
Логотип компании Лига Цифровой ЭкономикиЛига Цифровой Экономики
  • Москва
12 часов назад
Azur Games – международный издатель и разработчик мобильных игр. В нашем портфолио более 150 успешных f2p проектов в разных жанрах: от увлекательного гиперкэжа до ярких мидкор тайтлов с синхронным PvP. И мы постоянно наращиваем темпы: расширяем портф...
  • Полный день
  • Опыт от 1 года
Логотип компании Azur GamesAzur Games
  • Москва
12 часов назад
Ищем специалиста на позицию Data Engineer для участия в создании и поддержке инфраструктуры данных крупного банка. Будете отвечать за разработку, оптимизацию и поддержку витрин данных, работу с источниками данных и создание эффективных процессов обра...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
12 часов назад
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», ...
  • Полный день
  • Опыт от 1 года
Логотип компании Rambler&CoRambler&Co
  • Москва
7 дней назад
АО «РУССКИЙ ПРОДУКТ» - крупный отечественный производитель бакалейной продукции. Успешно работает на рынке с 1996 года. Наши бренды: «Геркулес», «Суперсуп», "Печем дома", "Традиция", и др. Мы предоставляем возможности для профессионального развития, ...
  • Полный день
  • Опыт от 1 года
Логотип компании РУССКИЙ ПРОДУКТРУССКИЙ ПРОДУКТ
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.