Data engineer DWH в Маркет

По договоренности


Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.

Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.

Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

  • вести разработку ETL-процессов поставки данных;
  • выявлять неэффективность в существующих процессах и оптимизировать их;
  • проектировать структуру хранения данных;
  • участвовать в развитии фреймворка поставки данных;
  • погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
  • сопровождать разработанные процессы ETL.

Мы ждём, что вы

  • уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
  • знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.

Будет плюсом, если вы

  • проектировали DWH: слои, модели хранения данных, процессы ETL;
  • понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
  • имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
  • умеете работать в командной строке систем Unix-like: Linux, macOS.

Поделиться:

Опубликована 24 дня назад

Похожие вакансии

от 150 000 ₽
Рыночная зарплата
ФИНМОЛЛ - Надежный финансовый партнер! С 2011 года предоставляем нашим клиентам финансовую поддержку на выгодных условиях для любых целей по всей России. Ищем в команду аналитика: Обязанности: Построение ETL/ELT процессов (Apache Airflow) Формировани...
  • Полный день
  • Опыт от 1 года
Логотип компании МКК ФинмоллМКК Финмолл
  • Москва
6 часов назад
Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают столицу комфортнее, а жизнь горожан — удобнее и мобильнее. Для системы управления столицей технологии — это незаменимый инструмент, который применяется ...
  • Полный день
  • Опыт от 1 года
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
день назад
В один из крупнейших банков открыт поиск на позицию Data engineer Обязанности: Повышение качества данных ...
  • Полный день
  • Опыт от 1 года
Логотип компании MarksmanMarksman
  • Москва
день назад
В нашем клиенте - небольшой ИТ компании, занимающейся аналитикой продаж для ритейла открыта позиция Data ... engineer. ... Знание принципов работы с Big Data, опыт работы с распределёнными системами — будет плюсом.
  • Полный день
  • Опыт от 1 года
Логотип компании ГрадусГрадус
  • Москва
2 дня назад
165 000 - 220 000 ₽
Выше средней на 28%
Платформа ОФД - продуктовая IT-компания, крупнейший в России оператор фискальных данных. Мы создаем полезные и удобные сервисы для предпринимателей, анализируем рынок российского ритейла на данных из магазинных чеков. Приглашаем в команду Дата инжене...
  • Полный день
  • Опыт от 1 года
Логотип компании Платформа ОФДПлатформа ОФД
  • Москва
6 часов назад
Чем предстоит заниматься: разрабатывать и поддерживать управленческую и финансовую отчетность; создавать новые дашборды и дорабатывать существующие решения; работать с SQL-запросами и витринами данных; развивать и автоматизировать аналитические проце...
  • Полный день
  • Опыт от 1 года
Логотип компании Лаборатория КасперскогоЛаборатория Касперского
  • Москва
6 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.