Инженер данных DWH в Авто.ру

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

Наша команда разработки аналитической инфраструктуры занимается полным циклом обработки данных в компании. Цикл включает сбор, хранение, валидацию и комбинирование всех знаний о бизнесе. Ключевое направление нашей деятельности — аналитическое хранилище данных (DWH), которое мы строим для нужд бизнес-подразделений. Наши пользователи — это и продуктовые команды, которым нужна регулярная отчётность для принятия решений, и эксперты в области глубокого анализа данных.

Технологически ядро хранилища построено на системах хранения данных Yandex Tables (кластер MapReduce собственной разработки), СlickHouse и PostgreSQL. Для разработки, оркестрации и мониторинга ETL-процессов используется собственный фреймворк, который разработан внутри Яндекса. Для организации модели хранения данных на разных уровнях применяются различные методологии проектирования хранилищ данных: Lambda-архитектура, Data Lake, Data Vault.


Задачи:

Проектирование структуры

Вы будете проектировать структуру хранения и обработки данных для новой версии DWH Авто.ру, которая будет создаваться с нуля.

Сопровождение процессов наполнения DWH Авто.ру

Вам предстоит сопровождать текущие процессы наполнения DWH Авто.ру, заниматься созданием новых ETL-процессов в условиях изменения стека в сторону опенсорса.

Оптимизация процессов поставки данных там, где это требуется

При необходимости вы будете погружаться в специфику данных одной или нескольких прикладных бизнес-областей, чтобы как эксперт помогать выявлять критичные аномалии в данных.

Мы ждем, что вы:

  • Занимались промышленной разработкой на Python
  • Проектировали DWH: слои, модели хранения данных, ETL/ELT-процессы
  • Разрабатывали ETL-процессы с использованием Apache Airflow для DWH на основе Greenplum
  • Настраивали поставки данных по API
  • Разбираетесь в SQL на уровне эксперта
  • Понимаете устройство и архитектуру реляционных и нереляционных баз данных
  • Понимаете принципы работы технологий распределённой обработки данных: Hadoop, MapReduce и MPP
  • Знаете основные алгоритмы и структуры данных (особенно те, которые используются в работе с большими данными)

Будет плюсом:

  • Работали с системами YT (YTsaurus), ClickHouse, а также с инструментами оркестрации и выполнения процессов от Яндекса
  • Работали с брокерами сообщений Kafka, RabbitMQ и т. д.
  • Умеете работать в командной строке *nix-систем: Linux и macOS

Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована 15 часов назад

Похожие вакансии

ELT‑потоков (Airflow, dbt); Управление метаданными: создание data catalog, документирование lineage данных ... ; Обеспечение Data Quality: валидация данных на всех этапах, настройка алертов при аномалиях; VictoriaMetrics ... с 1С, работа с 1С OData, REST, SQL; Опыт интеграций с REST источниками данных (сайты, сервисы), с SQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании МосквариумМосквариум
  • Москва
13 часов назад
Сейчас мы ищем дата инженера в новое направление в связи с переходом от разрозненной Excel-отчетности ... к централизованной работе с данными. ... В БУДУЩЕМ СОТРУДНИКЕ МЫ ИЩЕМ: Опыт работы дата инженером от 4 лет; Практический опыт проектирования и ...
  • Полный день
  • Опыт от 3 лет
Логотип компании 2MOOD2MOOD
  • Москва
13 часов назад
Обязанности: Проектирование и разработка ETL/ELT: Создание, поддержка и оптимизация пайплайнов обработки данных ... данных на всех этапах пайплайна; Документация: Ведение технической документации. ... ) и качества данных.
  • Полный день
  • Опыт от 3 лет
Логотип компании Объединенные кондитерыОбъединенные кондитеры
  • Москва
14 часов назад
от 200 000 ₽
Выше средней на 21%
Обязанности Обеспечивать надёжную, масштабируемую и своевременную доставку качественных данных от источников ... Computer Science, математика, информатика, физика или смежные) Опыт работы (лет): От 2 лет в роли Дата-инженера ... Облачные платформы Базы данных и хранилища (PostgreSQL, ClickHouse, BigQuery, Redshift и др.) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Эстилаб РусЭстилаб Рус
  • Москва
14 часов назад
Обязанности: реализация в тандеме с архитектором физического уровня архитектуры данных в DWH для всех ... Требования: Опыт работы от 3х лет; базовые навыки в области инженерии данных; системное аналитическое ... ; опыт получения данных из различных типов API; опыт работы с потоковой обработкой данных; умение работать ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WINLINEWINLINE
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.