Data Engineer (Spark)

По договоренности

  • Динамо
  • Белорусская
  • Маяковская

Команда ETL Performance обладает ключевой экспертизой в области производительности ETL процессов в компании и занимается системным подходом к улучшению метрик процессов регулярного обновления данных, отвечает за эффективную утилизацию ресурсов платформы работой ETL, выработку лучших практик в технологиях целевого стека - Spark + Iceberg/S3 и их трансляцию

Требования:

  • Глубокое понимание архитектуры хранилищ данных (DWH) и озер данных (DLH)
  • Промышленный опыт реализации ETL процессов
  • Глубокое понимание принципов распределенных данных и вычислений
  • Аналитический склад ума
  • Опыт анализа данных и знание статистики
  • Знание Spark на выском уровне

    Обязанности:
  • Анализ работы существующих Spark процессов, поиск проблемных мест, рекоммендации по улучшению
  • Выработка и документирования лучших практик для Iceberg + Spark для сообщества Data Engineer-ов
  • Развитие алгоритма выделения ресурсов для ETL процессов на Spark
  • Поиск и реализация стратегических мер для улучшения производительности ETL процессов на Spark

Адрес: Россия, Москва, улица Грузинский Вал, 7
Показать на большой карте

Поделиться:

Опубликована 21 день назад

Похожие вакансии

... интеграционно-функционального тестирования опыт работы с ETL-инструментами (Informatica PC, Oracle Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
3 дня назад
... имеете опыт работы c Airflow; понимаете принципы работы с колоночными БД; имеете базовое понимание data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
3 дня назад
до 210 000 ₽
Рыночная зарплата
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и д...
  • Полный день
  • Опыт от 3 лет
Логотип компании NavioNavio
  • Москва
21 час назад
AERO — провайдер e-commerce и data-решений. ... (K8s), Debezium VCS: Git (GitLab) Подходы: Data Vault / Business Data Vault И место для технологии, ... Будет плюсом: опыт со streaming (Kafka), CDC (Debezium), Spark, K8s, Data Vault.
  • Полный день
  • Опыт от 3 лет
Логотип компании АЭРОАЭРО
  • Москва
21 час назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
6 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.