Middle Data Engineer

По договоренности

  • Войковская
  • Сокол
  • Аэропорт

RUTUBE — крупнейшая российская видеоплатформа с 15 млн DAU и 80 млн MAU. Мы строим новую рекламную платформу, будущего лидера на рынке видеорекламы.
Мы ищем мидл продукт-менеджера, который усилит команду и поможет нам развивать рекламные продукты Rutube: от рекламного кабинета до алгоритмов показа и повышения монетизации.

Тебе предстоит:

  • Построение ETL-пайплайнов (Spark на Scala, Trino, DBT);
  • Разработка ETL-инструментов для обработки данных (Scala, Python);
  • Разработка внутренних API-сервисов (Python);
  • Техническое сопровождение платформы данных.

Мы ожидаем:

  • Уверенное владение Python;
  • Уверенные знания SQL (оконные функции, оптимизация запросов);
  • Глубокое знание Apache Spark (Python/Scala);
  • Опыт работы с S3 и понимание, чем оно отличается от распределенной файловой системы (HDFS);
  • Опыт работы с форматами файлов: Parquet, ORC, AVRO - в чем различия, какой тип для какой задачи лучше подходит;
  • Опыт работы с Kafka, Spark Streaming / Kafka Streams - понимание проблем в NRT-процессах и методы их решения;
  • Опыт работы с табличными форматами Apache Iceberg / Hudi / Delta Lake;
  • Опыт работы c Docker, K8s;
  • Опыт работы с Airflow;
  • Понимание принципов параллельной обработки данных, какие могут быть сложности и как они решаются;
  • Умение находить "узкие" места в ETL-процессах и оптимизировать их;
  • Понимание концепции хранилища DWH - какие слои выделяют и для чего + понимание концепции DataLakeHouse.
  • Преимуществом будет:
    - Знание Scala или другого Java-подобного языка
    - Опыт работы с MPP системами (GreenPlum / Hadoop / StarRocks)
    - Опыт работы с DBT (Data Build Tool)

Работать у нас комфортно:

​​​​​​Офис, где приятно быть
— Уютное пространство с зонами коворкинга — выбирай, где работать

Здоровье под защитой
— ДМС (стоматология включена)
— Врач прямо в офисе

Вкусно и бесплатно
— Фреш-бар от Novikov Group
— Кофе, чай, фрукты, снэки — каждый день

Отдых без компромиссов
— Обеденные зоны с настолками и массажными креслами Yamaguchi

Оформление по ТК РФ
— Всё официально


Адрес: Россия, Москва, Ленинградский проспект, 72к4
Показать на большой карте

Поделиться:

Опубликована 8 часов назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
до 210 000 ₽
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
7 часов назад
WB Такси развивает экосистему сервисов для клиентов, водителей и операторов поддержки. Мы уже запустили сервис в Беларуси и масштабируемся на рынок РФ и страны СНГ. Наш стек технологий: ClickHouse, Kafka, Airflow, PostgreSQL, MySQL, Tableau, GitLab, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
7 часов назад
... работы с Power BI (другими BI-платформами); Интерес к современным подходам работы с данными (DataOps, Data ... Quality, Data Governance); Интерес к AI/LLM и сценариям использования данных (RAG, data layer для моделей ... системы); Участие в оптимизации производительности обработки данных; Участие в развитии архитектуры data-платформы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ЭрманнЭрманн
  • Москва
8 часов назад
... конвейеры обработки данных, используя стек технологий Hadoop, Apache Spark и другие инструменты Big Data ... Требования Опыт работы в роли Data Engineer (или аналогичной) от 2 лет; Уверенное владение SQL: написание ... или Big Data и участие в профессиональных сообществах, конференциях, open-source проектах.
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
8 часов назад
Мы строим Data Lake House платформу с современным стеком: S3, Trino, Apache Iceberg, DBT, Airflow, Kafka ... реализация в тандеме с архитектором физического уровня архитектуры данных в DWH для всех слоев (raw data ... layer, core data layer, data mart layer); реализация ETL-пайплайнов передачи данных из различных внутренних ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WINLINEWINLINE
  • Москва
7 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.