Data Engineer (направление качества пунктов выдачи)

По договоренности

  • Смоленская
  • Киевская
  • Парк Победы

В подгруппу инфраструктуры данных требуется инженер данных для выполнения задач по изменению и развитию инфраструктуры данных в соответствии с общими изменениями в компании, включая переход на собственную схему хранения данных.

Вам предстоит:

Построение и поддержка ETL/пайплайнов:

Разработка, оптимизация и мониторинг для гарантированной доставки данных.

Развитие сервисной модели для аналитиков:

Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.

Повышение надежности и прозрачности:

Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.

Технологический стек проекта:

Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).

Аналитические СУБД: ClickHouse, Vertica, Trino

Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).

Мы ожидаем:

Знание SQL (CTE, оконные функции, оптимизация запросов).

Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).

Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.

Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.

Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).

Будет преимуществом:

Практический опыт работы с Apache Kafka. Знание специфики ClickHouse (движки таблиц, особенности кластерной работы).

Опыт работы с Vertica/Trino. Навыки работы с Docker и оркестраторами (Rancher/Kubernetes).

Понимание принципов работы gRPC.

Привычка к ведению документации, понимание принципов Data Catalog (что такое глоссарий, метаданные, lineage).


Адрес: Россия, Москва, Московский международный деловой центр Москва-Сити, многофункциональный комплекс Башня на Набережной
Показать на большой карте

Поделиться:

Опубликована месяц назад

Похожие вакансии

... данных Проработка требований и согласование способов интеграции источников совместно с аналитиком, data ... архитектором Предоставление поддержки data-потребителям по вопросам, связанным с использованием данных ...
  • Полный день
  • Опыт от 1 года
Логотип компании АНО ЦИСМАНО ЦИСМ
  • Москва
3 дня назад
... своей и соседних команд Требования: 3+ года коммерческой разработки на Python. 2+ года опыта в роли Data ... Engineer или в проектах, связанных с построением и поддержкой ETL/ELT пайплайнов, использованием Big ... Data технологий (особенно Spark).
  • Полный день
  • Опыт от 1 года
Логотип компании Bell IntegratorBell Integrator
  • Москва
4 дня назад
от 260 000 ₽
Выше средней на 73%
НАЙМ В ООО «ПРОКТЕР ЭНД ГЭМБЛ ДИСТРИБЬЮТОРСКАЯ КОМПАНИЯ» Готовы вывести свою карьеру на новый уровень? Сообщество IT в P&G ищет дата-инженера, который присоединится к нашей команде в Москве! В этой роли вы будете создавать системы и решения с исп...
  • Полный день
  • Опыт от 1 года
Логотип компании Procter & GambleProcter & Gamble
  • Москва
2 дня назад
Ищем опытного специалиста на позицию Дата инженера, который будет отвечать за создание и поддержку инфраструктуры обработки больших объемов данных. Ты будешь вовлечен в разработку эффективных процессов сбора, преобразования и хранения данных, чтобы о...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных ...
  • Полный день
  • Опыт от 1 года
Логотип компании Автономные ТехнологииАвтономные Технологии
  • Москва
9 дней назад
150 000 - 250 000 ₽
Выше средней на 33%
Ищем data-engineer, который будет заниматься инженерной частью данных: пайплайнами, хранением, оптимизацией ... Алерты и проверки Разбор инцидентов Поддержка production-витрин Наш стек ClickHouse Trino Iceberg / Data ... строк) Понимание идемпотентности, ретраев, backfill Будет плюсом ClickHouse / Presto / Trino Airflow Data ...
  • Полный день
  • Опыт от 1 года
Логотип компании ТАРГЕТ АДСТАРГЕТ АДС
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.