Инженер данных (Data Engineer, Middle / Senior / Lead)

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

О компании:

Присоединяйтесь к нашей команде для работы над масштабными data-driven проектами в ведущих компаниях из различных секторов: от финтеха и банков до e-commerce, ритейла и телекома. Мы ищем талантливых Инженеров данных уровней Middle, Senior и Lead, готовых строить и развивать современные платформы данных, разрабатывать надежные ETL/ELT-пайплайны и обеспечивать высокое качество данных для аналитики и машинного обучения.

Чем предстоит заниматься:

  • Проектирование и разработка пайплайнов: Создание, развитие и поддержка ETL/ELT-процессов для сбора, обработки и загрузки данных из разнообразных источников (реляционные СУБД, API, логи, стриминговые платформы).

  • Архитектура данных: Проектирование архитектуры хранилищ данных (DWH, Data Lake), моделей данных и витрин (Data Marts) для аналитических и ML-задач, включая слои Raw, ODS и DDS.

  • Обработка больших данных: Разработка на Python/Java/Scala с использованием Apache Spark для распределенной обработки больших объемов данных.

  • Оркестрация и мониторинг: Создание, оптимизация и мониторинг пайплайнов с помощью Apache Airflow; настройка SLA, retries и алертинга.

  • Обеспечение качества данных: Внедрение практик Data Quality (DQ), разработка тестов, профилирование данных, реализация проверок на консистентность и целостность.

  • Работа с базами данных: Написание и оптимизация сложных SQL-запросов для MPP-систем (Greenplum, ClickHouse) и классических СУБД (PostgreSQL).

  • Подготовка данных для ML: Построение и поддержка пайплайнов для подготовки признаков (feature engineering) и датасетов для команд Data Science.

  • Взаимодействие с командой: Тесное сотрудничество с аналитиками данных, ML-инженерами, DevOps-специалистами и бизнес-заказчиками для реализации end-to-end решений.

  • (Для Lead): Управление командой инженеров данных, менторство, принятие ключевых архитектурных решений, планирование и распределение задач, развитие стека технологий и инженерных практик.

Наши ожидания:

  • Опыт работы: От 2-3 лет (Middle), от 5 лет (Senior), от 5-7 лет с опытом лидирования (Lead) в роли инженера данных.

  • SQL: Экспертный уровень владения SQL, включая аналитические и оконные функции, оптимизацию сложных запросов под большие объемы данных.

  • Программирование: Уверенное владение Python (предпочтительно) или Java/Scala для разработки data-пайплайнов.

  • ETL/ELT: Глубокое понимание принципов построения ETL/ELT, архитектуры DWH и Data Lake.

  • Big Data: Практический опыт работы с Apache Spark и экосистемой Hadoop (HDFS, Hive, YARN).

  • Оркестрация: Опыт работы с оркестратором Apache Airflow (разработка и поддержка DAG'ов).

  • Базы данных: Опыт работы с MPP-системами (Greenplum, ClickHouse) и реляционными СУБД (в первую очередь PostgreSQL).

  • Инструменты и методологии: Опыт работы с Git, Jira, Confluence; понимание принципов Agile (Scrum/Kanban).

  • Soft Skills: Сильные аналитические способности, системное мышление, проактивность, ответственность, умение работать в команде и самостоятельно, способность быстро разбираться в сложных системах и бизнес-доменах.

Будет плюсом:

  • Опыт работы в финтех-индустрии (банки, инвестиции) или крупном ритейле.

  • Опыт работы со стриминговыми данными и брокерами сообщений (Apache Kafka, RabbitMQ, NiFi).

  • Опыт использования dbt (Data Build Tool) для трансформации данных.

  • Знание методологий моделирования данных (Data Vault 2.0).

  • Опыт работы с контейнеризацией (Docker, Kubernetes) и понимание CI/CD процессов для данных (DataOps).

  • Опыт работы с облачными платформами (Yandex.Cloud, AWS, Azure, GCP) и их data-сервисами.

  • Навыки администрирования СУБД и компонентов Big Data.

  • Опыт построения систем мониторинга и логирования (Prometheus, Grafana, ELK).

Мы предлагаем:

  • Работу над масштабными и технологически сложными проектами в стабильной компании.

  • Возможности для профессионального и карьерного роста в самых востребованных направлениях ИТ.

  • Сильную команду экспертов и комфортную рабочую атмосферу.

  • Конкурентную заработную плату, бонусы и социальный пакет.

  • Гибкий график и возможность удаленной работы (в зависимости от проекта).


Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

250 000 - 340 000 ₽
Выше средней на 18%
Наши пожелания к кандидатам: От 2-3 лет в роли, связанной с построением аналитической инфраструктуры (Data ... Engineer) или созданием инструментов для бизнес-анализа (BI-разработчик), с применением сходного технологического ... Будет плюсом: Визуализация данных с помощью Power BI (DAX, Power Query, работа с Data Gateways) и/или ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании LIANLIAN
  • Москва
3 дня назад
Мы ищем опытного Data Engineer, который усилит команду разработки внутренней платформы Flocktory. ... Engineer, инженер хранилища данных от 3х лет; опыт решения задач репликации данных, создания слоев данных ... data mesh.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании FlocktoryFlocktory
  • Москва
3 дня назад
Находимся в поисках Инженера данных (data engineer) для главного Портала Москвы - Mos.ru, на котором ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
12 часов назад
до 250 000 ₽
Рыночная зарплата
... архитектуры хранилища; Документирование архитектуры и процессов обработки данных; Требования: Опыт работы Data ... Engineer от 2-ух лет; Уверенное владение Python 3.8+.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МФК ВЭББАНКИРМФК ВЭББАНКИР
  • Москва
6 дней назад
Сейчас мы создаём новую аналитическую платформу «с нуля» и ищем Data Engineer, который заложит её фундамент ... Data Quality: Внедрять мониторинг доступности данных и BI-отчетов, чтобы переход на новую платформу был ... Понимание того, как выстраивать Data Governance в условиях быстрого роста.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AlgonovaAlgonova
  • Москва
7 дней назад
Вы нам подходите, если: Опыт работы в Data Engineering/MLOps не менее 3 лет; Уверенное владение Python ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.