Data Engineer Инженер данных

По договоренности

  • Марксистская
  • Третьяковская
  • Новокузнецкая

Обязанности:

  • Проектирование и разработка ETL/ELT-паплайнов для обработки структурированных и неструктурированных данных (тексты, изображения, видео);
  • Организация и поддержка хранилища данных, включая объективные, реляционные и распределенные системы;
  • Внедрение и сопровождение Future Store для централизованного хранения и подачи признаков в модели;
  • Автоматизация процессов резервного копирования и мониторинга ETL-процессов (Prometheus, Grafana);
  • Обеспечение версионирования датасетов (DVC) и моделей (MLFlow) в рамках MLOps-практик;
  • Разработка дашбордов для контроля качества данных и состояния паплайнов;
  • Участие в построении CI/CD для дата-паплайнов и моделей машинного обучения;
  • Изучение и интеграция перспективных технологий, включая векторные базы данных и инструменты распределенных вычислений.

Требования:

  • Высшее образование (математика, компьютерные науки, физика, инженерия и смежные области);
  • Опыт работы от 3 лет в аналогичной должности;
  • Продвинутое владение языком Python: написание скриптов для обработки данных, работа с большим объемом информации. Практический опыт построения паплайнов с использованием ETL/ELT подходов;
  • Уверенное владение инструментальным стеком: PySpark - обработка распределенных данных, AirFlow - оркестрация рабочих процессов, ClickHouse - аналитические и распределенные СУБД; MLFlow - управление экспериментами и версионирование моделей; DVC - версионирование данных;
  • Опыт работы с различными типами хранилищ: Объектные хранилища (S3, Minio и аналоги), Реляционные БД, Распределенные системы хранения;
  • Понимание архитектуры Feture Store и опыт его внедрения или интеграции;
  • Навыки обработки изображений и видео с использованием OpenCV;
  • Знание основ контейнеризации (Docker) и общее понимание принципов работы Kubernetes;
  • Осведомленность о своевременных подходах к хранению векторных данных, готовность к изучению и внедрению в текущую инфраструктуру;
  • Владения языками Rust или Go;
  • Опыт участия в проектах машинного обучения;
  • Опыт внедрения CI/CD для паплайнов обработки данных и ML-моделей.
Условия:
  • Оформление по ТК РФ, 100% белая заработная плата;

  • График работы 5/2 с 8:30-17:30, пятница – сокращенный день до 16:15 (возможность гибкого начала рабочего дня, гибридный формат работы, с возможностью посещения офиса);

  • Забота о здоровье сотрудников:

    - Добровольное медицинское страхование (после 3 месяцев работы);

    - Скидки по ДМС для родственников сотрудника;

    - Скидки на стоматологию;

    - Полис для выезжающих за границу.

  • Материальные бонусы:

    - Годовая премия;

    - Дополнительные выплаты к первому отпуску;

    - Материальная помощь при рождении детей и к другим значимым событиям в жизни сотрудника;

    - Материальная помощь в сложных жизненных ситуациях.

  • Забота о развитии:

    - Внешнее обучение за счет работодателя;

    - Внутреннее обучение: СДО, тренинги;

    - Корпоративные мероприятия, подарки для детей;

    - Возможность посещать психолога;

    - Образовательные и развивающие мероприятия


Адрес: Россия, Москва, Дербеневская набережная, 7с9
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

от 243 700 ₽
Рыночная зарплата
... преимуществом опыт с Hadoop (HDFS, YARN, Hive) знание облачных платформ (AWS S3/Glue, GCP BigQuery, Azure Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
19 часов назад
Требования • опыт работы в data engineering от 3 лет с экспертным владением scala и продвинутым sql • ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
3 дня назад
Kafka, Postgres, CDC, OpenMetaData Обязанности · Разрабатывать и поддерживать автоматизированные тесты Data ... работы с Airflow: создание, отладка и поддержка DAG’ов. · Понимание принципов тестирования данных (Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
19 часов назад
до 400 000 ₽
Выше средней на 65%
Команды CDO B2C в поиске Data engineer в сфере управления данными и data-продуктами. ... Мы ищем опытного и амбициозного data-инженера, который готов вместе с нами создать будущее данных Сбера ... опыт работы с оркестраторами (например, Airflow) и CI/CD опыт построения архитектуры данных (например, Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
19 часов назад
... бизнесу увеличивать доходность за счет моделей машинного обучения, для чего развиваем аналитическую Data ... данными о наших продуктах, клиентах и внешних событиях| Мы ищем талантливого специалиста на позицию Data ... Engineer / MLOps Engineer для расширения нашей команды.
  • Полный день
  • Опыт от 3 лет
Логотип компании Bell IntegratorBell Integrator
  • Москва
19 часов назад
до 210 000 ₽
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.