Data Engineer Инженер данных

По договоренности

  • Марксистская
  • Третьяковская
  • Новокузнецкая

Обязанности:

  • Проектирование и разработка ETL/ELT-паплайнов для обработки структурированных и неструктурированных данных (тексты, изображения, видео);
  • Организация и поддержка хранилища данных, включая объективные, реляционные и распределенные системы;
  • Внедрение и сопровождение Future Store для централизованного хранения и подачи признаков в модели;
  • Автоматизация процессов резервного копирования и мониторинга ETL-процессов (Prometheus, Grafana);
  • Обеспечение версионирования датасетов (DVC) и моделей (MLFlow) в рамках MLOps-практик;
  • Разработка дашбордов для контроля качества данных и состояния паплайнов;
  • Участие в построении CI/CD для дата-паплайнов и моделей машинного обучения;
  • Изучение и интеграция перспективных технологий, включая векторные базы данных и инструменты распределенных вычислений.

Требования:

  • Высшее образование (математика, компьютерные науки, физика, инженерия и смежные области);
  • Опыт работы от 3 лет в аналогичной должности;
  • Продвинутое владение языком Python: написание скриптов для обработки данных, работа с большим объемом информации. Практический опыт построения паплайнов с использованием ETL/ELT подходов;
  • Уверенное владение инструментальным стеком: PySpark - обработка распределенных данных, AirFlow - оркестрация рабочих процессов, ClickHouse - аналитические и распределенные СУБД; MLFlow - управление экспериментами и версионирование моделей; DVC - версионирование данных;
  • Опыт работы с различными типами хранилищ: Объектные хранилища (S3, Minio и аналоги), Реляционные БД, Распределенные системы хранения;
  • Понимание архитектуры Feture Store и опыт его внедрения или интеграции;
  • Навыки обработки изображений и видео с использованием OpenCV;
  • Знание основ контейнеризации (Docker) и общее понимание принципов работы Kubernetes;
  • Осведомленность о своевременных подходах к хранению векторных данных, готовность к изучению и внедрению в текущую инфраструктуру;
  • Владения языками Rust или Go;
  • Опыт участия в проектах машинного обучения;
  • Опыт внедрения CI/CD для паплайнов обработки данных и ML-моделей.
Условия:
  • Оформление по ТК РФ, 100% белая заработная плата;

  • График работы 5/2 с 8:30-17:30, пятница – сокращенный день до 16:15 (возможность гибкого начала рабочего дня, гибридный формат работы, с возможностью посещения офиса);

  • Забота о здоровье сотрудников:

    - Добровольное медицинское страхование (после 3 месяцев работы);

    - Скидки по ДМС для родственников сотрудника;

    - Скидки на стоматологию;

    - Полис для выезжающих за границу.

  • Материальные бонусы:

    - Годовая премия;

    - Дополнительные выплаты к первому отпуску;

    - Материальная помощь при рождении детей и к другим значимым событиям в жизни сотрудника;

    - Материальная помощь в сложных жизненных ситуациях.

  • Забота о развитии:

    - Внешнее обучение за счет работодателя;

    - Внутреннее обучение: СДО, тренинги;

    - Корпоративные мероприятия, подарки для детей;

    - Возможность посещать психолога;

    - Образовательные и развивающие мероприятия


Адрес: Россия, Москва, Дербеневская набережная, 7с9
Показать на большой карте

Поделиться:

Опубликована 21 день назад

Похожие вакансии

Группа Rubytech — лидирующий производитель программно-аппаратных комплексов и разработчик технологий для высоконагруженных ИТ-инфраструктур. Мы выпускаем собственную линейку ПАК Скала^р, а также строим и защищаем от киберугроз инфраструктуру, обеспеч...
  • Полный день
  • Опыт от 3 лет
Логотип компании RubytechRubytech
  • Москва
19 часов назад
Ищем Data Engineer в аналитический центр для построения DWH. ... Обязательно опыт работы в роли Data Engineer от 3-х лет, включая разработку и поддержку дата-платформ ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Recruitment Boutique S.M.ArtRecruitment Boutique S.M.Art
  • Москва
20 часов назад
Команда занимается распознаванием и геопозиционированием объектов дорожной инфраструктуры по видеозаписям. Мы выполняем 2D реконструкцию, геопривязку, векторизацию и классификацию объектов для создания точных карт. А также при помощи SLAM и SFM, мы с...
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
2 дня назад
В связи с активным развитием проектов в компании открыта вакансия Data Processing Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
20 часов назад
Сейчас находимся на стадии формирования большой команды переформатирования образования в стране на базе ИИ Обязанности разработка ETL-процессов построение витрин данных и доработка существующих витрин данных оптимизация запросов конфигурация и оптими...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
19 часов назад
Нужен Data Engineer, который сможет взять на себя часть непрофильной для аналитиков работы по автоматизации ...
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.