Data Engineer Инженер данных

По договоренности

  • Марксистская
  • Третьяковская
  • Новокузнецкая

Обязанности:

  • Проектирование и разработка ETL/ELT-паплайнов для обработки структурированных и неструктурированных данных (тексты, изображения, видео);
  • Организация и поддержка хранилища данных, включая объективные, реляционные и распределенные системы;
  • Внедрение и сопровождение Future Store для централизованного хранения и подачи признаков в модели;
  • Автоматизация процессов резервного копирования и мониторинга ETL-процессов (Prometheus, Grafana);
  • Обеспечение версионирования датасетов (DVC) и моделей (MLFlow) в рамках MLOps-практик;
  • Разработка дашбордов для контроля качества данных и состояния паплайнов;
  • Участие в построении CI/CD для дата-паплайнов и моделей машинного обучения;
  • Изучение и интеграция перспективных технологий, включая векторные базы данных и инструменты распределенных вычислений.

Требования:

  • Высшее образование (математика, компьютерные науки, физика, инженерия и смежные области);
  • Опыт работы от 3 лет в аналогичной должности;
  • Продвинутое владение языком Python: написание скриптов для обработки данных, работа с большим объемом информации. Практический опыт построения паплайнов с использованием ETL/ELT подходов;
  • Уверенное владение инструментальным стеком: PySpark - обработка распределенных данных, AirFlow - оркестрация рабочих процессов, ClickHouse - аналитические и распределенные СУБД; MLFlow - управление экспериментами и версионирование моделей; DVC - версионирование данных;
  • Опыт работы с различными типами хранилищ: Объектные хранилища (S3, Minio и аналоги), Реляционные БД, Распределенные системы хранения;
  • Понимание архитектуры Feture Store и опыт его внедрения или интеграции;
  • Навыки обработки изображений и видео с использованием OpenCV;
  • Знание основ контейнеризации (Docker) и общее понимание принципов работы Kubernetes;
  • Осведомленность о своевременных подходах к хранению векторных данных, готовность к изучению и внедрению в текущую инфраструктуру;
  • Владения языками Rust или Go;
  • Опыт участия в проектах машинного обучения;
  • Опыт внедрения CI/CD для паплайнов обработки данных и ML-моделей.
Условия:
  • Оформление по ТК РФ, 100% белая заработная плата;

  • График работы 5/2 с 8:30-17:30, пятница – сокращенный день до 16:15 (возможность гибкого начала рабочего дня, гибридный формат работы, с возможностью посещения офиса);

  • Забота о здоровье сотрудников:

    - Добровольное медицинское страхование (после 3 месяцев работы);

    - Скидки по ДМС для родственников сотрудника;

    - Скидки на стоматологию;

    - Полис для выезжающих за границу.

  • Материальные бонусы:

    - Годовая премия;

    - Дополнительные выплаты к первому отпуску;

    - Материальная помощь при рождении детей и к другим значимым событиям в жизни сотрудника;

    - Материальная помощь в сложных жизненных ситуациях.

  • Забота о развитии:

    - Внешнее обучение за счет работодателя;

    - Внутреннее обучение: СДО, тренинги;

    - Корпоративные мероприятия, подарки для детей;

    - Возможность посещать психолога;

    - Образовательные и развивающие мероприятия


Адрес: Россия, Москва, Дербеневская набережная, 7с9
Показать на большой карте

Поделиться:

Опубликована 10 часов назад

Похожие вакансии

Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
10 часов назад
Мы – команда разработки DATA решений для Программы Лояльности СберСпасибо. ... В роли Data Engineer Вы получите опыт работы с настоящими большими данными, современным технологическим ... Engineer или ETL Developer Отличное знание SQL и современных реляционных/MPP СУБД (на выбор PostgreSQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СберСпасибоСберСпасибо
  • Москва
10 часов назад
до 250 000 ₽
Выше средней на 8%
В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ : Data Engineer. ... тестирование и внедрение ETL/ELT процессов; Работа с большими объемами данных; Создание и поддержка data ... pipelines и хранилищ; Взаимодействие с аналитиками и data scientist’ами; Оптимизация производительности ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
день назад
Проекты: Data Engineer (Инженер данных) с уклоном в разработку инструментов для повышения эффективности ... Обязательно: 2+ года опыта в роли Data Engineer или в проектах, связанных с построением и поддержкой ... Хранение Данных: Понимание различий и применение: Data Warehouses, Data Lakes, NoSQL (знание принципов ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Bell IntegratorBell Integrator
  • Москва
день назад
до 450 000 ₽
Выше средней на 95%
Обязанности 60% data engineer, 25% developer, 15% ML писать пайплайны обработки аудио/видео данных подготовка ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.