Machine Learning Engineer в команду SDT Pretrain

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

О команде и задаче:
Мы создаем технологии беспилотного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а построить «фабрику» по автоматической разметке сложных дорожных ситуаций (Scenario Mining) с использованием современных подходов (LLM, VLM, CV) и масштабировать это решение на весь наш архив данных.

Чем предстоит заниматься:

  • Разработка методов авторазметки: создание новых и адаптация существующих моделей (в т.ч. VLM и LLM) для семантического поиска событий в проездах (например, «найти все нерегулируемые левые повороты с пешеходами»);
  • Пайплайны обработки данных: оборачивание ML-моделей в воспроизводимые пайплайны для массовой обработки исторических и новых данных;
  • Работа с данными: организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.

Что мы ждем от кандидата:

Отличное знание Python, PyTorch, понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги). Нам нужно, чтобы модель «понимала» сцену Fine-tuning;

База по Computer Vision (детектирование, сегментация, трекинг объектов).

MLOps & Engineering (Важно):

  • опыт работы с объектными хранилищами (S3);
  • умение писать эффективный код, который не кладет сеть и сторадж при массовом чтении);
  • работа с данными, опыт обработки больших объёмов данных (pandas, numpy, SQL или аналоги);
  • умение строить ETL/ELT пайплайны;
  • умение работать с SQL, Docker

4. Инструментарий:

  • опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
  • JupyterHub как среда для прототипирования.

Будет плюсом++

  • Опыт в Autonomous Driving: понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
  • Data Engineering: опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для записи и поиска данных, с оркестраторами - Dagster.

Адрес: Россия, Москва, проспект Андропова, 10А
Показать на большой карте

Поделиться:

Опубликована 25 дней назад

Похожие вакансии

... и исследованиями в области искусственного интеллекта, нейронных сетей и машинного обучения в поиске Machine ... Learning Engineer.
  • Полный день
  • Опыт от 5 лет
Логотип компании ЭДСЭДС
  • Москва
4 дня назад
ML Platform (MOps) engineer будет заниматься разработкой и эксплуатацией DSML (Data Sciene and Machine ... Learning) платформы. ... Learning и Artificial Intelligence начиная с проектирования уровня hardware Готовы как брать на себя ...
  • Полный день
  • Опыт от 5 лет
Логотип компании РУСАЛРУСАЛ
  • Москва
6 дней назад
300 000 - 400 000 ₽
Выше средней на 16%
Аккредитованная компания “АЦТС”, являющаяся дочерней IT структурой «Про.Потолок», приглашает в команду опытного DevOps-инженера для участия в масштабных и технологически сложных проектах в сфере цифровизации строительства. Обязанности: Обеспечение бе...
  • Полный день
  • Опыт от 5 лет
Логотип компании Про.ПотолокПро.Потолок
  • Москва
14 часов назад
О команде: Планирование движения автономного автомобиля и предсказание движения всех участников вокруг него - это сложная и крайне важная задача, учитывающая множество факторов. Качественно планируя и предугадывая будущее такой автомобиль сможет обес...
  • Полный день
  • Опыт от 5 лет
Логотип компании NavioNavio
  • Москва
25 дней назад
... другие) для оптимизации вычислительных графов совместная работа с командами CUDA operators и Distributed Learning ...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.