Team Lead ML Engineer (Large-Scale Multimodal Dataset Pipelines)

По договоренности


Разрабатываем подходы к фильтрации, оцениваем состав больших датасетов и масштабируем пайплайны для обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.

Обязанности

  • создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
  • обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
  • построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
  • оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
  • масштабирование пайплайнов на распределенных кластерах
  • опыт руководства (3-4 человека в подчинении).

Требования

  • экспертиза в построении data pipelines (Python, SQL)
  • опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
  • уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
  • опыт работы с распределенными вычислениями и облачными хранилищами (S3, GCS)
  • знание практик data versioning (DVC) и управления метаданными
  • опыт с синтетической генерацией данных, active learning.

Условия

  • самое крупное DS&AI сообщество — более 600 специалистов банка
  • дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
  • гибридный или офисный формат работы
  • современный офис у метро Кутузовская
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • специальные условия ипотеки под ставку до 7%
  • бесплатная подписка СберПрайм+ и скидки на товары партнёров
  • вознаграждение за рекомендации друзей.

Поделиться:

Опубликована 9 часов назад

Похожие вакансии

Наш продукт — это интеллектуальное ядро ИИ-помощника Сбера, работающее на основе больших языковых моделей (LLM). Мы отказались от классической сценарной логики в пользу технологий, позволяющих ассистенту понимать контекст, изучать поведение пользоват...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
до 270 000 ₽
В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ Team Lead Java СТРОГО С ВЫСШЕМ ОБРАЗОВАНИЕМ ...
  • Полный день
  • Опыт от 5 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
день назад
... науки, прикладная математика, ИТ) • Опыт от 7 лет в коммерческой разработке, из них 2+ года в роли Team ... Lead • Глубокие знания: JavaScript/TypeScript, React/Angular, Node.js/.NET Core, PostgreSQL/MSSQL • ...
  • Полный день
  • Опыт от 5 лет
Логотип компании ВТБ Специализированный депозитарийВТБ Специализированный депозитарий
  • Москва
3 дня назад
Мы строим цифровую платформу, которая объединит данные всей России. На её основе будут приниматься государственные стратегии, бизнес-решения, а граждане получат доступ к прозрачной статистике. Это основа для будущего экономики страны. Масштаб, которы...
  • Полный день
  • Опыт от 5 лет
Логотип компании ФГБУ ГМЦ РОССТАТАФГБУ ГМЦ РОССТАТА
  • Москва
день назад
В связи с расширением, в команду сервиса требуется Руководителя группы ios команды в Okko Спорт! Чем предстоит заниматься: Руководить продуктовой командой ios разработчиков; Принимать участие в сложных технических задачах; Предлагать и разрабатывать ...
  • Полный день
  • Опыт от 5 лет
Логотип компании OkkoOkko
  • Москва
день назад
Про функцию: Мы ищем QA Lead для руководства командой из 10+ человек.
  • Полный день
  • Опыт от 5 лет
Логотип компании ВСК, САОВСК, САО
  • Москва
9 часов назад

Похожие вакансии

до 270 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
Логотип компании ВТБ Специализированный депозитарийВТБ Специализированный депозитарий
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.