Team Lead ML Engineer (Large-Scale Multimodal Dataset Pipelines)

По договоренности


Разрабатываем подходы к фильтрации, оцениваем состав больших датасетов и масштабируем пайплайны для обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.

Обязанности

  • создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
  • обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
  • построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
  • оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
  • масштабирование пайплайнов на распределенных кластерах
  • опыт руководства (3-4 человека в подчинении).

Требования

  • экспертиза в построении data pipelines (Python, SQL)
  • опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
  • уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
  • опыт работы с распределенными вычислениями и облачными хранилищами (S3, GCS)
  • знание практик data versioning (DVC) и управления метаданными
  • опыт с синтетической генерацией данных, active learning.

Условия

  • самое крупное DS&AI сообщество — более 600 специалистов банка
  • дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
  • гибридный или офисный формат работы
  • современный офис у метро Кутузовская
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • специальные условия ипотеки под ставку до 7%
  • бесплатная подписка СберПрайм+ и скидки на товары партнёров
  • вознаграждение за рекомендации друзей.

Поделиться:

Опубликована 23 дня назад

Похожие вакансии

Что мы делаем: Рекламную платформу на передовом стеке технологий с высокими требованиями по нагрузке (100K+ RPS) и доступности (99,99%). Сама команда занимается платформизацией и развитием возможностей рекламной платформы: конфигурация управления рек...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
3 дня назад
Мы - команда продукта “Интеллектуальный цифровой сотрудник”. Мы занимаемся разработкой и внедрением мультиагентных AI-систем с применением LLM GigaChat, направленных на автономизацию и агентизацию процессов бэк-офиса Банка. Первый этап отбора на эту ...
  • Полный день
  • Опыт от 5 лет
Логотип компании СБЕРСБЕР
  • Москва
5 дней назад
Обязанности: Организация и ведение операционной деятельности команды: дейли-митинги, спринт-планирования, ретроспективы, проведение демо для заказчика; Управление командами разработки ИИ проектов: ML-инженеры, data scientists, backend-разработчики, в...
  • Полный день
  • Опыт от 5 лет
Логотип компании ИК СИБИНТЕКИК СИБИНТЕК
  • Москва
4 дня назад
до 800 000 ₽
Выше средней на 100%
Привет! Мы — продуктовая ИТ-компания, которая входит в топ-250 финтех-проектов России. Наш проект — это Telegram-приложение, которое позволяет моментально выпускать виртуальные карты для оплаты зарубежных сервисов и покупок за границей. Подходит для ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Плати по мируПлати по миру
  • Москва
3 дня назад
AI-First Manifest: Мы ценим время и эффективность. Это описание на 80% спроектировано ИИ на базе реального брифинга нашего CEO. Мы не тратим часы на копирайтинг там, где нейросеть справляется за секунды, потому что верим: всё, что может быть автомати...
  • Полный день
  • Опыт от 5 лет
Логотип компании SibedgeSibedge
  • Москва
6 дней назад
до 350 000 ₽
АО " НПФ ГАЗФОНД пенсионные накопления" обновляется технологически. Наша цель - стать самым удобным фондом для наших клиентов. Нам уже доверили свои сбережения более 6 миллионов россиян. Мы ищем Руководителя команды разработки для работы с продуктами...
  • Полный день
  • Опыт от 5 лет
Логотип компании НПФ Газфонд пенсионные накопленияНПФ Газфонд пенсионные накопления
  • Москва
10 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.