Team Lead ML Engineer (Large-Scale Multimodal Dataset Pipelines)

По договоренности


Разрабатываем подходы к фильтрации, оцениваем состав больших датасетов и масштабируем пайплайны для обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.

Обязанности

  • создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
  • обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
  • построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
  • оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
  • масштабирование пайплайнов на распределенных кластерах
  • опыт руководства (3-4 человека в подчинении).

Требования

  • экспертиза в построении data pipelines (Python, SQL)
  • опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
  • уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
  • опыт работы с распределенными вычислениями и облачными хранилищами (S3, GCS)
  • знание практик data versioning (DVC) и управления метаданными
  • опыт с синтетической генерацией данных, active learning.

Условия

  • самое крупное DS&AI сообщество — более 600 специалистов банка
  • дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
  • гибридный или офисный формат работы
  • современный офис у метро Кутузовская
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • специальные условия ипотеки под ставку до 7%
  • бесплатная подписка СберПрайм+ и скидки на товары партнёров
  • вознаграждение за рекомендации друзей.

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Координация работы ИТ-специалистов в команде, контроль выполнения задач и сроков исполнения проектов; Участие в code-review, наставничество младших коллег; Разработка solution-архитектуры, участие в обсуждении вопросов разви...
  • Полный день
  • Опыт от 3 лет
Логотип компании Центр Новых Финансовых СервисовЦентр Новых Финансовых Сервисов
  • Москва
13 часов назад
Мы ищем Java-разработчика в Центр Корпоративных Решений для проекта крупнейшего банка страны. Наш блок занимается всеми видами дистанционного обслуживания юридических лиц. А команда состоит более чем из 150 IT-специалистов, создающих передовые технол...
  • Полный день
  • Опыт от 3 лет
Логотип компании Лига Цифровой ЭкономикиЛига Цифровой Экономики
  • Москва
4 дня назад
О роли: Мы ищем опытного Team Lead Go, который возьмёт на себя ключевую роль в развитии высоконагруженного ...
  • Полный день
  • Опыт от 3 лет
Логотип компании РЕДСМСРЕДСМС
  • Москва
8 дней назад
Компания PBF GROUP c 2002 года специализируется на разработке ИТ-решений в сфере банковской безопасности, банкоматов, платёжных терминалов, включая разработку софта. В связи с разработкой новых продуктов и выходом на новые рынки мы в PBF очень быстро...
  • Полный день
  • Опыт от 3 лет
Логотип компании PBF groupPBF group
  • Москва
4 дня назад
Ищем Lead Product Analyst, который поможет нам найти точки роста страховых продуктов и улучшить процессы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИнгосстрахИнгосстрах
  • Москва
8 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.