Team Lead ML Engineer (Large-Scale Multimodal Dataset Pipelines)
По договоренности
Разрабатываем подходы к фильтрации, оцениваем состав больших датасетов и масштабируем пайплайны для обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.
Обязанности
- создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
- обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
- построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
- оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
- масштабирование пайплайнов на распределенных кластерах
- опыт руководства (3-4 человека в подчинении).
Требования
- экспертиза в построении data pipelines (Python, SQL)
- опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
- уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
- опыт работы с распределенными вычислениями и облачными хранилищами (S3, GCS)
- знание практик data versioning (DVC) и управления метаданными
- опыт с синтетической генерацией данных, active learning.
Условия
- самое крупное DS&AI сообщество — более 600 специалистов банка
- дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
- гибридный или офисный формат работы
- современный офис у метро Кутузовская
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- специальные условия ипотеки под ставку до 7%
- бесплатная подписка СберПрайм+ и скидки на товары партнёров
- вознаграждение за рекомендации друзей.
Опубликована 3 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Координация работы ИТ-специалистов в команде, контроль выполнения задач и сроков исполнения проектов; Участие в code-review, наставничество младших коллег; Разработка solution-архитектуры, участие в обсуждении вопросов разви...
- Полный день
- Опыт от 3 лет
- Москва
13 часов назад
Мы ищем Java-разработчика в Центр Корпоративных Решений для проекта крупнейшего банка страны. Наш блок занимается всеми видами дистанционного обслуживания юридических лиц. А команда состоит более чем из 150 IT-специалистов, создающих передовые технол...
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
О роли: Мы ищем опытного Team Lead Go, который возьмёт на себя ключевую роль в развитии высоконагруженного ...
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
Компания PBF GROUP c 2002 года специализируется на разработке ИТ-решений в сфере банковской безопасности, банкоматов, платёжных терминалов, включая разработку софта. В связи с разработкой новых продуктов и выходом на новые рынки мы в PBF очень быстро...
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Ищем Lead Product Analyst, который поможет нам найти точки роста страховых продуктов и улучшить процессы ...
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад