Team Lead ML Engineer (Large-Scale Multimodal Dataset Pipelines)
По договоренности
Разрабатываем подходы к фильтрации, оцениваем состав больших датасетов и масштабируем пайплайны для обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.
Обязанности
- создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
- обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
- построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
- оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
- масштабирование пайплайнов на распределенных кластерах
- опыт руководства (3-4 человека в подчинении).
Требования
- экспертиза в построении data pipelines (Python, SQL)
- опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
- уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
- опыт работы с распределенными вычислениями и облачными хранилищами (S3, GCS)
- знание практик data versioning (DVC) и управления метаданными
- опыт с синтетической генерацией данных, active learning.
Условия
- самое крупное DS&AI сообщество — более 600 специалистов банка
- дайджест о последних разработках в области DS&AI и отчёты с крупных мировых конференций
- гибридный или офисный формат работы
- современный офис у метро Кутузовская
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- специальные условия ипотеки под ставку до 7%
- бесплатная подписка СберПрайм+ и скидки на товары партнёров
- вознаграждение за рекомендации друзей.
Опубликована 9 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Наш продукт — это интеллектуальное ядро ИИ-помощника Сбера, работающее на основе больших языковых моделей (LLM). Мы отказались от классической сценарной логики в пользу технологий, позволяющих ассистенту понимать контекст, изучать поведение пользоват...
- Полный день
- Опыт от 5 лет
- Москва
2 дня назад
до 270 000 ₽
В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ Team Lead Java СТРОГО С ВЫСШЕМ ОБРАЗОВАНИЕМ ...
- Полный день
- Опыт от 5 лет
- Москва
день назад
... науки, прикладная математика, ИТ) • Опыт от 7 лет в коммерческой разработке, из них 2+ года в роли Team ... Lead • Глубокие знания: JavaScript/TypeScript, React/Angular, Node.js/.NET Core, PostgreSQL/MSSQL • ...
- Полный день
- Опыт от 5 лет
- Москва
3 дня назад
Мы строим цифровую платформу, которая объединит данные всей России. На её основе будут приниматься государственные стратегии, бизнес-решения, а граждане получат доступ к прозрачной статистике. Это основа для будущего экономики страны. Масштаб, которы...
- Полный день
- Опыт от 5 лет
- Москва
день назад
В связи с расширением, в команду сервиса требуется Руководителя группы ios команды в Okko Спорт! Чем предстоит заниматься: Руководить продуктовой командой ios разработчиков; Принимать участие в сложных технических задачах; Предлагать и разрабатывать ...
- Полный день
- Опыт от 5 лет
- Москва
день назад
Про функцию: Мы ищем QA Lead для руководства командой из 10+ человек.
- Полный день
- Опыт от 5 лет
- Москва
9 часов назад
Вакансия в подборках
Похожие вакансии
до 270 000 ₽