Senior Research Engineer (Multimodal Diffusion & RLHF)
По договоренности
Исследуем и внедряем передовые методы для инструктивного редактирования изображений/видео, интеграции аудио в видео-генерацию и повышения качества за счет RLHF (Reinforcement Learning from Human Feedback).
Обязанности
- разработка и обучение диффузионных моделей для инструктивного редактирования видео и изображений
- исследование архитектур для совместной генерации видео и синхронизированного аудио по текстовому промпту
- создание пайплайна RLHF для тонкой настройки моделей: обучение мультимодальных reward-моделей (видео/аудио/текст), интеграция алгоритмов RL (PPO, DPO, GRPO) в диффузионный пайплайн
- проектирование экспериментов, анализ результатов
- тесная коллаборация с Distributed Engineers для эффективной имплементации идей.
Требования
- сильный бэкграунд в CV, генеративных моделях (Diffusion, GANs), мультимодальном ML
- опыт работы с диффузионными моделями (Stable Diffusion/FLUX, Wan 2.X и пр.) и фреймворками (Diffusers)
- практические знания Reinforcement Learning, особенно RLHF
- уверенное владение PyTorch и навыки распределенного обучения (DDP/FSDP)
- способность быстро прототипировать и проводить исследования SOTA методов
- бонус: Опыт с аудио-генерацией (AudioLDM, MusicGen), публикации на NeurIPS/ICML/CVPR
- навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.
Условия
- ежегодный пересмотр зарплаты, годовую премию
- корпоративный спортзал и зоны отдыха
- уникальную систему обучения Сбера для профессионального развития
- расширенный ДМС и льготное страхование для семьи
- бесплатную подписку СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративную пенсионную программу.
Опубликована 21 день назад
Похожие вакансии
... исследованиях Последние 2 года занимали ведущие роли в исследованиях на позиции Senior или Lead Marketing Researcher ... исследованиями Имеете опыт защиты и реализации стратегии маркетинговых исследований Работали в сфере IT ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
BI.ZONE создает IT-продукты для обеспечения кибербезопасности: от мобильных приложений до сложных платформ ... задач анализа и тестирования Желателен опыт работы в продуктовой ИБ-компании (вендор) в роли Security Researcher ... предлагаем: Защищенность Все гарантии официального оформления по ТК РФ и преимущества аккредитованной IT-компании ...
- Полный день
- Опыт от 3 лет
- Москва
16 дней назад
Приглашаем в команду R&D Security Researcher. ... Краснопресненская/Баррикадная; Мы аккредитованная IT компания.
- Полный день
- Опыт от 3 лет
- Москва
17 дней назад
... исследованиях Последние 2 года занимали ведущие роли в исследованиях на позиции Senior или Lead Marketing Researcher ... исследованиями Имеете опыт защиты и реализации стратегии маркетинговых исследований Работали в сфере IT ...
- Полный день
- Опыт от 3 лет
- Москва
месяц назад
Салют! Ищем исследователя в команду SberDevices SberDevices — компания полного цикла, которая создает умные устройства, виртуальных ассистентов, собственную операционную систему и приложения в ней, занимается развитием речевых технологий. Специфика ...
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
We are now looking for a sharp, skilled and motivated Quantitative Researcher / Systematic Trader to ...
- Полный день
- Опыт от 3 лет
- Москва
13 дней назад