Senior Research Engineer (Multimodal Diffusion & RLHF)

По договоренности


Исследуем и внедряем передовые методы для инструктивного редактирования изображений/видео, интеграции аудио в видео-генерацию и повышения качества за счет RLHF (Reinforcement Learning from Human Feedback).

Обязанности

  • разработка и обучение диффузионных моделей для инструктивного редактирования видео и изображений
  • исследование архитектур для совместной генерации видео и синхронизированного аудио по текстовому промпту
  • создание пайплайна RLHF для тонкой настройки моделей: обучение мультимодальных reward-моделей (видео/аудио/текст), интеграция алгоритмов RL (PPO, DPO, GRPO) в диффузионный пайплайн
  • проектирование экспериментов, анализ результатов
  • тесная коллаборация с Distributed Engineers для эффективной имплементации идей.

Требования

  • сильный бэкграунд в CV, генеративных моделях (Diffusion, GANs), мультимодальном ML
  • опыт работы с диффузионными моделями (Stable Diffusion/FLUX, Wan 2.X и пр.) и фреймворками (Diffusers)
  • практические знания Reinforcement Learning, особенно RLHF
  • уверенное владение PyTorch и навыки распределенного обучения (DDP/FSDP)
  • способность быстро прототипировать и проводить исследования SOTA методов
  • бонус: Опыт с аудио-генерацией (AudioLDM, MusicGen), публикации на NeurIPS/ICML/CVPR
  • навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.

Условия

  • ежегодный пересмотр зарплаты, годовую премию
  • корпоративный спортзал и зоны отдыха
  • уникальную систему обучения Сбера для профессионального развития
  • расширенный ДМС и льготное страхование для семьи
  • бесплатную подписку СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративную пенсионную программу.

Поделиться:

Опубликована 7 часов назад

Похожие вакансии

... это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании ... Мы ищем Middle/Senior UX Researcher на разные направления нашего бизнеса. ... стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
11 дней назад
... исследованиях Последние 2 года занимали ведущие роли в исследованиях на позиции Senior или Lead Marketing Researcher ... исследованиями Имеете опыт защиты и реализации стратегии маркетинговых исследований Работали в сфере IT ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СалютДевайсыСалютДевайсы
  • Москва
16 дней назад
Приглашаем в команду R&D Security Researcher. ... Краснопресненская/Баррикадная; Мы аккредитованная IT компания.
  • Полный день
  • Опыт от 3 лет
Логотип компании АСТАСТ
  • Москва
месяц назад
PT SWARM — это команда из более чем 100 экспертов в offensive security, которые занимаются тестированием на проникновение (в том числе red teaming), анализом защищенности ПО (мобильных и веб-приложений, софта для финансовой отрасли), выполняют проект...
  • Полный день
  • Опыт от 3 лет
Логотип компании Positive TechnologiesPositive Technologies
  • Москва
7 часов назад
Наша команда в поисках UX-ресечера для исследований B2C продуктов по информационной безопасности. Вас ждет напряженная, но интересная работа в энергичных и при этом дружелюбных командах. Чем предстоит заниматься: Вести разные виды UX-исследований. Ча...
  • Полный день
  • Опыт от 3 лет
Логотип компании Лаборатория КасперскогоЛаборатория Касперского
  • Москва
4 дня назад
Мы создаем основу для безопасного и эффективного использования ИИ в Банке. Наша команда разрабатывает мультиагентную систему для автономного мониторинга всех ИИ-агентов Банка в промышленной эксплуатации. Это не просто дашборды и алерты — это интеллек...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
7 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.