Senior ML Engineer (Multimodal LLM; Video Understanding)

По договоренности


Мы core команда, которая отвечает за машинное обучение для понимания аудиоданных во всем Сбере. В прошлом году мы выложили в открытый доступ SOTA модель для распознавания речи на русском языке GigaAM (https://arxiv.org/abs/2506.01192), а этой весной первыми в России запустили нативное понимание звука в LLM: GigaChat Audio (https://habr.com/ru/companies/sberdevices/articles/904894/). Сейчас мы активно работаем над улучшением мультимодальных свойств GigaChat: рост качества на сложных контекстах из аудио и картинок; понимание видео не только по звуковому потоку, но и кадрам.

Обязанности

  • создание пайплайна генерации синтетических Audio+Vision+Text данных из внутренних и открытых моделей
  • создание бенчмарков: llm-as-a-judge, авто-метрики
  • проведение экспериментов по обучению LLM: тестирование данных и стадий обучения, методы смешивания модальностей

Требования

  • python: модульный код, ООП, concurrency, pep, тесты
  • понимание этапов обучения и современных архитектур LLM
  • понимание методов оценки качества ML-систем
  • глубокие теоретические знания в DL
  • опыт отладки/обучения в multi-gpu режиме

Будет плюсом

  • опыт в Computer Vision / Audio

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • возможность выбрать удобный график – офис/гибрид (офисы Москва / Санкт-Петербург)
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

Мы ищем Middle Data Engineer в команду «Данные СберНПФ». Проект включает работу с корпоративным хранилищем данных и реализацию стандарта МСФО 17. Чем предстоит заниматься: Настройка потоков данных для отчетности МСФО 17 Реверс-инжиниринг существующих...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРКОРУССБЕРКОРУС
  • Москва
2 дня назад
Компания АО «АСТ» аккредитована Минцифры РФ, как системный интегратор, предоставляем комплексные инновационные решения по обеспечению информационной безопасности, разработке ПО и внедрению интеллектуальных информационно-аналитических систем. Входим в...
  • Полный день
  • Опыт от 3 лет
Логотип компании АСТАСТ
  • Москва
час назад
Леста Игры разрабатывает игровые проекты в различных жанрах, смело экспериментирует с инструментами и технологиями. В офисах компании в Санкт-Петербурге, Минске, Москве и Ташкенте работает более 2000 талантливых профессионалов. Мы делаем игры, которы...
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
2 дня назад
BIG DATA МТС – место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС...
  • Полный день
  • Опыт от 3 лет
Логотип компании МТСМТС
  • Москва
6 дней назад
Компания «АЙ-ТЕКО» — ведущий российский системный интегратор и поставщик информационных технологий для корпоративных заказчиков. Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП-10 крупнейших IT-к...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
12 дней назад
до 220 000 ₽
Рыночная зарплата
КОМПАНИЯ «АЙ-ТЕКО» - ведущий российский системный интегратор и поставщик информационных технологий для корпоративных заказчиков. Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП-10 крупнейших IT-к...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
11 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.