Senior Deep Learning Engineer (Speech LLM)

По договоренности


О проекте: Мы ищем сильного Deep Learning инженера в команду, создающую ASR-системы нового поколения на пересечении технологий распознавания речи и audio-native LLM.

Один из наших главных вызовов сейчас — разработка Next Gen LLM-based ASR. Это инструктивная система, которая выходит далеко за рамки обычного speech-to-text: она будет поддерживать выдачу временных меток, диаризацию спикеров, тегирование звуковых событий и key word prompting. База для быстрого старта уже готова: у нас есть мощный Foundation Encoder (GigaAM) и сильная диалоговая модель (GigaChat Audio).

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • LLM-based & Next Gen ASR: обучение больших Audio-conditioned LLM. Расширение возможностей ASR за пределы простого транскрибирования: добавление инструктивности, временных меток, диаризации, тегов событий и key word prompting.
  • SFT & Online RL: проведение масштабных ML-экспериментов с Supervised Fine-Tuning и методами Online Reinforcement Learning для выравнивания модели и улучшения качества распознавания.
  • Ecosystem Impact & Multimodal: использование обученной LLM-based ASR для автоматической разметки и создания высококачественных датасетов. Эти данные пойдут на улучшение текущих ASR и TTS моделей, а также станут базой для multimodal audio-native pre-training.
  • Knowledge Distillation: дистилляция знаний из тяжелых LLM в быстрые и легкие модели (ASR, text normalization) для некоторых production сценариев.
  • Research & Engineering: анализ актуальных научных статей, быстрая проверка гипотез на практике и доведение успешных экспериментов до прода.

Требования

  • Уверенное владение Python и PyTorch: написание чистого модульного кода, ООП, типизация, тесты.
  • Distributed Training: уверенный практический опыт распределенного обучения больших моделей, понимание принципов работы под капотом (DDP, FSDP, Tensor Parallelism, Context Parallelism).
  • LLM Training: понимание современных пайплайнов обучения LLM (Pre-training, SFT, DPO, online RL) и архитектур (DeepSeek3.2, Qwen3.5)
  • Research mindset: умение читать статьи, быстро перекладывать исследовательские идеи в работающий код и грамотно ставить эксперименты.
  • Опыт работы с аудио и/или мультимодальными LLM будут большим плюсом

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...
  • Полный день
  • Опыт от 3 лет
Логотип компании 12 STOREEZ12 STOREEZ
  • Москва
день назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
день назад
Мечтай о большем с Napoleon IT Мы — не просто IT-компания, а место, в котором искусственный интеллект ... Мы ищем Data Engineer, который будет работать на внешних проектах наших клиентов (формат аутстаффинга ... технологий; Компенсацию расходов на покупку профессиональной литературы; Доступ к курсам нашей объединенной IT-школы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Napoleon ITNapoleon IT
  • Москва
день назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ФУНКЦИОНАЛЬНЫЕ ОБЯЗАННОСТИ ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
8 часов назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER в офис в Москве.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
8 часов назад
Мы в поиске Data Engineer для создания и поддержки витрин данных, использующихся для задач машинного ... страхование для семьи корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.