ML engineer LLM GigaChat

По договоренности


Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних клиентов, потом для всей России.

Направления

Улучшение SFT / DPO: тестирование новый подходов к обучению, ускорение пайплайнов, генерация новых данных, дистиляция знаний из больших LLM в маленькие.

Развитие метрик качества GigaChat-а, например, через оценку способности решать задачи олимпиад международного уровня. Развитие внутреннего LLM-AS-A-JUDGE

Разработка сервиса Lora обучения GigaChat и GigaEmbeder. Повышение стабильности и воспроизводимости запусков, создание пайплайнов валидации и генерации данных с помощью ЛЛМ.

На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • распределенное обучение моделей на этапах SFT/DPO, дистилляция моделей
  • проведение research в области SFT/DPO для улучшения качества обучения и ускорения процесса
  • помощь в автоматизации end-to-end процессов обучения моделей и замера их качества
  • активные взаимодействия с командой online-rl для улучшения метрик cold-start reasoning
  • анализ обучающих датасетов, выявление взаимосвязей и влияния данных на итоговые метрики.

Требования

  • высшее образование в топ вузе России или зарубежья
  • уверенные знания алгоритмов и структур данных
  • опыт обучения LLM (SFT, DPO)
  • опыт настройки локального инференса (SGLang, vLLM, TRTLLM)
  • понимание того, как устроен Python под капотом
  • умение анализировать научные статьи, воспроизводить их
  • опыт работы с распределенными системами (Ray, Dask, OpenMPI)
  • уверенные знания и опыт работы с Linux, Bash
  • уверенные знания PyTorch

Условия

  • комфортный современный офис - м. Кутузовская
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.

Поделиться:

Опубликована 7 часов назад

Похожие вакансии

от 150 000 ₽
Почему мы ищем Prompt Engineer Мы ищем инженера с опытом от 2–3 лет в prompt engineering или AI-инженерии ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Мыздриков Андрей АндреевичМыздриков Андрей Андреевич
  • Новосибирск
7 дней назад
Korona – онлайн-сервис денежных переводов и займов. Благодаря нашему приложению миллионы пользователей в десятках стран быстро, удобно и безопасно решают свои регулярные финансовые задачи, не выходя из дома. Приглашаем в команду инженера -тестировщик...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании KoronatechKoronatech
  • Новосибирск
8 дней назад
Мы-резиденты «Сколково» и аккредитованная IT-компания. ... Что предлагаем: Официальное трудоустройство в аккредитованную IT-компанию с оплачиваемыми больничными ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Prooftech ITProoftech IT
  • Новосибирск
день назад
Swarmica — B2B платформа для продуктовой технической поддержки (хелпдеск, управление знаниями по методологии KCS, аналитика качества, AI-подходы). Клиенты — вендоры ПО и продуктовые компании, где техническая поддержка является критически важной функц...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании SwarmicaSwarmica
  • Новосибирск
9 дней назад
100 000 - 220 000 ₽
Рыночная зарплата
DataWorks – разрабатываем компоненты на JavaScript и .NET для разработчиков, дизайнеров и архитекторов, включая отчеты, электронные таблицы, API документов и элементы управления. Стек технологий и фреймворки: C#, .NET, WinForms, WPF, Aspnet, Blazor, ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании DataWorksDataWorks
  • Новосибирск
24 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.