ML engineer LLM GigaChat

По договоренности


Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних клиентов, потом для всей России.

Направления

Улучшение SFT / DPO: тестирование новый подходов к обучению, ускорение пайплайнов, генерация новых данных, дистиляция знаний из больших LLM в маленькие.

Развитие метрик качества GigaChat-а, например, через оценку способности решать задачи олимпиад международного уровня. Развитие внутреннего LLM-AS-A-JUDGE

Разработка сервиса Lora обучения GigaChat и GigaEmbeder. Повышение стабильности и воспроизводимости запусков, создание пайплайнов валидации и генерации данных с помощью ЛЛМ.

На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • распределенное обучение моделей на этапах SFT/DPO, дистиляция моделей
  • проведение research в области SFT/DPO для улучшения качества обучения и ускорения процесса
  • помощь в автоматизации end-to-end процессов обучения моделей и замера их качества
  • активные взаимодействия с командой online-rl для улучшения метрик cold-start reasoning
  • анализ обучающих датасетов, выявление взаимосвязей и влияния данных на итоговые метрики.

Требования

  • высшее образование в топ вузе России или зарубежья
  • уверенные знания алгоритмов и структур данных
  • опыт обучения LLM (SFT, DPO)
  • опыт настройки локального инференса (SGLang, vLLM, TRTLLM)
  • понимание того, как устроен Python под капотом
  • умение анализировать научные статьи, воспроизводить их
  • опыт работы с распределенными системами (Ray, Dask, OpenMPI)
  • уверенные знания и опыт работы с Linux, Bash
  • уверенные знания PyTorch

Условия

  • комфортный современный офис - м. Кутузовская
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.

Поделиться:

Опубликована 5 часов назад

Похожие вакансии

до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. ... division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer ... This role is ideal for someone who thrives in resolving complex IT infrastructure issues, enjoys working ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Санкт-Петербург
11 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли QA Automation Engineer (Java) и работать над проектом заказчика. ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Санкт-Петербург
день назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли MLOps Engineer и работать над проектом заказчика. ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Санкт-Петербург
9 дней назад
... 250+ профессионалов, которые сегодня создают то, что казалось невозможным вчера Сейчас мы в поиске QA Engineer ... — компания входит в реестр аккредитованных IT-организаций; Ежегодный выбор бенефита: компенсация ДМС ... клуб, английский язык, Just Talks и другие форматы для вашего развития; Возможности группы i-Free: 16 IT-компаний ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Just AIJust AI
  • Санкт-Петербург
8 дней назад
200 000 - 260 000 ₽
Выше средней на 29%
LLMOps / ML Platform Engineer (Self-Hosted LLM) О компании Мы —продуктовая IT-команда, разрабатывающая ... В связи с развитием продукта ищем LLMOps / ML Platform Engineer, который разработает нам сервисы для ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Юкитех ЛабЮкитех Лаб
  • Санкт-Петербург
17 дней назад
... 🌍 We’re Hiring: Data Analyst 📍 Location: Remote 💡 About Us Yesim is an international IT company that ... strong brand and long-term partnerships worldwide. ✨ About the Role We are looking for a Analytics / BI Engineer ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Genesis Group AGGenesis Group AG
  • Санкт-Петербург
14 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.