NLP Engineer со знанием и опытом в Reinforcement Learning

По договоренности


Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.

Направления

Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов.

Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей.

Улучшение продукта Deep Research

На эти роли мы ищем талантливого NLP Engineer со знанием и опытом в Reinforcement Learning. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • Улучшать качество работы GigaChat Reasoning на русском и английском языках
  • Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг.
  • Тестировать новые Loss-функции и подходы к обучению
  • Помогать выводить в прод всё, что мы обучим.
  • Постоянно держаться up-to-date со свежими статьями.

Требования

  • Опыт в online RL и хорошие теоретические знания
  • Уверенное владение Python, PyTorch.
  • Знание базовых алгоритмов и математики.
  • Знания в DL, опыт обучения простых и больших моделей.
  • Опыт обучения моделей для продакшена.
  • Понимание текущего состояния эволюции больших LLM'ов.
  • Будет плюсом наличие публикаций.

Условия

Удалённо по России.

* Возможность оформления в IT-аккредитованную компанию

* Годовая премия по итогам работы до 6 окладов.

* Регулярный пересмотр зарплат.

* Корпоративный спортзал и зоны отдыха.

* Более 400 программ СберУниверситета для роста.

* Программа адаптации и помощь руководителя на старте.

* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.

* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.

* Ипотека для сотрудников по дисконтной программе.

* СберПрайм+ и скидки у партнёров.

* Бонус за рекомендации в команду.


Поделиться:

Опубликована 22 дня назад

Похожие вакансии

Мы расширяем команду и ищем опытного Специалист технической поддержки / IT Support Engineer (L1–L2) Что ...
  • Полный день
  • Опыт от 3 лет
Логотип компании red_mad_robotred_mad_robot
  • Москва
24 дня назад
до 240 000 ₽
Выше средней на 26%
... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer. ... НАШИ ОЖИДАНИЯ ОТ УСПЕШНОГО КАНДИДАТА: Опыт работы в роли data engineer ≈ 5 лет (Обязательно); Опыт работы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
3 дня назад
Johnson &Johnson is looking for a talented Reliability Engineer to join our Russia-based IT organization ... Reliability Engineer will be responsible for ensuring the reliability, availability, and performance ... Proven experience as a Reliability Engineer, Site Reliability Engineer, or similar role supporting enterprise-scale ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Johnson & JohnsonJohnson & Johnson
  • Москва
7 дней назад
Она образована в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной ... Wildberries и Russ — это лидер рынков e-commerce и наружной рекламы в России с современной IT-инфраструктурой ... Направление работы: Сейчас мы ищем опытного QA Engineer в нашу команду инфраструктурной разработки.
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
4 дня назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER в офис в Москве.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
4 дня назад
Мы являемся аккредитованной IT - компанией и создаем технологические решения для проектов государственного ... Сейчас мы в поиске Backend Engineer (GO), который сможет усилить нашу команду.
  • Полный день
  • Опыт от 3 лет
Логотип компании А7-ТЕХНОЛОГИИА7-ТЕХНОЛОГИИ
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.