NLP Engineer (Reinforcement Learning)

По договоренности

  • Спортивная
  • Киевская
  • Парк Победы

GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.

Направления:

  • улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов
  • развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей
  • улучшение продукта Deep Research.

На эти роли мы ищем NLP инженера со знанием и опытом в Reinforcement Learning. Для всех экспериментов у нас есть кластер с большим числом A/H 100'ых.

Задачи:

  • улучшать качество работы GigaChat Reasoning на русском и английском языках
  • ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг
  • тестировать новые Loss-функции и подходы к обучению
  • помогать выводить в прод всё, что мы обучим
  • постоянно держаться up-to-date со свежими статьями.

Для нас важно:

  • опыт в online RL и хорошие теоретические знания
  • уверенное владение Python, PyTorch
  • знание базовых алгоритмов и математики
  • знания в DL, опыт обучения простых и больших моделей
  • опыт обучения моделей для продакшена
  • понимание текущего состояния эволюции больших LLM'ов.

Будет плюсом:

  • наличие публикаций.

Мы предлагаем:

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность выбрать удобный формат работы: гибрид, офис, удаленно по РФ
  • комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Адрес: Россия, Москва, Кутузовский проспект, 32к1
Показать на большой карте

Поделиться:

Опубликована 10 часов назад

Похожие вакансии

до 80 000 ₽
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия QA ENGINEER.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
день назад
до 300 000 ₽
Выше средней на 50%
Centicore аккредитованная в РФ IT-компания, за это время мы успешно завершили для наших заказчиков более ... Мы внедряем современные IT решения и помогаем компаниям улучшаться. ... Мы ищем опытного QA Automation Engineer с опытом автоматизации на C#, который будет заниматься автоматизацией ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании CenticoreCenticore
  • Москва
день назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Scientist / CV Engineer Готовность ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
8 дней назад
до 300 000 ₽
Выше средней на 50%
... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Senior Data scientist / CV Engineer ... Prometheus, Grafana в проектах, связанных с промышленным производством; Опыт Backend в DS команде / ML engineer ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
8 дней назад
Об IT в цифрах: 3 бизнес-направления; 23+ команд; 380+ IT специалистов (devops, manual/auto QA, web/mobile ... От тебя мы ожидаем: Опыт работы в роли QA Engineer от 3-х лет; Умеешь в тест-дизайн и применяешь теорию ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании СберЗдоровьеСберЗдоровье
  • Москва
3 дня назад
ООО «Софт Бизнес Системы» — это динамично развивающаяся IT-компания, занимающаяся разработкой и внедрением ... Для этого мы ищем опытного AQA Engineer, который поможет нам автоматизировать тестирование и повысить ... Опыт работы: от 3 лет опыта работы в качестве AQA Engineer или QA Engineer с фокусом на автоматизацию ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Софт Бизнес СистемыСофт Бизнес Системы
  • Москва
8 дней назад

Похожие вакансии

до 80 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
до 300 000 ₽
Логотип компании CenticoreCenticore
до 300 000 ₽
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.