Senior NLP Engineer со знанием и опытом в Reinforcement Learning

По договоренности


Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.

Направления

Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов.

Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей.

Улучшение продукта Deep Research

На эти роли мы ищем талантливого NLP Engineer со знанием и опытом в Reinforcement Learning. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • Улучшать качество работы GigaChat Reasoning на русском и английском языках
  • Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг.
  • Тестировать новые Loss-функции и подходы к обучению
  • Помогать выводить в прод всё, что мы обучим.
  • Постоянно держаться up-to-date со свежими статьями.

Требования

  • Опыт в online RL и хорошие теоретические знания
  • Уверенное владение Python, PyTorch.
  • Знание базовых алгоритмов и математики.
  • Знания в DL, опыт обучения простых и больших моделей.
  • Опыт обучения моделей для продакшена.
  • Понимание текущего состояния эволюции больших LLM'ов.
  • Будет плюсом наличие публикаций.

Условия

Удалённо по России.

* Возможность оформления в IT-аккредитованную компанию

* Годовая премия по итогам работы до 6 окладов.

* Регулярный пересмотр зарплат.

* Корпоративный спортзал и зоны отдыха.

* Более 400 программ СберУниверситета для роста.

* Программа адаптации и помощь руководителя на старте.

* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.

* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.

* Ипотека для сотрудников по дисконтной программе.

* СберПрайм+ и скидки у партнёров.

* Бонус за рекомендации в команду


Поделиться:

Опубликована 19 часов назад

Похожие вакансии

Managing the inventory for all local IT equipment. ... Act as an escalation to global or local IT issues to the BTS IT Director or global reporting line. ... Minimum 2 years in a supervisor IT support role and overall, 5+ years’ experience in IT.
  • Полный день
  • Опыт от 3 лет
Логотип компании AbbVieAbbVie
  • Москва
2 дня назад
Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
15 дней назад
Johnson &Johnson is looking for a talented Reliability Engineer to join our Russia-based IT organization ... Reliability Engineer will be responsible for ensuring the reliability, availability, and performance ... Proven experience as a Reliability Engineer, Site Reliability Engineer, or similar role supporting enterprise-scale ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Johnson & JohnsonJohnson & Johnson
  • Москва
20 часов назад
Мечтай о большем с Napoleon IT Мы — не просто IT-компания, а место, в котором искусственный интеллект ... Мы ищем QA Engineer, который отвечает за качество продукта, участвует в проработке требований, тестировании ... Компенсацию расходов на покупку профессиональной литературы; Доступ к курсам нашей объединенной IT-школы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Napoleon ITNapoleon IT
  • Москва
2 дня назад
Третье Мнение — разработчик IT-решений для системы здравоохранения. ... Data Science, Data Analyst и Development Будем рады видеть в новом коллеге следующее: Опыт работы Data Engineer ... ClickHouse Опыт работы с Trino, dbt Опыт работы с Apache Kafka Что мы предлагаем: Работу в аккредитованной IT ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Платформа Третье МнениеПлатформа Третье Мнение
  • Москва
19 часов назад
от 250 000 ₽
Выше средней на 35%
Мы ищем и находим тех самых людей в высокотехнологичных сферах: IT и приборостроение, а также био- и ... кого мы ищем Сейчас мы находимся в поиске специалиста на позицию Middle Computer Vision & Robotics Engineer ... в IT-компанию, которая занимается аналитикой и разработкой решений в области машинного обучения.
  • Полный день
  • Опыт от 3 лет
Логотип компании Рекрутинговое агентство The OneРекрутинговое агентство The One
  • Москва
20 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.