NLP Engineer (Reinforcement Learning)
По договоренности
GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.
Направления:
- улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов
- развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей
- улучшение продукта Deep Research.
На эти роли мы ищем NLP инженера со знанием и опытом в Reinforcement Learning. Для всех экспериментов у нас есть кластер с большим числом A/H 100'ых.
Задачи:
- улучшать качество работы GigaChat Reasoning на русском и английском языках
- ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг
- тестировать новые Loss-функции и подходы к обучению
- помогать выводить в прод всё, что мы обучим
- постоянно держаться up-to-date со свежими статьями.
Для нас важно:
- опыт в online RL и хорошие теоретические знания
- уверенное владение Python, PyTorch
- знание базовых алгоритмов и математики
- знания в DL, опыт обучения простых и больших моделей
- опыт обучения моделей для продакшена
- понимание текущего состояния эволюции больших LLM'ов.
Будет плюсом:
- наличие публикаций.
Мы предлагаем:
- крупнейшее DS&AI community — более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность выбрать удобный формат работы: гибрид, офис, удаленно по РФ
- комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Адрес: Россия, Москва, Кутузовский проспект, 32к1
Опубликована 21 день назад
Похожие вакансии
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
20 часов назад
Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных ... компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках Data Engineer ... Необходимые навыки и опыт: 3+ лет опыта работы Data Engineer; Уверенный опыт работы с аналитическими ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... Отличное знание Python, опыт командной разработки. 3+ года опыта разработки или внедрения решений (ML Engineer ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных ... , основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках QA Automation Engineer ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
QA Engineer (API / Playwright / TypeScript) Приветствую, меня зовут Марина, я являюсь HR компании "Амбрелла ... продуктовой команде с активным использованием автотестирования Условия: - Работа в аккредитованной IT-компании ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
300 000 - 315 000 ₽
Выше средней на 53%
Мы команда SNAP IT - представители самой технологичной и стремительно эволюционирующей индустрии IT, ... входим в ГК Технос, которая работает на рынке IT с 1991 года. ... Мы с удовольствием рассмотрим твою кандидатуру, если ты имеешь: - опыт работы в роли Data Engineer от ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад