Senior Research Engineer, LLM Pretraining

По договоренности

Москва

Мы занимаемся pretrain'ом больших языковых моделей в GigaChat: проектируем архитектуру, подбираем рецепт обучения и поддерживаем весь инженерный контур вокруг него.

Недавно мы обучили MoE-модель на 700 миллиардов параметров — и на этом не собираемся останавливаться. Обучение идёт на кластерах H100 и B200. GigaChat — самый быстрорастущий проект Сбера, и pretrain — его ядро.

Чем занимается команда:

- архитектура и законы масштабирования;

- рецепт обучения: оптимизатор, расписание lr, нормализации, точность вычислений;

- устойчивость больших прогонов и ускорение сходимости;

- диагностика обучения, оценка изменений с опорой на математический аппарат;

- инженерный контур: воспроизводимость, тесты, CI/CD.

Роль с акцентом на модель, оптимизацию и инфраструктуру обучения, а не на данные. Главное — делать обучение быстрее, надёжнее и предсказуемее.

Какие задачи стоят перед командой

На этой роли важно не просто запускать эксперименты, а улучшать сам процесс обучения.

Ускорить цикл «идея → эксперимент → вывод → внедрение».

Меньше ручных прогонов, меньше неочевидных сбоев, больше воспроизводимости и понятных выводов.

Повысить надёжность больших прогонов.

Раньше ловить деградации и отличать реальные улучшения от ложных сигналов: расхождение, NaN'ы, коллапс энтропии, артефакты маршрутизации, обманчивое снижение функции потерь.

Сделать крупные архитектурные изменения безопасными при масштабировании.

В первую очередь это касается смеси экспертов и маршрутизации: нужно понимать, как они влияют на качество, стабильность и скорость, и какие метрики должны это отражать.

Почему мы:

Масштаб. 700B MoE уже обучена, дальше — больше. Кластеры на H100 и B200.
Публикации. Можно и нужно писать статьи по результатам своей работы — это не ограничивается.
Команда. В России нет другой команды, которая занимается pretrain'ом на таком масштабе. Коллеги — люди, которые глубоко разбираются в теме.
Влияние. Вы берёте направление целиком. Это не «выполнять задачи из бэклога», а самостоятельно определять, что важно, и доводить до результата.

Обязанности

Чем предстоит заниматься

Взять на себя целое направление внутри pretrain'а и развивать его: от постановки задач и планирования экспериментов до внедрения результатов в основное обучение.
Проектировать и проводить эксперименты: формулировать гипотезы, запускать абляции, сравнивать подходы, разбираться в результатах и превращать выводы в решения для основного обучения.
Разбираться с нестабильностью на больших прогонах: искать причины деградаций, строить диагностические метрики, предлагать изменения в оптимизаторе, расписании lr, нормализациях, инициализации, клиппинге, точности вычислений и маршрутизации.
Работать с архитектурой смеси экспертов (MoE): маршрутизатор, балансировка нагрузки, переполнение, артефакты маршрутизации, влияние на качество и производительность.
Поддерживать большие прогоны и продолжения обучения с чекпоинтов: следить за дрейфом, проверять изменения в коде и конфигурации, снижать риск регрессий.
Улучшать инженерное качество контура обучения: ревью критичных изменений, стратегия тестирования, воспроизводимость экспериментов, профилирование и устранение узких мест.

Требования

Глубокое понимание устройства обучения нейросетей: не на уровне обзоров и пересказов, а на уровне, где вы можете объяснить, почему конкретный прогон расходится, глядя на кривые функции потерь, нормы градиентов и энтропии.
Способность самостоятельно взять направление и довести его до результата: от чтения статей и постановки гипотез до внедрения в основной трейн.
Практический опыт с PyTorch и именно с обучением моделей, а не только с инференсом.
Умение доводить исследовательские идеи до надёжного инженерного решения: воспроизводимость, конфиги, тесты, автоматизация, понятные критерии качества.
Хорошую инженерную культуру: аккуратные PR, профилирование, внимание к качеству кода, понятные отчёты об экспериментах.

Будет плюсом

Опыт со смешанной точностью и распределённым обучением.
Опыт построения систем оценки моделей или инфраструктуры для экспериментов.

Условия

Удалённо
Возможность оформления в аккредитованную IT-компанию.
Годовая премия по итогам работы до 6 окладов.
Регулярный пересмотр зарплат.
Корпоративный спортзал и зоны отдыха.
Более 400 программ СберУниверситета для роста.
Программа адаптации и помощь руководителя на старте.
Крупнейшее DS&AI community — более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.
Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.
Ипотека для сотрудников по дисконтной программе.
СберПрайм+ и скидки у партнёров.
Бонус за рекомендации в команду.

⚡ Откликнуться на hh.ru

Опубликована 2 дня назад

Product manager в TravelTech

Мы — аккредитованная IT-компания и быстро растем. ... У нас хорошо выстроен процесс discovery, есть UX researcher. ... неделю можно из дома) с возможностью периодически работать удаленно Официальное оформление и льготы IT-компаний ...

Можно удаленно
Полный день
Опыт от 3 лет

Sputnik8

Москва

5 дней назад

⚡ Откликнуться на hh.ru

Senior Quant Researcher / Portfolio Manager

А еще нам нужен сильный Quant Researcher / Portfolio Manager в команду. ... Суммарный опыт более 3 лет со стратегиями на крипторынках или в акциях в роли quantitative researcher ...

Можно удаленно
Полный день
Опыт от 3 лет

Heads and Hearts

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Quantitative Researcher (FinTech / Financial Markets)

В нашу исследовательскую команду мы ищем Quantitative Researcher с опытом в финансовых рынках и финтех-среде ...

Можно удаленно
Полный день
Опыт от 3 лет

ADF Capital

Москва

6 дней назад

⚡ Откликнуться на hh.ru

Менеджер проектов (IT)

Что для нас важно: Опыт управления IT-проектами от 3 лет (преимущественно заказная разработка); Опыт ...

Можно удаленно
Полный день
Опыт от 3 лет

Инконсалт

Москва

день назад

⚡ Откликнуться на hh.ru

Ведущий Юрист (IT)

Мы обеспечиваем безопасность IT-инфраструктуры любого масштаба и сложности: от веб-сайтов и мобильных ... коммуникации Консультирование Наши ожидания от кандидата: Высшее юридическое образование Опыт работы юристом в IT-компании ...

Можно удаленно
Полный день
Опыт от 3 лет

StormWall™

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Senior IT Рекрутер

от 100 000 ₽

Globus IT – лидер в разработке и аналитике корпоративных мобильных и web-приложений. ... в ИТ рекрутинге от 3х лет; Опыт работы с аутстаффингом или в кадровом агентстве; Глубокое понимание IT-специальностей ... Заработная плата оклад до 80 000 руб. на руки + премия по КПЭ после испытательного срока; 🎯Если вы опытный IT-рекрутер ...

Можно удаленно
Полный день
Опыт от 3 лет

ГЛОБУС

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Senior Research Engineer, LLM Pretraining

По договоренности

Обязанности

Требования

Условия

Похожие вакансии

Product manager в TravelTech

Senior Quant Researcher / Portfolio Manager

Quantitative Researcher (FinTech / Financial Markets)

Менеджер проектов (IT)

Ведущий Юрист (IT)

Senior IT Рекрутер

Вакансия в подборках

Похожие вакансии