Senior RL - Engineer (GigaChat Vision)

По договоренности

Москва

Привет! Это GigaChat Vision — команда, которая делает полный цикл обучения VLM-моделей. Ищем сильного senior-инженера в RL-направление: человека, который будет драйвить ключевые исследования и разработки, влиять на качество моделей и доводить сложные идеи до работающих решений.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

Разрабатывать и улучшать RL-подходы для обучения VLM/LLM-моделей: выбор алгоритмов, постановка экспериментов и анализ результатов;
Проектировать reward-функции и пайплайны обучения, выстраивать стратегии масштабирования под разные домены и сценарии, напрямую влияя на метрики качества;
Определять требования к данным для RL: участвовать в построении пайплайнов сбора, фильтрации и подготовки датасетов;
Развивать систему оценки reasoning-качества: внедрять и улучшать метрики в существующем eval-фреймворке, предлагать новые способы измерения качества под новые возможности модели;
Работать на стыке с Pretrain / SFT / Infra: обеспечивать согласованность решений и перенос экспериментов в продакшн-пайплайн;
Следить за состоянием области и переводить свежие идеи из статей в проверяемые эксперименты и инженерные решения;
Глубоко погружаться в технические задачи: дебажить эксперименты, разбирать аномалии в обучении, находить узкие места и доводить решения до результата;
Делиться экспертизой с командой: участвовать в код-ревью, помогать улучшать качество решений и подходы к экспериментам;
Развивать инфраструктуру для RL.

Требования

Глубокое понимание RL для LLM/VLM (RLHF, GRPO, PPO) и практический опыт;
Понимание полного цикла обучения VLM/LLM (pretrain → SFT → RL) и того, как решения на каждом этапе влияют на финальные метрики;
Опыт с распределённым обучением (DeepSpeed, FSDP) и inference-фреймворками.
Сильный практический опыт постановки, проведения и анализа RL-экспериментов;
Умение работать в условиях неопределённости и самостоятельно двигать сложные технические задачи;
Умение выстраивать процессы в условиях неопределённости;
Опыт взаимодействия со смежными командами и стейкхолдерами;
Системное мышление: способность видеть картину целиком — от данных и reward-дизайна до eval и продакшн-метрик.

Будет плюсом:

Опыт менторинга или технического лидерства в рамках отдельных проектов;
Публикации или open-source вклад в области RL/LLM/VLM;
Опыт вывода RL-обученных моделей в продакшн и поддержки их качества.

Условия

крупнейшее DS&AI community — более 600 DS-специалистов банка
дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
возможность быть соавтором НИРов и статей для международных конференций
возможность выбрать удобный формат работы: гибрид или офис
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека выгоднее до 7% для каждого сотрудника
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.

⚡ Откликнуться на hh.ru

Опубликована 16 часов назад

Инженер технической поддержки офиса/Office IT support engineer

Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...

Полный день
Опыт от 3 лет

12 STOREEZ

Москва

6 дней назад

⚡ Откликнуться на hh.ru

Data Engineer

Цифровые Привычки – аккредитованная IT-компания, резидент Сколково, топ-5 подрядчиков Сбера. ... Мы предоставляем услуги IT-консалтинга, заказной разработки, аутсорсинга IT-процессов и развиваем собственные ... в области ИТ Опыт работы в должности data engineer от 3х лет Опыт программирования на Python (FastApi ...

Полный день
Опыт от 3 лет

Цифровые привычки

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Enterprise Engineer

Сейчас у нас открыта вакансия Enterprise Engineer в команду, которая занимается поддержкой, обслуживанием ... Экспертная поддержка территориально распределённых IT-подразделений. ... Экспертная поддержка территориально распределенных IT-подразделений.

Полный день
Опыт от 3 лет

Леста Игры

Москва

3 дня назад

⚡ Откликнуться на hh.ru

ML-инженер / ML Engineer

Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.

Полный день
Опыт от 3 лет

Aston

Москва

6 дней назад

⚡ Откликнуться на hh.ru

Senior/Middle Data Аналитик (Офис)

Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ФУНКЦИОНАЛЬНЫЕ ОБЯЗАННОСТИ ...

Полный день
Опыт от 3 лет

ИЦ АЙ-ТЕКО

Москва

5 дней назад

⚡ Откликнуться на hh.ru

Data Engineer (Middle)

Мечтай о большем с Napoleon IT Мы — не просто IT-компания, а место, в котором искусственный интеллект ... Мы ищем Data Engineer, который будет работать на внешних проектах наших клиентов (формат аутстаффинга ... технологий; Компенсацию расходов на покупку профессиональной литературы; Доступ к курсам нашей объединенной IT-школы ...

Полный день
Опыт от 3 лет

Napoleon IT

Москва

6 дней назад

⚡ Откликнуться на hh.ru

Senior RL - Engineer (GigaChat Vision)

По договоренности

Обязанности

Требования

Условия

Похожие вакансии

Инженер технической поддержки офиса/Office IT support engineer

Data Engineer

Enterprise Engineer

ML-инженер / ML Engineer

Senior/Middle Data Аналитик (Офис)

Data Engineer (Middle)

Вакансия в подборках

Похожие вакансии