Senior DL-engineer (GigaChat Vision)

По договоренности


Привет! Это GigaChat Vision — команда, которая делает полный цикл обучения VLM моделей, включающий в себя стадии pre-training, SFT и DPO/RL. Мы ищем сильных инженеров и исследователей, которые будут двигать вперед качество мультимодального GigaChat.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • Самостоятельная работа в рамках заданного направления развития качества VLM: от планирования, до выкатки в прод;
  • Планирование и работа над исследовательскими задачами по архитектуре модели, стратегии и данным обучения;
  • Формирование гипотез по улучшению качества модели, самостоятельное планирование экспериментов по их подтверждению и постановка multi-node обучений на большом количестве GPU (тысячи A100/H100);
  • Решение сложных инженерных задач, развитие и оптимизация кодовой базы обучения и эвала VLM, написание чистого кода и проведение code review;
  • Анализ точек роста и определение способов их закрытия.

Требования

  • Сильный технический бэкграунд в modern ML: понимание того, как данные, архитектура и стратегии обучения влияют на итоговое качество модели;
  • Опыт полного цикла обучения VLM или LLM;
  • Глубокие знания или опыт работы в области computer vision;
  • Понимание принципов работы распределенного обучения (FSDP) или опыт обучения моделей на больших GPU кластерах;
  • Наличие навыков технического лидерства: проведение code-review, помощь и менторинг младших сотрудников;
  • Умение работать, принимать решения и выстраивать процессы в условиях неопределенности;
  • Умение и желание взаимодействовать с коллегами, вносить собственные идеи и предлагать пути достижения общих целей.

Будет плюсом:

  • Опыт полного цикла обучения VLM;
  • Наличие публикаций в области NLP или CV;
  • Опыт решения задач по оптимизации обучения;
  • Опыт участия в соревнованиях по машинному обучению или программированию.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 12 часов назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...
  • Полный день
  • Опыт от 3 лет
Логотип компании 12 STOREEZ12 STOREEZ
  • Москва
6 дней назад
Цифровые Привычки – аккредитованная IT-компания, резидент Сколково, топ-5 подрядчиков Сбера. ... Мы предоставляем услуги IT-консалтинга, заказной разработки, аутсорсинга IT-процессов и развиваем собственные ... в области ИТ Опыт работы в должности data engineer от 3х лет Опыт программирования на Python (FastApi ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Цифровые привычкиЦифровые привычки
  • Москва
2 дня назад
Сейчас у нас открыта вакансия Enterprise Engineer в команду, которая занимается поддержкой, обслуживанием ... Экспертная поддержка территориально распределённых IT-подразделений. ... Экспертная поддержка территориально распределенных IT-подразделений.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
3 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
6 дней назад
Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных ... крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках QA Engineer ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
12 часов назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ФУНКЦИОНАЛЬНЫЕ ОБЯЗАННОСТИ ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.