NLP engineer (GigaChat)

По договоренности


Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это фундамент, с которого начинается путь современной LLM модели и то, от чего наиболее зависит ее итоговое качество. Сырых данных более 40Пб и основная задача заключается в том, чтобы из этого хаоса сделать датасет, на котором будет обучена лучшая LLM в России.

Обязанности

  • генерировать синтетические данные: математика, код, произвольная синтетика с сидами - документами из Web
  • исследовать токенизацию и ее влияние на качество модели (возможно написание статей)
  • решать задачи кластеризации миллиардов документов
  • исследовать разные факторы, которыми обладают текстовые данные
  • генерировать Vision данные для прокачки VLM
  • разрабатывать новые алгоритмы парсинга HTML и исследовать его влияние на качество модели
  • исследовать зависимости между pretrain данными и agentic capabilities итоговой модели
  • разрабатывать стабильную инфраструктуру, которая будет поддерживать проведение сотен и тысяч экспериментов над данными.

Требования

  • имеешь коммерческий релевантный опыт связанный с NLP или построением инфраструктуры для данных от двух лет.

Будет плюсом:

  • навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
  • инструментальное владение AI для анализа, генерации и автоматизации
  • опыт с MapReduce системами.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • льготная программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована день назад

Похожие вакансии

Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...
  • Полный день
  • Опыт от 3 лет
Логотип компании 12 STOREEZ12 STOREEZ
  • Москва
23 дня назад
до 210 000 ₽
Рыночная зарплата
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
4 дня назад
до 400 000 ₽
Выше средней на 100%
Команды CDO B2C в поиске Data engineer в сфере управления данными и data-продуктами. ... страхование для семьи корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
Международная IT-компания, специализирующаяся на создании высоконагруженных онлайн-сервисов ищет в команду ... Кого ищем: Опыт работы в роли DWH Developer / Data Engineer / Database Developer от 3х лет.
  • Полный день
  • Опыт от 3 лет
Логотип компании ТопассистентТопассистент
  • Москва
день назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -5 крупнейших IT-компаний России. ... В связи с расширением проектов у нас открыта вакансия DATA ENGINEER.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
14 дней назад
Johnson &Johnson is looking for a talented Reliability Engineer to join our Russia-based IT organization ... Reliability Engineer will be responsible for ensuring the reliability, availability, and performance ... Proven experience as a Reliability Engineer, Site Reliability Engineer, or similar role supporting enterprise-scale ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Johnson & JohnsonJohnson & Johnson
  • Москва
9 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.