NLP Engineer (Gigaсhat)

По договоренности

  • Спортивная
  • Киевская
  • Парк Победы

Мы команда GigaChat - создаём и развиваем core-технологию генеративной языковой модели. Она может писать тексты, создавать изображения и даже код на Python. Она умеет отвечать на вопросы, вести диалог, сочинять стихи и рассказы, придумывать идеи для бизнеса, писать письма и многое другое.

Ведем набор на 4 направлениям:

разработку фреймворка распределенного обучения GigaFSDP, исследование обучений в FP8;

развитие метрик качества GigaChat-a, например, через оценку способности решать задачи олимпиад международного уровня;

команду инфраструктуры обучений, 5-D параллелизм, в том числе ускорение обучений мультимодальных моделей;

разработку низкоуровневых оптимизаций операций на аппаратном уровне.

На эти роли мы ищем талантливого NLP Engineer, с которым мы будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых

Обязанности

  • довести качество до ChatGPT на русском и дальше обогнать его;
  • помогать решать бизнес-задачи с помощью нашей технологии сначала для внутренних клиентов в Сбере, а потом и внешним;
  • придумывать и внедрять новые применения для LLM;
  • помогать выводить в прод все, что мы обучим;
  • постоянно держаться up-to-date со свежими статьями

Требования

  • уверенное владение Python, Pytorch;
  • знание базовых алгоритмов и математики;
  • знания в DL, опыт обучения просто моделей и больших моделей;
  • опыт обучения моделей для продакшен;
  • понимание текущего состояния эволюции больших LLM's;
  • C++ & CUDA;
  • будет плюсом наличие публикаций

Условия

  • комфортный современный офис в Москве и Санкт-Петербурге
  • возможность выбрать удобный гибридный график
  • ежегодный пересмотр зарплаты годовая премия
  • зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • программа адаптации и помощь руководителя на старте (для стартовых позиций)
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера

Адрес: Россия, Москва, Кутузовский проспект, 32
Показать на большой карте

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Полный день
  • Опыт от 1 года
Логотип компании AstonAston
  • Москва
4 дня назад
Нахожусь в поисках Application Support Engineer в компанию, которая является лидером рынка в сфере доверительного управления и коллективных инвестиций. Предстоит работать над ключевыми для брокерского бизнеса системами. Что хотим видеть: Финансовая п...
  • Полный день
  • Опыт от 1 года
Логотип компании Hi, Rockits!Hi, Rockits!
  • Москва
3 дня назад
Мы динамично развивающаяся компания, специализирующаяся на поставках серверного и сетевого оборудования ведущих мировых брендов, а также собственной марки Xingfu Kele. Обязанности: Анализ ТЗ клиентов и подбор оптимальных конфигураций серверов (на баз...
  • Полный день
  • Опыт от 1 года
Логотип компании IT DevisionIT Devision
  • Москва
5 дней назад
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках iOS Automation Engineer. Предстоит: Формировать ...
  • Полный день
  • Опыт от 1 года
Логотип компании EmploycityEmploycity
  • Москва
15 дней назад
200 000 - 350 000 ₽
Выше средней на 121%
Наш клиент - аккредитованная IT компания, разработчики ПО Приглашает на работу - ML-Engineer Требования: Высшее техническое образование Знание С++; Qt; Pyton Знание OpenCV, TensorFlow/PyTorсh, YOLO, MMDetection, Detectron2 Опыт разработки и внедрения...
  • Полный день
  • Опыт от 1 года
Логотип компании ProfiStaffProfiStaff
  • Москва
17 дней назад
Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних кл...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.