Разработчик на C++ в YandexGPT (Нейро)

По договоренности


Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами.

Какие задачи вас ждут

Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях
Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации.

Оптимизация методов распределения работы между вычислительными узлами
Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений.

Разработка различных кусков многокомпонентной системы
Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов.

Мы ждем, что вы

  • Разбираетесь в базовых алгоритмах и структурах данных
  • Хорошо знаете С++
  • Знакомы с паттернами и идиомами построения программного обеспечения
  • Умеете писать надёжный и читабельный многопоточный код
  • Разрабатывали большой сервис в команде

Поделиться:

Опубликована день назад

Похожие вакансии

до 312 000 ₽
Выше средней на 10%
Группа Компаний Орбита - ведущий разработчик цифровых решений, российская аккредитованная ИТ-компания ... знает Java от 11 версии, есть опыт коммерческой разработки на Java от 3 лет • Можем смотреть Kotlin-разработчиков ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании ГК ОрбитаГК Орбита
  • Москва
день назад
Сейчас мы находимся в поиске Java разработчика на проект сроком 6 месяцев. ... Что мы ждём от кандидата: Опыт разработчик на Java от 5 лет; Глубокое знание Java core; Знание принципов ...
  • Можно удаленно
  • Подработка
  • Опыт от 5 лет
Логотип компании Бэнкс Софт СистемсБэнкс Софт Системс
  • Москва
день назад
... Разработчик на C# по направлению систем финансовых рынков для Product room Markets для проекта по импортозамещению ... Обязанности: Анализ требований на доработку Участие в разработке Взаимодействие с другими разработчиками ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Сателл ИТСателл ИТ
  • Москва
2 дня назад
Сейчас мы находимся в поиске Python-разработчика в команду Tengri Data — платформы для аналитики.
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Postgres ProfessionalPostgres Professional
  • Москва
2 дня назад
Чем предстоит заниматься: конфигурированием и доработкой 1С под запросы клиентов Общества по поставленному ТЗ; разработкой дополнительных модулей и расширений для системы 1С; настройкой интерфейсов, отчетов и печатных форм.; настройкой обмена данными...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании ЛоцияЛоция
  • Москва
день назад
до 320 000 ₽
Выше средней на 13%
ЛИАН — системный интегратор с фокусом в аналитике и управлении данными. Мы работаем в трех направлениях: 1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании ЛИАНЛИАН
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.