Разработчик на C++ в YandexGPT (Нейро)

По договоренности


Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами.

Какие задачи вас ждут

Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях
Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации.

Оптимизация методов распределения работы между вычислительными узлами
Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений.

Разработка различных кусков многокомпонентной системы
Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов.

Мы ждем, что вы

  • Разбираетесь в базовых алгоритмах и структурах данных
  • Хорошо знаете С++
  • Знакомы с паттернами и идиомами построения программного обеспечения
  • Умеете писать надёжный и читабельный многопоточный код
  • Разрабатывали большой сервис в команде

Поделиться:

Опубликована месяц назад

Похожие вакансии

Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту
Ищем разработчика в команду HR Pro. ... Решаем сложные востребованные задачи без готовых решений или аналогов; разработчики сами определяют пути ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании DirectumDirectum
  • Екатеринбург
3 дня назад
Чем предстоит заниматься: Придумывать и реализовывать архитектурные решения: вы предлагаете технические решения для реализации целей бизнеса Писать продакшн-код на Java для решения highload-задач и создания стабильных и масштабируемых сервисов Писать...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании «UZUM TECHNOLOGIES»«UZUM TECHNOLOGIES»
  • Екатеринбург
10 дней назад
Приглашаем присоединиться к нашей команде Программиста/Разработчика 1С.
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Торговый дом ПродсервисТорговый дом Продсервис
  • Екатеринбург
11 дней назад
Наш партнёр - Аккредитованная ИТ-компания, крупный игрок на рынке, обеспечивающий технологический суверенитет и продовольственную безопасность России. Отдел разработки активно растет, и мы ищем специалистов, готовых развиваться вместе с нами и решать...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Assistance GroupAssistance Group
  • Екатеринбург
13 дней назад
В связи с развитием мы приглашаем в нашу команду Fullstack-разработчика, который будет развивать как ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании Институт проектирования, архитектуры и дизайна (ИНПАД)Институт проектирования, архитектуры и дизайна (ИНПАД)
  • Екатеринбург
17 дней назад
от 320 000 ₽
Рыночная зарплата
Образование и опыт: Опыт работы в качестве Senior java developer от 6 лет. Опыт разработки на Java 17 с использованием Spring Framework, включая Spring Boot. Опыт работы с микросервисной архитектурой и разработкой RESTful API. Знание принципов объект...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании РэдРэд
  • Екатеринбург
25 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.