Разработчик на C++ в YandexGPT (Нейро)

По договоренности

Нижний Новгород

Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами.

Какие задачи вас ждут

Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях
Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации.

Оптимизация методов распределения работы между вычислительными узлами
Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений.

Разработка различных кусков многокомпонентной системы
Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов.

Мы ждем, что вы

Разбираетесь в базовых алгоритмах и структурах данных
Хорошо знаете С++
Знакомы с паттернами и идиомами построения программного обеспечения
Умеете писать надёжный и читабельный многопоточный код
Разрабатывали большой сервис в команде

⚡ Откликнуться на hh.ru

Опубликована 24 дня назад

ETL разработчик (Senior)

до 360 000 ₽

Рыночная зарплата

Мы российская быстрорастущая платформа, созданная для взаимодействия разработчиков и ведущих компаний ... У нас множество компаний-партнёров, которые готовы принять к себе в команду ETL разработчика для работы ...

Можно удаленно
Полный день
Опыт от 5 лет

Volna.tech

Нижний Новгород

10 часов назад

⚡ Откликнуться на hh.ru

Разработчик C++

Вакансия с трудоустройством в партнёрскую компанию! Чем предстоит заниматься: разработкой собственных сетевых демонов/служб; реализацией стандартов RFC, IEEE; разработкой ПО для управления сетевой подсистемой ядра Linux; разработкой ПО для управления...

Можно удаленно
Полный день
Опыт от 5 лет

Т1

Нижний Новгород

4 дня назад

⚡ Откликнуться на hh.ru

Руководитель команды backend разработки

Компания разработчик приложений для бизнеса приглашает в свою команду опытных Тим лидов Backend Задачи ... высоконагруженных систем Руководить командой: повышать эффективность работы коллектива, помогать развиваться разработчикам ...

Можно удаленно
Полный день
Опыт от 5 лет

Версус Сервис

Нижний Новгород

10 часов назад

⚡ Откликнуться на hh.ru

Архитектор программного обеспечения

Мы - компания Telcore, российский разработчик и производитель базовых станций 2G/4G/5G и пакетного ядра ... связанные с архитектурой, и разработка мер по их снижению; Координировать команды: взаимодействовать с разработчиками ...

Можно удаленно
Полный день
Опыт от 5 лет

Телкор

Нижний Новгород

день назад

⚡ Откликнуться на hh.ru

Разработчик на C++ в YandexGPT (Нейро)

По договоренности

Какие задачи вас ждут

Мы ждем, что вы

Похожие вакансии

ETL разработчик (Senior)

Разработчик C++

Руководитель команды backend разработки

Архитектор программного обеспечения

Вакансия в подборках

Похожие вакансии