Senior MLOps/Devops инженер (LLM)

По договоренности

  • Спортивная
  • Киевская
  • Парк Победы

Мы строим платформу для инференса и SFT opensource LLM. Используем продвинутые cutting edge движки для инференса, много экспериментируем и боремся за каждую дополнительную единицу в Token thoughput. Cейчас мы находимся в поиске MLOps-инженера, который вместе с нами продолжит настраивать и улучшать инфраструктуру инференса LLM-моделей и осуществлять вывод решений в прод контур.

Первый этап отбора на эту вакансию - общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача - уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Вам предстоит:

  • разрабатывать и оптимизировать инфраструктуру инференса LLM-моделей для минимальной задержки и высокой пропускной способности внутренних приложений и сервисов
  • обеспечивать масштабируемость и надежность LLM-serving инфраструктуры; выбирать и настраивать инструменты для инференса (sglang, vLLM, llama.cpp)
  • разрабатывать механизмы разграничения доступов к API-сервисам моделей
  • строить систему observability и мониторинга LLM-инференса
  • собирать модели в сервисы и интерфейсы (FastAPI, Flask, Tornado, Streamlit, Chainlit и т.д.)

Мы ожидаем:

  • опыт в аналогичной роли от 5 лет
  • оппыт с Linux (сеть, storage, роли/пользователи, менеджмент процессов)
  • уверенное владение Kubernetes (используем Istio Service Mesh)
  • опыт построения высокопроизводительных LLM-сервисов (sglang, vLLM)
  • опыт настройки высоконагруженных прокси-серверов (nginx, Envoy, HAProxy): load balancing, rate limiting, SSL termination, health checks
  • владение языками: Bash, Python, Groovy (Jenkins scripted)
  • продвинутые навыки в CI/CD и оркестрации моделей.

Будет преимуществом:

  • понимание распределенных систем и GPU-коммуникации (NCCL, MPI, RDMA, InfiniBand)
  • знание служебных компонентов LLM-пайплайна: токенизаторы, KV-cache, контекстное окно
  • понимание внутренней архитектуры GPU (CUDA, cuDNN, Tensor Cores)
  • опыт работы с векторными БД (Opensearch, Qdrant, FAISS, pgvector) для RAG и других задач.

Мы предлагаем:

  • гибридный формат работы (2-3 дня в офисе)
  • годовой бонус и ежегодный пересмотр
  • расширенный ДМС с первого дня + стоматологию и льготное страхование для семьи
  • корпоративный университет Сбера, внутреннюю образовательную платформу, участие в IT-конференциях
  • офис на Кутузовской с зонами отдыха и спортзалом
  • льготную ипотеку в Сбере, корпоративную пенсионную программу, подписку СберПрайм+, скидки от партнеров и сервисов группы компаний.

Адрес: Россия, Москва, Кутузовский проспект, 32к3
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

161 000 - 215 000 ₽
Нашей команде не хватает инженера-конструктора (главный специалист). ... (архитектурное/строительное); Опыт от 5 лет в области строительства или проектирования в должности инженера-конструктора ...
  • Полный день
  • Опыт от 5 лет
Логотип компании ФБУ «РОССТРОЙКОНТРОЛЬ»ФБУ «РОССТРОЙКОНТРОЛЬ»
  • Москва
14 часов назад
В связи с расширением и запуском серийного производства требуется Инженер-расчетчик Обязанности: 1. ... образование (машиностроение, авиастроение, механика, прикладная математика) Опыт работы от 3-х лет в роли инженера-расчетчика ... или CAE/CFD-инженера Свободное владение: Ansys Mechanical COMSOL Multiphysics для расчета механики деформируемого ...
  • Полный день
  • Опыт от 5 лет
Логотип компании КалашниковКалашников
  • Москва
14 часов назад
до 260 000 ₽
Выше средней на 30%
Приглашаем сотрудника на должность: Главный инженер-сметчик Чем предстоит заниматься (зона вашей ответственности ... Идеальный кандидат — это Вы, если: Имеете высшее специальное образование (инженер-строитель); Ваш опыт ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Промышленное СтроительствоПромышленное Строительство
  • Москва
15 часов назад
180 000 ₽
Вакансия открыта в АО "НИИАА" им. В.С. Семенихина Обязанности: - координация и контроль исполнения поручений АО "ОПК" в ДЗО; - мониторинг и контроль внедрения новых технологических процессов в Дивизионе; - оптимизация технологических ресурсов Дивизио...
  • Полный день
  • Опыт от 5 лет
Логотип компании Российская электроникаРоссийская электроника
  • Москва
15 часов назад
от 120 000 ₽
Обязанности: Поиск неисправностей и ремонт оборудования и электронных блоков; Участие в ремонте тиристорных преобразователей частоты мощностью от 100 кВт; Ремонт импульсных блоков питания, источников бесперебойного питания, частотно-регулируемых прив...
  • Полный день
  • Опыт от 5 лет
Логотип компании ФГУП НИЦ Курчатовский институт - ВИАМФГУП НИЦ Курчатовский институт - ВИАМ
  • Москва
14 часов назад
от 160 000 ₽
... Инженер-сметчик (ОВ, ВК, ОВиК / ПИК, Самолет) ЗП: обсуждается с сильным кандидатом Строительная компания ... Сейчас усиливаем сметный блок и ищем сильного инженера-сметчика, который умеет не просто “считать”, а ... экономику на этапе тендера и реализации Выявлять ошибки и зоны потерь в сметах Требования Опыт от 6 лет инженером-сметчиком ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Первая ЦитадельПервая Цитадель
  • Москва
15 часов назад

Похожие вакансии

161 000 - 215 000 ₽
Логотип компании ФБУ «РОССТРОЙКОНТРОЛЬ»ФБУ «РОССТРОЙКОНТРОЛЬ»
до 260 000 ₽
Логотип компании Промышленное СтроительствоПромышленное Строительство
180 000 ₽
Логотип компании Российская электроникаРоссийская электроника
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.