Инженер по поддержке LLM моделей и чат ботов

По договоренности

  • Марксистская
  • Третьяковская
  • Новокузнецкая

X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и «Чижик», а также цифровыми сервисами «Vprok.ru Перекрёсток», 5Post, «Много Лосося» и медиаплатформой Food.ru.

X5 Tech - IT-компания и основной цифровой партнер торговых сетей и бизнесов X5 Group. Команда из более 4000 специалистов разрабатывает решения, которые помогают 372 тысячам сотрудников группы работать с максимальным технологическим комфортом, а миллионам покупателей быстро и удобно покупать свежие продукты.

В X5 Технологии открыта позиция MLOps Support Engineer

Чем предстоит заниматься:

  • Поддержка инфраструктуры ML/LLM: сопровождение виртуальных машин и контейнерных сред (Kubernetes), мониторинг распределения ресурсов (CPU/RAM/GPU), диагностика bottleneck'ов в инференсе моделей;
  • Observability и алертинг: поддержка стека Prometheus / VictoriaMetrics + Grafana, написание запросов на PromQL и SQL для диагностики состояния сервисов, настройка SLO/SLI, создание дашбордов для отслеживания latency, throughput и ошибок LLM;
  • Эксплуатация микросервисов: сопровождение распределенной архитектуры, трассировка запросов между сервисами, анализ логов при инцидентах;
  • Инцидент-менеджмент: оперативное реагирование на алерты, проведение RCA, разработка ранбуков для типовых сценариев отказов (проседание GPU, заполнение VRAM, деградация API моделей);
  • Взаимодействие с моделями: отладка API-запросов к LLM (OpenAI-compatible endpoints, локальные inference-серверы), диагностика ошибок токенизации, rate limiting, timeout'ов; Автоматизация рутины: написание Python-скриптов для автоматизации диагностики, сбора метрик, перезапуска зависших задач, парсинга логов;
  • Эскалация: взаимодействие с командами разработки и инфраструктуры при сложных инцидентах, передача задач в сроки.

Что мы ожидаем от кандидата:

  • Инфраструктура: понимание принципов работы виртуальных машин и контейнеризации; умение анализировать распределение ресурсов;
  • Мониторинг: уверенное владение Prometheus и Grafana, написание запросов на PromQL; понимание метрик инференса (latency p95/p99, GPU utilization, queue size);
  • Данные: знание Loki для анализа логов и метрик; базовое понимание векторных БД;
  • Разработка: Python (автоматизация, скрипты для диагностики);
  • LLM и API: понимание работы LLM-сервисов (инференс, токены, контекстное окно).

Будет плюсом:

  • Опыт работы с LLM-инференс движками (vLLM, SGLang);
  • Знание LangChain/LangFlow для понимания цепочек вызовов моделей.

Что важно:

  • Мы ищем инженера, который понимает, что значит «модель упала по OOM» или «просел p95 latency», и может быстро локализовать проблему — в коде, инфраструктуре или самой модели.

Мы предлагаем:

  • официальное оформление с белой ЗП, ежеквартальные премии по результатам работы;
  • Удобный офис рядом с м. «Добрынинская» / удобный офис с бесплатной парковкой на м. «Волгоградский проспект» / МЦД «Калитники»
  • гибкий график работы (с 8/9/10 утра) / График работы: 5/2, с 9:00 до 18:15 (в пятницу — до 17:00);
  • возможность работать удалённо или в гибридном формате;
  • широкий пакет ДМС (включая выезд за рубеж и стоматологию), страхование жизни и здоровья;
  • возможность учиться и развиваться за счёт компании: внешние тренинги и семинары по профессиональным тематикам, участие в крупнейших конференциях страны, программы развития цифровых и управленческих навыков (Цифровая академия, Школа Тимлидов), онлайн и офлайн мастер-классы, корпоративный университет «X5 Полка», школа наставников и многое другое;
  • программы мотивации для спикеров и авторов: внутренняя школа Speak Up School, Write Up, ачивки и баллы за выступления, подготовка спикеров к крупнейшим конференциям страны, сообщество авторов на Хабре, возможность шерить опыт с комьюнити внутренних и внешних экспертов;
  • обмен опытом через cообщества: 12 технических комьюнити от java до devops;
  • яркая корпоративная жизнь с большим количеством мероприятий, конкурсов и возможностей для творческой реализации: регулярные внутренние митапы, демо-дни, открытые микрофоны, день IT-специалиста, программы волонтерства, корпоративное предпринимательство X5 Idea Challenge;

Присоединяйся к команде X5 Tech, чтобы создавать будущее ритейла вместе с нами!


Адрес: Россия, Москва, Кольцевая линия, метро Добрынинская
Показать на большой карте

Поделиться:

Опубликована 7 часов назад

Похожие вакансии

Мы развиваем собственные решения на базе искусственного интеллекта и ищем инженера, который хочет расти ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ЛУИС+ЛУИС+
  • Москва
день назад
Utrace – это аккредитованная IT-компания, российский лидер в автоматизации процесса прослеживаемости маркированных товаров, разработчик и интегратор лидирующего российского решения, позволяющего крупным компаниям полностью автоматизировать взаимодейс...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании UtraceUtrace
  • Москва
7 часов назад
Сейчас мы находимся в поиске Инженера данных в команду, которая занимается разработкой платформы обработки ... DAG'ов в Airflow; Поддержка legacy пайплайнов; Участие в миграции под руководством Senior / Ведущего инженера ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании РостелекомРостелеком
  • Москва
7 часов назад
130 000 ₽
Рыночная зарплата
Обязанности: - Раздел ДК, АД -Ведение документации в электронном виде: работа в сервисе Exon -Сопровождение и контроль подписания исполнительной документации у Заказчика -Ведение реестров -Ведение общего журнала работ (ОЖР) -Входного журнала Требован...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании СтроймирСтроймир
  • Москва
день назад
от 40 000 ₽
... теppитopии Moсквы и Моcкoвской oблаcти, в связи с увeличeнием площaди обcлуживaния, трeбуeтcя сетевой инженер ...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 1 года
Логотип компании Мастер-ПрофМастер-Проф
  • Москва
день назад
О компании: Мы — ведущая российская ИТ-компания, входящая в ТОП-10 крупнейших разработчиков ПО и ТОП-30 ИТ-интеграторов России. С 2002 года мы успешно реализуем проекты для крупных государственных структур и бизнеса. Сейчас мы ищем талантливого специ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Программный Продукт, ИТ-компанияПрограммный Продукт, ИТ-компания
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.