LLMOps / ML Platform Engineer

200 000 - 260 000 ₽

Выше средней на 42%

LLMOps / ML Platform Engineer (Self-Hosted LLM)

О компании

Мы —продуктовая IT-команда, разрабатывающая собственные информационные системы. Работаем с современным технологическим стеком и микросервисной архитектурой. В связи с развитием продукта ищем LLMOps / ML Platform Engineer, который разработает нам сервисы для LLM и оптимизирует их работу на «железе».

Задачи

  • Разработка и поддержка продакшен-сервисов под собственную LLM (backend / API / internal services), системы синтеза и распознавания речи, оптимизация инференса отдельных компонентов и системы в целом для NRT эксплуатации
  • Построение и развитие DevOps-pipeline для ML-сервисов: сборка, деплой, обновления, мониторинг; внедрение и развитие практик MLOps:
    • CI/CD для ML-сервисов
    • наблюдаемость (логи, метрики, трассировка)
    • управление версиями и релизами моделей
  • Контейнеризация решений и эксплуатация в Kubernetes (AWS + on-prem).
  • Совместная работа с backend-командой.

Требования обязательные:

  • Опыт коммерческой разработки от 3 лет.
  • Уверенное владение Python, SOLID, многопоточная и асинхронная разработка, оптимизация сервисов на Python под быстродействие.
  • Опыт разработки серверных сервисов (REST/gRPC).
  • Понимание жизненного цикла ML/LLM решений в продакшене; понимание подходов оптимизации ML-пайплайнов для инференса
  • Понимание особенностей основных архитектур и пайплайнов NN/ML решений, прежде всего в области ASR, TTS, LLM; понимание разницы между real-time и batch инференсом;
  • Практический опыт Docker и контейнеризации
  • Опыт работы с GPU (деплой, конфигурация, эксплуатация); наличие решений в продакшен

Требования желательные:

  • Опыт эксплуатации ML-сервисов в AWS и/или on-prem.
  • Работа с monitoring/observability (Prometheus, Grafana, OpenTelemetry и аналоги).
  • Опыт оптимизации inference-нагрузок (batching, caching, resource tuning).
  • Опыт реализации CI/CD для ML-проектов.
  • Знакомство с vLLM/llama.cpp/TGI, Triton/TorchServe, Onnx

Условия

  • Удалённая работа, полная занятость.
  • Продакшен-задачи, влияние на архитектуру и инфраструктурные решения.
  • Конкурентная зарплата (готовы обсуждать по опыту).

Сравнение со средней зарплатой в похожих вакансиях:

120k

200k

80k

150k

320k


Поделиться:

Опубликована день назад

Похожие вакансии

до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. ... division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer ... This role is ideal for someone who thrives in resolving complex IT infrastructure issues, enjoys working ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Санкт-Петербург
месяц назад
... агентство, которое специализируется на поиске и подборе высококвалифицированных специалистов в сфере IT ... и Digital, сотрудничает с ведущими IT-компаниями, рекламными агентствами и работает над крупными проектами ... Сейчас мы находимся в поиске Presale Engineer в международную B2B компанию, создающую передовые AI/ML ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HuntITHuntIT
  • Санкт-Петербург
день назад
Каруна — это сообщество, где твои идеи становятся IT-проектами. ... В нашу дружную команду мы ищем QA Engineer!
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании KarunaKaruna
  • Санкт-Петербург
день назад
... 250+ профессионалов, которые сегодня создают то, что казалось невозможным вчера Сейчас мы в поиске QA Engineer ... — компания входит в реестр аккредитованных IT-организаций; Ежегодный выбор бенефита: компенсация ДМС ... клуб, английский язык, Just Talks и другие форматы для вашего развития; Возможности группы i-Free: 16 IT-компаний ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Just AIJust AI
  • Санкт-Петербург
6 дней назад
We are currently looking for an experienced Staff Firmware Engineer (Android) Mercury Development specializes ... Enjoy using the product, provide feedback, and help make it even better!
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Mercury DevelopmentMercury Development
  • Санкт-Петербург
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.