MLOps Engineer

По договоренности

  • Речной вокзал
  • Водный стадион
  • Войковская

О команде

SS-infra (Security Services Infrastructure) — команда, занимающаяся развитием и построением инфраструктуры в составе Security Services. Мы строим, автоматизируем и защищаем инфраструктуру для «красных» и «синих» команд (Penetration Testing, Red Teaming, Incident Response, Threat Hunting и др.). Покрываем весь спектр DevOps/SecOps/DevSecOps.

Роль

Ищем инженера с ML- или DevOps-бэкграундом, который перешёл в MLOps. Нам нужен инженер, готовый пилотировать, внедрять и развивать новые решения и подходы. Помимо ML-инфраструктуры, нужно быть готовым помогать команде с классическими DevOps-задачами.

Обязанности

MLOps

  • Проектировать архитектуру AI-систем (от прототипа до production);
  • Внедрение GPU-планировщика (Kueue, Volcano или аналог) для шаринга нагрузки на одном железе
  • Проектирование и поддержка ML-пайплайнов (обучение, валидация, деплой моделей)
  • CI/CD для моделей: версионирование данных, моделей, экспериментов
  • Мониторинг production-моделей (drift detection, performance tracking)
  • Деплой и оптимизация LLM / inference-серверов (vLLM, TGI, Triton)

DevOps

  • Контейнеризация и оркестрация сервисов (Docker, K8s)
  • CI/CD (GitLab CI, Jenkins)
  • IaC (Terraform, Ansible)
  • Мониторинг и observability (Prometheus, Grafana, Loki)
  • Автоматизация рутинных операций
  • Обеспечение выполнения требований ИБ в отношении инфраструктуры
  • Ведение технической документации по вверенным ресурсам

Требования

  • Бэкграунд в ML/DS — понимание процессов обучения, инференса, работы с данными
  • Опыт от 2 лет в MLOps / DevOps с ML-спецификой (было бы огромным плюсом)
  • Docker, Kubernetes (Helm, управление кластерами) — production-опыт
  • Python — уверенное владение
  • CI/CD (GitLab CI, Jenkins, методология GitOps)
  • Глубокие знания Linux
  • Terraform / Ansible для IaC
  • Опыт построения или управления GPU-кластерами (NVIDIA, CUDA, nvidia-container-toolkit)
  • Опыт с GPU-планировщиками (Kueue, Volcano, Run:ai)
  • Опыт с MLflow, Kubeflow, Airflow или аналогами
  • Высшее техническое образование

Будет плюсом:

  • Опыт работы с LLM / inference-серверами (vLLM, TGI, Triton)
  • Знакомство со стеком команды: Gitlab, Nginx, Kafka, RabbitMQ, Elasticsearch, Loki, Grafana, Vault, Keycloak
  • Понимание специфики multi-tenant GPU-шаринга (MIG, MPS, time-slicing)
  • Опыт работы с Talos OS / Flatcar
  • Опыт построения гетерогенной инфраструктуры (on-premise + облака)

Адрес: Россия, Москва, Ленинградское шоссе, 39Ас3
Показать на большой карте

Поделиться:

Опубликована 10 часов назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Миссия роли / О роли Обеспечить бесперебойную работу офиса Чем предстоит заниматься Регистрировать заявки в сервис-деск системе, соблюдать сроки их выполнения. Осуществлять техническую поддержку пользователей и клиентов по полному циклу работ: от инс...
  • Полный день
  • Опыт от 3 лет
Логотип компании 12 STOREEZ12 STOREEZ
  • Москва
7 дней назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
10 часов назад
Цифровые Привычки – аккредитованная IT-компания, резидент Сколково, топ-5 подрядчиков Сбера. ... Мы предоставляем услуги IT-консалтинга, заказной разработки, аутсорсинга IT-процессов и развиваем собственные ... в области ИТ Опыт работы в должности data engineer от 3х лет Опыт программирования на Python (FastApi ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Цифровые привычкиЦифровые привычки
  • Москва
3 дня назад
Сейчас у нас открыта вакансия Enterprise Engineer в команду, которая занимается поддержкой, обслуживанием ... Экспертная поддержка территориально распределённых IT-подразделений. ... Экспертная поддержка территориально распределенных IT-подразделений.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
4 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли ML Engineer и работать над проектом заказчика.
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
7 дней назад
от 380 000 ₽
Выше средней на 109%
Мы - Eyes of Wonder, стартап-студия, более 10 лет создающая успешные IT продукты в сфере браузерных технологий ... , Kubernetes, Docker, Kafka, Grafana, Prometheus Требования: Опыт в качестве Senior/Lead DevOps/SRE engineer ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EYES OF WONDER SOFTWARE LLCEYES OF WONDER SOFTWARE LLC
  • Москва
9 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.