MLOps Engineer

По договоренности


Вместе с нами тебе предстоит:
  • Проектирование, развёртывание и развитие инфраструктуры платформы искусственного интеллекта (on‑prem и облако): Kubernetes‑кластеры, GPU‑ноды, storage, сети, безопасность.
  • ​Построение и поддержка CI/CD/CT‑пайплайнов для ML‑моделей и сервисов: от артефакта DS до продакшн‑инференса с откатами и канареечными релизами.
  • ​Интеграция и эксплуатация LLM/ML‑сервисов для внутренних команд и рыночных внедрений: упаковка моделей в сервисы, конфигурация autoscaling, SLA, observability.
  • ​Настройка мониторинга и алертинга по инфраструктуре и моделям (метрики ресурсов, latency, ошибки, дрейф данных), реагирование на инциденты, участие в post‑mortem.
  • ​Автоматизация ML‑пайплайнов: подготовка данных, обучение, переобучение, регистрация моделей, управление версиями и окружениями.
  • Поддержка внедрений у клиентов: тиражирование платформенных компонентов, адаптация инфраструктуры под контур заказчика, участие в performance‑оптимизации и cost‑cutting (GPU/CPU).
Какие навыки и знания для нас важны:
  • Высшее образование.
  • Опыт работы: 5+ лет.
  • Глубокое понимание жизненного цикла ML‑модели: от экспериментов до продакшн‑инференса и мониторинга.
  • ​Уверенный Linux, сетевые основы, безопасность, работа с контейнерами и оркестраторами.
  • ​Опыт построения CI/CD‑пайплайнов для сервисов и ML‑артефактов (Docker images, модели, данные).
  • Знания и навыки (желательные):
  • Опыт с LLM/GenAI‑платформами: vLLM, TGI, Hugging Face, Triton/ONNX Runtime, оптимизация инференса.
  • ​Опыт построения feature store, model registry, ML pipelines (Kubeflow, MLflow, Airflow, Argo Workflows).
  • Работа в гибридной инфраструктуре: on‑prem кластеры + публичные облака (T1 Cloud, VK Cloud, Yandex Cloud и др.).
  • ​Понимание cost‑optimization: FinOps для GPU/CPU, автобалансировка нагрузок.
  • Требования к личным качествам: ответственность, фокус на результат.
  • Знание иностранного языка (уровень): английский - от B2

Знание стека:

  • Языки: Python (утилиты, обвязка) / Bash.
  • ​Контейнеризация и оркестрация: Docker, Docker Compose, Kubernetes (Helm, Operators), желательно Kubeflow.
  • ​CI/CD: GitLab CI / GitHub Actions / Jenkins / Argo CD.
  • ​Инфраструктура: Terraform / Ansible, конфигурация Linux‑серверов, Nginx, cert‑manager.
  • ​Data/ML‑инфраструктура: Apache Kafka, Airflow/Argo Workflows, S3‑совместимые хранилища, MLflow/Weights&Biases.
  • ​Мониторинг и логи: Prometheus, Grafana, Loki/ELK, Sentry, alertmanager.

Профессиональные навыки:

  • Проектирование и развёртывание инфраструктуры платформы ИИ (кластер Kubernetes, storage, сети, security) под LLM/ML‑нагрузки.
  • ​Построение воспроизводимых ML‑пайплайнов: обучение, валидация, packaging модели, деплой в batch и real‑time режимах.
  • ​Настройка мониторинга моделей: метрики качества, дрейф данных, latency/throughput, автоматический rollback и retraining‑триггеры.
  • ​Совместная работа с DS/разработчиками и внедренцами: перевод экспериментальных ноутбуков в надёжные сервисы для внутренних и внешних клиентов.

Специализированные программы:

  • GitLab / GitHub, Jira / Confluence/Сфера
  • Kubernetes ecosystem: kubectl, Helm, K9s, Lens.
  • ​ML‑инструменты: MLflow / Weights & Biases, Kubeflow Pipelines / Airflow, model registry.
  • ​Мониторинг: Prometheus, Grafana, Loki/ELK, Alertmanager, Sentry.


Поделиться:

Опубликована 4 часа назад

Похожие вакансии

Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту
QA engineer Мы опытная It команда, занимаемся разработкой разнообразного ПО от Windows приложений, API ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании DPD в РоссииDPD в России
  • Москва
4 часа назад
... это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании ... Мы ищем Data Engineer в команду, которая отвечает за разработку и оптимизацию ядра хранилища данных и ... стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
4 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли MLOps Engineer и работать над проектом заказчика. ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
10 дней назад
Мы - аккредитованная IT-компания MarfaTech, разрабатывающая собственные высокотехнологичные продукты ... И мы ищем в команду профессионалов QA engineer (Linux) для тестирования веб приложений (навыки работы ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании MarfatechMarfatech
  • Москва
4 часа назад
до 170 000 ₽
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия SENIOR QA ENGINEER.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
7 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... опыт работы в роли DevOps Engineer от 3-х лет; опыт работы в роли DevSecOps Engineer от 1 года; владение ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
18 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.