MLOps engineer (Центр платформенных ИИ-решений)

По договоренности

  • Водный стадион
  • Войковская
  • Сокол

Чем предстоит заниматься:

  • Развёртывание и масштабирование инфраструктуры: проектирование, развертывание и конфигурация серверной и облачной инфраструктуры для запуска моделей ML/LLM. Обеспечение масштабируемости (например, настройка кластеров Kubernetes для обслуживания моделей под высокими нагрузками);
  • CI/CD: построение конвейеров непрерывной интеграции и доставки изменений (в частности для деплоя LLM-моделей);
  • Мониторинг и надежность: внедрение систем мониторинга производительности моделей и сервисов (метрики времени отклика, использование ресурсов, качество ответов моделей). Настройка алертинга и логирования для быстрого выявления сбоев или деградации производительности систем;
  • Оптимизация и эффективность: анализ производительности инфраструктуры и внесение улучшений для оптимизации скорости работы систем (например, использование GPU/TPU). Контроль за эффективным использованием ресурсов и затратами;
  • Изучение и внедрение новых инструментов в процессы работы;
  • Сотрудничество с командами. Консультирование коллег по лучшим практикам DevOps/MLOps/LLMOps.

Что мы ждём:

  • Языки и фреймворки: Python (в том числе библиотеки для ML: scikit-learn, PyTorch, TensorFlow для базового понимания моделей), скрипты Bash для автоматизации;
  • Контейнеры и оркестрация: Docker, Kubernetes (kubectl, Helm), Docker Compose для локального тестирования;
  • CI/CD и DevOps: Git для контроля версий, платформы CI/CD (GitLab, Jenkins), система управления конфигурациями Ansible, Terraform для инфраструктуры как кода;
  • Мониторинг и логирование: Prometheus/Grafana, стек ELK/EFK, а также облачные аналоги (например, CloudWatch, Stackdriver) при работе в облаке;
  • Прочее: MLflow или DVC для версионирования данных и моделей; Kafka или RabbitMQ для потоковой обработки, если используется; инструменты для деплоя моделей (TensorFlow Serving, TorchServe);
  • Английский (Средний уровень).

Адрес: Россия, Москва, Ленинградское шоссе, 16Ас2
Показать на большой карте

Поделиться:

Опубликована 6 дней назад

Похожие вакансии

Стек на проекте: 1) Openshift / k8s; 2) Linux; 3) ELK; 4) Prometheus; 5) Zabbix; 6) Rabbit MQ; 7) Nginx; 8) Postgresql; 9) Jenkins 10) CI/CD Чем предстоит заниматься: Ввод в экслплуатацию и оптимизация работы информационных систем построенных на микр...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Т1Т1
  • Москва
6 дней назад
до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. As our Remote Support division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer to join our team. This role i...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Москва
месяц назад
Job responsibilities: Manual testing of Frontend, Backend, Mobile Apps Defects discovery and reporting; Test environment preparation (test data, settings); Tests development (test plans, checklists); Test documentation maintenance; Testing automation...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HRSHRS
  • Москва
22 дня назад
В NOVACARD мы создаём продукт, который меняет подход к кредитованию: первая в Мексике карта без процентов и годового обслуживания, полностью управляемая через мобильное приложение. Сейчас мы ищем Site Reliability Engineer (SRE), который будет отвечат...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Finstar Financial GroupFinstar Financial Group
  • Москва
2 дня назад
X5 Group — российская розничная торговая компания, управляющая продуктовыми торговыми сетями «Пятёрочка», «Перекрёсток» и «Чижик», а также цифровыми сервисами «Vprok.ru Перекрёсток», 5Post, «Много Лосося» и медиаплатформой Food.ru. X5 Tech - IT-компа...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании X5 TechX5 Tech
  • Москва
11 часов назад
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках QA Automation Engineer C#. Чем предстоит занимат...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.