DevOps-инженер (инфраструктура ML/AI-сервисов)
115 000 - 170 000 ₽
Почему у нас тебе понравится:
-
Большой пул проектов — сможешь переходить в разные команды и не выгорать от однообразия;
-
Только крупные известные бренды — ты приобретешь бесценный опыт разработки/управления разработкой продукта или сервис для крупного банка, завода или авиакомпании;
-
Прозрачные понятные процессы — будешь заниматься только своей любимой разработкой, а не часами разбираться “что здесь происходит”;
-
Внимательный и тщательный онбординг в компанию;
-
Компенсация на обеды в кафе и ресторанах, а также большой выбор скидок от партнеров (скоро расширим список в новых городах присутствия);
-
Проводим яркие мероприятия, на которых можно уйти в отрыв и отдохнуть по полной.
IBS Dunice — это команда опытных разработчиков, тестировщиков, аналитиков, дизайнеров и менеджеров. Мы создаем веб-сервисы и мобильные приложения, которыми пользуются миллионы! В компании уже больше 350 человек.
Задачи:
-
Создать и развивать инфраструктуру для сервисов, использующих ML/AI-модели (GPU-сервера, контейнеризированные сервисы, кластер Kubernetes).
-
Автоматизировать процессы поставки: CI/CD-пайплайны для обучения, тестирования и деплоя сервисов.
-
Настраивать мониторинг сервисов и инфраструктуры (Prometheus, Grafana), включая метрики качества моделей и данных.
-
Интегрировать инструменты контроля качества данных и стабильности сервисов (Evidently, Deepchecks).
-
Оптимизировать производительность сервисов инференса: latency, throughput, масштабирование под нагрузку.
Требования:
-
Уверенный опыт работы DevOps/SRE/Platform-инженером.
-
Глубокие знания Linux, Docker, Kubernetes, сетевых основ.
-
Опыт построения CI/CD (Jenkins, GitLab CI, GitHub Actions и/или Ansible).
-
Понимание принципов работы сервисов для инференса моделей (REST/gRPC, батчинг, ресурсы GPU/CPU).
-
Опыт эксплуатации распределённых систем.
-
Навык работы с ML-пайплайнами: хранение артефактов, версияция, автоматизация, отслеживание экспериментов (MLflow, Airflow).
-
Опыт настройки мониторинга (Prometheus + Grafana).
Будет плюсом
-
Опыт развёртывания или эксплуатации платформ для ML-оркестрации: Kubeflow, MLflow, Airflow.
-
Опыт работы с inference-серверами (vLLM, TGI, Triton) как с приложениями, а не обязательно понимание внутренних ML-алгоритмов.
-
Опыт настройки data/feature-quality checks (Evidently, Deepchecks).
-
Понимание базовых концепций ML-моделей: обучение - валидация - деплой - мониторинг
Организационные вопросы:
- График работы: с 9 до 18;
- Оформление: по ТК РФ;
- Бонусы от работы в аккредитованной IT-компании: IT-ипотека и отсрочка от армии;
- Работа из офиса или удаленно на выбор.
После отклика с тобой свяжется наш рекрутер. Проведет предварительный скрининг, ответит на все вопросы и организует техническое интервью (если по требованиям всё ок).
Опубликована 18 часов назад