Почему у нас тебе понравится:

Большой пул проектов — сможешь переходить в разные команды и не выгорать от однообразия;
Только крупные известные бренды — ты приобретешь бесценный опыт разработки/управления разработкой продукта или сервис для крупного банка, завода или авиакомпании;
Прозрачные понятные процессы — будешь заниматься только своей любимой разработкой, а не часами разбираться “что здесь происходит”;
Внимательный и тщательный онбординг в компанию;
Компенсация на обеды в кафе и ресторанах, а также большой выбор скидок от партнеров (скоро расширим список в новых городах присутствия);
Проводим яркие мероприятия, на которых можно уйти в отрыв и отдохнуть по полной.

IBS Dunice — это команда опытных разработчиков, тестировщиков, аналитиков, дизайнеров и менеджеров. Мы создаем веб-сервисы и мобильные приложения, которыми пользуются миллионы! В компании уже больше 350 человек.

Задачи:

Создать и развивать инфраструктуру для сервисов, использующих ML/AI-модели (GPU-сервера, контейнеризированные сервисы, кластер Kubernetes).
Автоматизировать процессы поставки: CI/CD-пайплайны для обучения, тестирования и деплоя сервисов.
Настраивать мониторинг сервисов и инфраструктуры (Prometheus, Grafana), включая метрики качества моделей и данных.
Интегрировать инструменты контроля качества данных и стабильности сервисов (Evidently, Deepchecks).
Оптимизировать производительность сервисов инференса: latency, throughput, масштабирование под нагрузку.

Требования:

Уверенный опыт работы DevOps/SRE/Platform-инженером.
Глубокие знания Linux, Docker, Kubernetes, сетевых основ.
Опыт построения CI/CD (Jenkins, GitLab CI, GitHub Actions и/или Ansible).
Понимание принципов работы сервисов для инференса моделей (REST/gRPC, батчинг, ресурсы GPU/CPU).
Опыт эксплуатации распределённых систем.
Навык работы с ML-пайплайнами: хранение артефактов, версияция, автоматизация, отслеживание экспериментов (MLflow, Airflow).
Опыт настройки мониторинга (Prometheus + Grafana).

Будет плюсом

Опыт развёртывания или эксплуатации платформ для ML-оркестрации: Kubeflow, MLflow, Airflow.
Опыт работы с inference-серверами (vLLM, TGI, Triton) как с приложениями, а не обязательно понимание внутренних ML-алгоритмов.
Опыт настройки data/feature-quality checks (Evidently, Deepchecks).
Понимание базовых концепций ML-моделей: обучение - валидация - деплой - мониторинг

Организационные вопросы:

График работы: с 9 до 18;
Оформление: по ТК РФ;
Бонусы от работы в аккредитованной IT-компании: IT-ипотека и отсрочка от армии;
Работа из офиса или удаленно на выбор.

После отклика с тобой свяжется наш рекрутер. Проведет предварительный скрининг, ответит на все вопросы и организует техническое интервью (если по требованиям всё ок).

DevOps-инженер (инфраструктура ML/AI-сервисов)

115 000 - 170 000 ₽

Вакансия в подборках