MLOps Engineer / Инженер ML-инфраструктуры
По договоренности
Привет, мы — NGENIX — команда профессионалов, которая ежедневно делает Рунет безопасной средой для бизнеса. Нам есть что рассказать о доступности, защите и ускорении веб-приложений, ведь это то, чем мы занимаемся уже 17 лет! Слышали про UDP flood, credential stuffing, скальпинг, DNS cache poisoning? Мы такое знаем и отражаем.
Правда, защита от киберугроз — не единственная сфера нашего интереса. Нам доверяют: Золотое Яблоко, OBI, CDEK.Shopping, Kari, ROSTIC`S и сотни других компаний. Мы помогаем клиентам справляться с высокими нагрузками даже в периоды больших распродаж на маркетплейсах или громких премьер в онлайн-кинотеатрах. Обеспечиваем постоянную доступность веб-ресурсов, чтобы миллионы пользователей легко взаимодействовали с сайтами и приложениями наших заказчиков.
Ищем инженера для построения внутренней ML-платформы с нуля. Главная цель — систематизация жизненного цикла моделей и организация эффективной работы дата-аналитиков.
Обязанности:- Разработать и внедрить комплексную MLOps-платформу на базе ClickHouse:
- Обеспечить извлечение и трансформацию данных (feature engineering) в ClickHouse.
- Спроектировать и реализовать Feature Store.
- Построить автоматизированный ML-пайплайн (подготовка, обучение, валидация, деплой, мониторинг).
- Внедрить систему версионирования для обеспечения воспроизводимости экспериментов.
- Создать и настроить централизованную среду для Data Science:
- Развернуть и интегрировать инструменты для экспериментов (JupyterHub/Lab, MLflow/KubeFlow или аналоги).
- Автоматизировать цикл «данные → модель → прод»:
- Реализовать процессы ETL.
- Обеспечить автоматическую подготовку данных для обучения моделей.
- Внедрить CI/CD для автоматического деплоя и мониторинга моделей в production.
- Подготовить документацию и обучить пользователей платформы:
- Разработать документацию для архитектуры, процессов и использования платформы.
- Создать обучающие материалы и best practices для пользователей.
- Опыт построения ML-пайплайнов end-to-end: от данных до деплоя модели в прод (2+ года в MLOps / Data Engineering с ML-фокусом);
- Опыт работы с ClickHouse или аналогичными колоночными СУБД;
- ETL / оркестрация: Airflow, KubeFlow или аналоги;
- Трансформация данных: dbt, materialized views, SQL-пайплайны для подготовки фичей;
- Контейнеризация и инфраструктура: Docker, Kubernetes;
- CI/CD для ML: автоматизация обучения, тестирования и деплоя моделей;
- Эксперимент-трекинг и реестр моделей: MLflow или аналоги;
- Python — уверенный уровень;
- Опыт настройки JupyterHub / аналогичных сред для команды.
Будет плюсом:
-
Опыт построения ML-платформ с нуля;
-
Опыт работы с потоковой обработкой данных (Kafka);
-
Опыт менторства или организации процессов для команд data-аналитиков;
-
Опыт работы data-аналитиком или data-scientist.
Опубликована 5 часов назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва