ML-инженер
По договоренности
- Кропоткинская
- Парк культуры
- Фрунзенская
Росгосстрах сейчас активно развивает внутреннюю платформу - экосистему AI-сервисов для автоматизации ключевых процессов компании. Для этого формируем новую команду, которая будет фокусироваться на улучшении ключевых метрик моделей, минимизацию временных затрат на их разработку и выведению в промышленную эксплуатацию.
Ключевой стек:
Оркестрация и деплой: Kubernetes, Docker
ML-инфраструктура: Airflow, MLflow, Jfrog Artifactory
Бэкенд и API: FastAPI, Pydantic, SQLAlchemy, asyncpg
Базы данных: PostgreSQL, Redis, ArangoDB, OpenSearch
Языки и инструменты: Python, Bash, Git
CI/CD и VCS: Bitbucket, Bamboo
Что предстоит:
- Работа с уже существующими ML-моделями: встраивание в бизнес-процессы, масштабирование и вывод в продакшен;
- Настройка и поддержка пайплайнов и сервисов для batch- и online-инференса;
- Разработка и отладка DAG-ов в Airflow;
- Контейнеризация сервисов и эксплуатация моделей в Kubernetes;
- Разработка и поддержка API на FastAPI для интеграции моделей;
- Обеспечение стабильной работы ML-сервисов в продакшене;
- Версионирование моделей и управление артефактами;
- Оптимизация инференса и контроль использования ресурсов;
- Участие в развитии инфраструктуры полного жизненного цикла ML-моделей.
- Опыт работы в области MLOps/ML-engineer от 3 лет;
- Понимание ML-алгоритмов и жизненного цикла модели:
- от постановки задачи, экспериментов и версионирования до деплоя и мониторинга в продакшене;
- знаете, как работают бустинги;
- чем трансформеры (LLM) отличаются от классических сетей;
- знаете, что такое эмбеддинги и для чего они применяются.
- Python и FastAPI:
- уверенное владение асинхронным/многопоточным программированием (asyncio, threading, multiprocessing);
- ООП с принципами SOLID;
- проектирование поддерживаемых, документированных и высоконагруженных API;
- Работа с SQLAlchemy, асинхронными драйверами базы данных.
- Airflow: разработка и отладка DAG-ов для batch-инференса моделей;
- Контейнеризация и оркестрация: работа с Docker и Kubernetes — опыт эксплуатации production-кластеров, настройка лимитов;
- Работа с базами данных: SQL, NoSQL - владение реляционными БД для хранения структурированных данных.
Является преимуществом:
- KServe / Seldon / TorchServe — опыт развертывания моделей на inference-платформах.
- Triton Inference Server — оптимизация инференса, динамическое батчирование, работа с разными бекендами (TensorRT, ONNX).
- опыт инференса больших языковых моделей (vLLM, llama), оптимизация GPU-памяти, continuous batching.
- Агенты: опыт проектирования агентных систем, работа с LangChain, LlamaIndex, LangGraph
- Real-time системы: Kafka, RabbitMQ, streaming-инференс, Faust.
Мы предлагаем:
- Полностью "белая" зарплата, премии;
- График работы 5/2;
- Возможен удаленный формат работы;
- Подключение к ДМС после успешного прохождения испытательного срока;
- Корпоративные скидки на страховые продукты (автострахование, ВЗР и т.д.);
- Корпоративные скидки на фитнес, магазины-партнёры, книги и др.;
- Электронная библиотека с более чем 3000 книг на самые актуальные темы;
- Специальные мероприятия для сотрудников и их детей, подарки на Новый год.
Адрес: Россия, Москва, Киевская улица, 7
Опубликована 5 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX 150 000 - 250 000 ₽
Выше средней на 11%
... согласование технических решений Сопровождение проектной документации в экспертизах Требования: Опыт работы инженером-проектировщиком ...
- Можно удаленно
- Подработка
- Опыт от 3 лет
- Москва
день назад
«Русский Экспресс» — крупный туристический холдинг, предлагающий пакетные и динамические туры, индивидуальные маршруты любой сложности, а также отдельные услуги по всему миру. «Русский Экспресс» имеет репутацию надежной и устойчивой компании, входит ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
Группа Компаний Орбита - ведущий разработчик цифровых решений, российская аккредитованная ИТ-компания Масштабный технологический проект с глубокой экспертизой в цифровизации бизнеса. Ключевые отрасли: государственный сектор, FinTech, HR Tech, коммуни...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
Мы ищем инженера, специализирующегося на инфраструктуре и производительности вывода машинного обучения ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
250 000 - 400 000 ₽
Выше средней на 80%
Обязанности: Конфигурировать и разворачивать инфраструктуру: JupyterHub, Coder, Airflow, Argo Workflows, MLflow, Seldon Core. Разрабатывать с нуля автоматизированные пайплайны под бизнес-задачи: ускорять AutoML с 2 часов до 20 минут, интегрировать LL...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
Вакансия в подборках
Похожие вакансии
150 000 - 250 000 ₽