Python Backend Developer (AI Platform, LLM Systems) / Python‑бэкенд‑разработчик
По договоренности
- Беляево
- Коньково
- Юго-Западная
В связи с расширением и вводом новых должностей РНИМУ им. Н.И. Пирогова требуется Frontend react разработчик
О вакансии
РНИМУ развивает собственную AI-платформу для задач образования, науки и внутренних цифровых сервисов университета. В команду платформенного контура ищем опытного Python backend-разработчика.
Вам предстоит разрабатывать backend-сервисы платформы: обработку пользовательских запросов, диалоговые сервисы (в том числе на базе Rasa), исполнение агентных сценариев и интеграции с внутренними системами университета.
Платформа развивает диалоговое и агентное ядро, обеспечивающее маршрутизацию запросов, вызовы инструментов и взаимодействие с внешними и внутренними сервисами. Архитектура платформы строится вокруг оркестрации запросов: пользовательские обращения проходят через цепочки вызовов сервисов, при необходимости обогащаются данными из RAG-контура и внешних источников, после чего формируется проверяемый и воспроизводимый результат.
Ключевая зона ответственности — разработка надежных backend-компонентов, работающих с распределенными цепочками вызовов, внешними и внутренними API, LLM-сервисами и состоянием пользовательских сессий с учетом задержек, ограничений и нестабильности таких систем.
Работа ведется в существующем контуре AI-инфраструктуры (Kubernetes, Kubeflow, MLflow, vLLM, MinIO, GPU-кластер, NVIDIA GPU Operator, Volcano) с разделением на окружения разработки, тестирования и промышленной эксплуатации.
Задачи
• Разработка backend-компонентов AI-платформы на Python
• Разработка и развитие backend-сервисов платформы: обработка пользовательских запросов, оркестрация вызовов и исполнение агентных сценариев
• Проектирование и реализация API и интеграционных сервисов для взаимодействия с внутренними системами и внешними сервисами
• Реализация логики оркестрации: маршрутизация запросов, управление цепочками вызовов и выполнение сценариев с участием нескольких сервисов
• Интеграция LLM-сервисов, инструментальных сервисов платформы и RAG-контура
• Управление состоянием пользовательских сессий и контекстом взаимодействия
• Обеспечение надежности сервисов: обработка ошибок, идемпотентность, контроль повторных вызовов, работа с таймаутами и нестабильными внешними зависимостями
• Реализация логирования, трассировки и диагностики распределенных цепочек запросов
• Участие в развитии архитектуры платформенных компонентов, диалогового и агентного ядра
• Взаимодействие с AI/LLM-командой при разработке и интеграции интеллектуальных сценариев
Требования
• Уверенное владение Python 3
• Коммерческий опыт backend-разработки от 4 лет
• Опыт разработки сложных backend-сервисов (не только CRUD)
• Опыт разработки backend-сервисов на современных Python-фреймворках (FastAPI, aiohttp и др.)
• Опыт разработки и сопровождения API в промышленной эксплуатации
• Уверенное понимание асинхронного Python: asyncio, конкурентное выполнение, управление таймаутами и повторными попытками
• Опыт построения интеграционных сервисов с несколькими внешними и внутренними API
• Уверенное знание PostgreSQL (оптимизация запросов, индексы, транзакции)
• Опыт проектирования схем данных и работы с конкурентным доступом
• Опыт работы с Redis или аналогичными in-memory хранилищами
• Опыт работы с Docker
• Практический опыт работы с Kubernetes: деплой сервисов, конфигурации, диагностика
• Практический опыт построения надежных сервисов: идемпотентность, обработка ошибок, дедупликация, контроль повторных вызовов, работа с таймаутами
• Опыт построения наблюдаемости: логирование, метрики, трассировка, диагностика распределенных запросов
• Опыт работы с внешними сервисами с высокой задержкой и нестабильным поведением (включая LLM/API)
• Понимание ограничений LLM и их влияния на архитектуру backend-сервисов
• Опыт работы с очередями или асинхронной обработкой задач (Celery, Kafka, RabbitMQ и др.)
Будет плюсом
• Опыт разработки систем с event-driven архитектурой
• Опыт работы с inference-серверами LLM (vLLM, TGI, KServe и др.)
• Опыт работы с RAG-подходами или поисковыми контурами
• Опыт работы с LLM-фреймворками или агентными сценариями
• Опыт работы в ML/AI-инфраструктуре или смежных проектах
• Опыт работы с GPU-инфраструктурой или планировщиками задач (Volcano, GPU Operator и др.)
Что важно для нас
• Умение проектировать надежные backend-системы, а не только CRUD-сервисы
• Умение разбираться в распределенных цепочках вызовов и диагностировать сбои
• Инженерный подход к разработке: внимание к надежности, наблюдаемости и воспроизводимости решений
• Умение работать с неопределенностью и сложными системами (LLM, внешние сервисы, интеграции)
• Способность принимать архитектурные решения и нести за них ответственность
Опубликована 2 часа назад
Похожие вакансии
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва
- Полный день
- Опыт от 3 лет
- Москва