- Работа в Санкт-Петербурге
- Удаленно
- IT engineer
- LLM/ML Engineer
LLM/ML Engineer
По договоренности
г Санкт-Петербург, ул 11-я Красноармейская, д 18-20
Обязанности:
- Разработка, оптимизация и поддержка пайплайнов обучения и инференса LLM и ML моделей.
- Интеграция LLM решений в бизнес-процессы (например, чат-боты, автоматизация коммуникаций, генерация описаний товаров, анализ клиентских обращений).
- Настройка и поддержка инфраструктуры для деплоя LLM (GPU, FastAPI, Kubernetes, inference-слои).
- Оптимизация моделей (quantization, distillation, sparsity), снижение стоимости и времени инференса.
- Поддержка CI/CD процессов для ML/LLM пайплайнов, настройка мониторинга качества моделей.
- Участие в проектировании feature stores и подготовке экспериментальных витрин (совместно с Data Scientists и Data Engineers).
- Документирование архитектуры, подходов к деплою и best practices.
- Взаимодействие с Data Engineering и бизнес-командами для масштабирования и поддержки решений.
Требования:
- Опыт разработки ML/LLM решений и деплоя моделей в production — от 2 лет.
- Отличное знание Python, включая ML/DL-стек (PyTorch, TensorFlow, Transformers, Hugging Face).
- Опыт работы с LLM (fine-tuning, RAG, кастомизация под бизнес-задачи).
- Глубокое понимание архитектуры inference пайплайнов (FastAPI, Triton Inference Server, ONNX).
- Опыт работы с GPU (CUDA, управление нагрузкой, профилирование).
- Понимание CI/CD для ML (Kubeflow, MLflow, Argo, GitLab CI).
- Знание принципов мониторинга моделей (drift detection, логирование, метрики качества).
- Опыт работы с объектными хранилищами (S3), Spark и Data Lake House архитектурой.
Будет плюсом:
- Опыт оптимизации больших языковых моделей (LLM quantization, pruning, distillation).
- Знание архитектуры real-time inference (low-latency приложения).
- Опыт интеграции LLM в клиентские каналы (мессенджеры, CRM, e-commerce).
- Понимание GDPR/ФЗ-152 и data privacy.
Поделиться:
Опубликована месяц назад