LLM/ML Engineer

По договоренности


Обязанности:

  • Разработка, оптимизация и поддержка пайплайнов обучения и инференса LLM и ML моделей.
  • Интеграция LLM решений в бизнес-процессы (например, чат-боты, автоматизация коммуникаций, генерация описаний товаров, анализ клиентских обращений).
  • Настройка и поддержка инфраструктуры для деплоя LLM (GPU, FastAPI, Kubernetes, inference-слои).
  • Оптимизация моделей (quantization, distillation, sparsity), снижение стоимости и времени инференса.
  • Поддержка CI/CD процессов для ML/LLM пайплайнов, настройка мониторинга качества моделей.
  • Участие в проектировании feature stores и подготовке экспериментальных витрин (совместно с Data Scientists и Data Engineers).
  • Документирование архитектуры, подходов к деплою и best practices.
  • Взаимодействие с Data Engineering и бизнес-командами для масштабирования и поддержки решений.

Требования:

  • Опыт разработки ML/LLM решений и деплоя моделей в production — от 2 лет.
  • Отличное знание Python, включая ML/DL-стек (PyTorch, TensorFlow, Transformers, Hugging Face).
  • Опыт работы с LLM (fine-tuning, RAG, кастомизация под бизнес-задачи).
  • Глубокое понимание архитектуры inference пайплайнов (FastAPI, Triton Inference Server, ONNX).
  • Опыт работы с GPU (CUDA, управление нагрузкой, профилирование).
  • Понимание CI/CD для ML (Kubeflow, MLflow, Argo, GitLab CI).
  • Знание принципов мониторинга моделей (drift detection, логирование, метрики качества).
  • Опыт работы с объектными хранилищами (S3), Spark и Data Lake House архитектурой.

Будет плюсом:

  • Опыт оптимизации больших языковых моделей (LLM quantization, pruning, distillation).
  • Знание архитектуры real-time inference (low-latency приложения).
  • Опыт интеграции LLM в клиентские каналы (мессенджеры, CRM, e-commerce).
  • Понимание GDPR/ФЗ-152 и data privacy.


Поделиться:

Опубликована месяц назад

Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.