AI Engineer

По договоренности


Обязанности:
  • Разработка production NLP/LLM-решений: поиск, классификация, извлечение, суммаризация, Q&A/ассистенты.
  • Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, контракты инструментов, обработка ошибок, управление контекстом/состоянием.
  • Реализация knowledge Q&A / RAG: подготовка данных, индекс/поиск, эмбеддинги, reranking, grounding/цитирование, контроль качества.
  • Интеграция в корпоративную среду: сервисы и API, внутренние API/БД, очереди/воркеры, фоновые задачи.
  • Эксплуатация и улучшение: логи/метрики/трейсы, диагностика, регрессии качества/производительности.
  • Оптимизация инференса: latency/throughput, лимиты/контекст, кэширование/батчинг, квантование.
  • Опционально: адаптация под домен (PEFT/LoRA/QLoRA) с оценкой
Требования:
  • Образование: высшее техническое / ИТ.
  • Опыт: 3–5 лет разработки и поддержки production-сервисов в области NLP/LLM.
  • LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
  • RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
  • Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
  • Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
  • Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
  • Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.

Будет Плюсом:

  • Langfuse или аналоги (on-prem): трассировка/метрики/eval.
  • LiteLLM или аналоги: gateway/router, маршрутизация, лимиты.
  • OpenWebUI или аналоги: интеграция с retrieval/RAG и логированием.
  • Workflow orchestration: Temporal / Airflow / Prefect / Dagster / Argo; принципы идемпотентности, ретраев/таймаутов, зависимостей шагов, long-running процессов, сигналов/HITL, наблюдаемости выполнения.
  • MCP (Model Context Protocol): подключение инструментов по протоколу, контракт инструментов, безопасность/изоляция, наблюдаемость вызовов.
  • Self-hosted inference/serving: vLLM / TGI / Triton или аналоги; оптимизации GPU-инференса.
Условия:
  • Удалённый формат работы
  • Официальное оформление по ТкРФ, белая ЗП по результатам технического собеседования;
  • График работы 5/2 с 8:30 до 17:30 по Москве;
  • Премии за эффективную работу и достижение результатов;
  • Различные программы обучения для прокачки профессиональных скиллов;
  • ДМС программа

Поделиться:

Опубликована 9 дней назад

Похожие вакансии

Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. Направление работы: Наша компания непрерывно разв...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
день назад
На позиции Senior QA Engineer Вам предстоит заниматься: проведением функционального, интеграционного и регрессионного тестирования веб-приложения, разработкой тестовой стратегии и участием в оценке трудозатрат на тестирование, анализом требований, пр...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Комзолов Николай ВладиславовичКомзолов Николай Владиславович
  • Москва
день назад
СберЗдоровье - крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины. Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинс...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании СберЗдоровьеСберЗдоровье
  • Москва
2 дня назад
Продамус — аккредитованная, продуктовая IT-компания, создающая цифровые сервисы для бизнеса. Мы разрабатываем Fintech-решения и инструменты для автоматизации: системы приёма платежей, LMS-платформу для управления обучением, сервисы для вебинаров и он...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ПродамусПродамус
  • Москва
день назад
210 000 - 275 000 ₽
Ищем Data Engineer на проект дочки ВТБ. О проекте: компания работает в области инвестиционного анализа (акции, облигации, индексы, рынки и компании). Разрабатывает новый и без преувеличения инновационный цифровой продукт для российского рынка, которы...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании WIT recruitmentWIT recruitment
  • Москва
2 дня назад
до 250 000 ₽
Рыночная зарплата
Наши партнеры - крупнейшая компания FMCG в поиске QA Engineer (Middle+) Описание технического стека: Kotlin 1.6.21, Python 3.8+, PostgreSQL, React, Kubernetes, Git, S3. Вам предстоит: Планирование и оценка работ по тестированию; Проведение функционал...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ARKARK
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.