Ведущий инженер по прикладному ИИ (Senior Applied AI Engineer)

По договоренности


Мы ищем ведущего специалиста по прикладному ИИ, который будет создавать промышленные AI‑системы для обработки документов в масштабе. Вы будете проектировать и внедрять продуктовые функции, основанные на агентных подходах, мультимодальности и автоматизированной оценке качества: извлечение данных, рассуждение, генерация, оркестрация. Вы будете отвечать за всё — от архитектуры и экспериментов до латентности, стоимости, надёжности и влияния на пользовательский опыт.

Роль сочетает разработку собственных моделей с интеграцией LLM‑API, чтобы создавать интеллектуальные, готовые к эксплуатации функции. Вы будете работать на всём жизненном цикле: от подготовки обучающих данных и тонкой настройки моделей до проектирования retrieval‑пайплайнов и развёртывания производительных систем инференса в облаке.

Обязанности

  • Решать задачи в области интеллектуальной обработки документов: OCR, структурированное извлечение данных, разбивка на чанки, layout‑aware парсинг, преобразование PDF в заданную схему данных.

  • Проектировать и внедрять RAG‑пайплайны с использованием векторных баз данных, гибридного поиска, реранжирования и структурированной сборки контекста.

  • Интегрировать облачные LLM‑API (OpenAI, Anthropic) в продуктовые функции, а там, где это необходимо, использовать собственные небольшие модели.

  • Строить и дообучать трансформерные модели для задач классификации, извлечения данных, ранжирования и генерации.

  • Разрабатывать масштабируемые сервисы инференса с использованием vLLM, батчирования, стриминга, кэширования и других оптимизаций задержек и стоимости.

  • Проектировать и поддерживать Python‑микросервисы и REST API (FastAPI) для внутренних AI‑ и NLP‑пайплайнов.

  • Создавать MCP‑сервисы (Model Control & Processing) для взаимодействия с LLM, векторными хранилищами и пайплайнами обработки.

  • Разрабатывать CI/CD и пайплайны развёртывания для AI‑продуктов (GitHub + Docker + Cloud Run + Terraform).

  • Обеспечивать бесшовное взаимодействие между инфраструктурной командой и командами NLP/ML, помогая внедрять фичи и оптимизировать сервинг моделей.

  • Развивать и поддерживать мониторинг, наблюдаемость и логирование (Prometheus, Grafana, OpenTelemetry).

  • Создавать внутренние инструменты разработки и SDK для ускорения экспериментов и вывода в продакшен AI‑команды.

  • Участвовать в реагировании на инциденты и оптимизировать производительность систем в различных окружениях.

  • Создавать промышленные пайплайны для обучения, оценки, управления промптами/версиями моделей и развёртывания.

  • Определять и повышать качество AI‑решений с помощью офлайн‑эвалюаций, регрессионных наборов данных и метрик на уровне конкретных задач (точность, латентность, надёжность).

Требования

  • Сильный Python‑бэкграунд: написание промышленного кода, тесты, поддержка архитектуры сервисов. Опыт разработки микросервисов и REST API (FastAPI).

  • Практический опыт работы с PyTorch и HuggingFace: обучение, тонкая настройка, инференс, отладка моделей.

  • Глубокое понимание внутреннего устройства трансформеров: токенизация, эмбеддинги, стратегии декодирования, оценка качества.

  • Опыт интеграции OpenAI / Anthropic в реальные пользовательские продукты (не только прототипы).

  • Реальный опыт создания RAG‑систем: чанкинг, эмбеддинг‑пайплайны, векторный поиск, реранжирование, сборка контекста, снижение галлюцинаций.

  • Опыт работы с OCR, парсингом PDF, извлечением таблиц и форм, нормализацией «грязных» реальных данных.

  • Опыт построения масштабируемых систем инференса/модельного сервинга; знакомство с vLLM или аналогичными стеками будет плюсом.

  • Умение отлаживать проблемы качества моделей на уровне промптов, retrieval, данных, эвалюационных наборов и поведения инференса.

  • Готовность поддерживать системы в эксплуатации: развёртывание, мониторинг, отладка инцидентов, итеративное улучшение.

  • Опыт работы с CI/CD (GitHub Actions или аналоги), Docker, Cloud Run (или GKE), Terraform.

  • Свободный английский (команда международная)

    Будет плюсом

  • Опыт развёртывания ML/AI‑сервисов с Docker на GCP (Cloud Run, GKE).

  • Опыт работы с OpenTelemetry, Prometheus, Grafana или аналогичными инструментами наблюдаемости.

  • Сильный бэкграунд в области распознавания документов, OCR, структурированного парсинга PDF.

  • Опыт оптимизации инференса по латентности и стоимости (батчирование, кэширование, маршрутизация, спекулятивное декодирование).

    Условия работы

  • Удалённый формат (обсуждаемо).

  • Работа в команде профессионалов над продуктом с высокой нагрузкой и миллионной аудиторией.

  • Возможность влиять на архитектуру и технологический стек.

  • Конкурентная заработная плата.


Поделиться:

Опубликована 2 дня назад

Похожие вакансии

180 000 ₽
DARS –федеральный застройщик с весомым опытом создания объектов жилого и высокотехнологичного строительства. Компания строит в 6 регионах России, насчитывая свыше 1200 сотрудников. Именно люди – ключевой фактор DARS, позволяющий добиваться лидерства ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании DARS, группа компанийDARS, группа компаний
  • Москва
4 дня назад
BASIS — разработчик программных продуктов для оказания облачных услуг и платформы динамической инфраструктуры. Компания BASIS занимается поставкой и интеграцией решений виртуализации крупнейшим государственным и коммерческим заказчикам. Мы занимаем а...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании БАЗИСБАЗИС
  • Москва
10 дней назад
Чем Вам предстоит заниматься: Развитие существующей автоматизации на основе Jenkins (Groovy)/GitLab. Взаимодействие с разработчиками для решения задач в области автоматизации тестирования, упаковки и доставки кода. Работа с k8s для автоматизации рели...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании YADROYADRO
  • Москва
9 дней назад
Обязанности: Разработка проектной документации на стадиях "П" и "Р" раздел КЖ под руководством главного специалиста (жилые многоэтажные дома, детские сады, школы); Выполнение чертежей, пояснительных записок, расчетов. Требования: Опыт работы в проект...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании СпектрСпектр
  • Москва
17 дней назад
от 180 000 ₽
Обязанности: Разработка проектной документации на стадии П и Р, марки КЖ, КМ, КР для жилых и общественных зданий; Выполнение расчётов конструкций; Согласование проектных решений со смежными разделами; Участие в производственных совещаниях и в совещан...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании АрхиградАрхиград
  • Москва
19 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.