Lead AI Engineer (LLM / Agents)

По договоренности


Кто мы

EVO AI — IT-компания в области AI-консалтинга и генеративного искусственного интеллекта.
Мы разрабатываем и внедряем AI-агентов, ассистентов и комплексные AI-решения для бизнеса, а также развиваем собственную no-code платформу NovaAgent для создания и оркестрации AI-агентов.
Работаем с крупным российским и международным бизнесом.
От нас ожидают не просто технологию, а глубокое понимание бизнес-процессов и отраслевой специфики клиентов.

Коротко о роли:

Ищем Lead LLM Engineer, который будет поровну:

  • строить продакшен-системы на базе LLM (агенты, ассистенты, RAG, tool-use, evaluation, observability),
  • руководить командой инженеров (планирование, техлидство, качество, найм/менторинг).

Роль предполагает владение архитектурой end-to-end: от постановки задачи и дизайна решений до вывода в прод, поддержки и развития.

Задачи:

50% Hands-on

  • Проектирование и разработка агентских систем: orchestration, multi-agent, planning/execution loops, memory, tool calling.
  • Построение ассистентов: диалоги, контекст, персонализация, безопасность, обработка ошибок и деградаций.
  • Реализация RAG: ingest pipelines, chunking, embeddings, hybrid search, reranking, цитирование источников, защита от hallucinations.
  • Интеграция с инструментами/сервисами: внутренние API, БД, очереди, файловые хранилища, CRM/ERP и т.д.
  • Evals & качество: тест-наборы, golden datasets, автоматические проверки, A/B, regression, red-teaming.
  • Наблюдаемость: трассировки, метрики, логирование, cost/latency оптимизация, rate limits.
  • Участие в выборе моделей, fine-tuning/LoRA/PEFT при необходимости, prompt/system design.

50% Управление и техлидство:

  • Руководство командой инженеров (ML/Backend/Platform): цели, roadmap, декомпозиция, приоритизация, delivery.
  • Построение инженерных практик: code review, CI/CD, quality gates, incident management, SDLC.
  • Менторинг: рост инженеров, найм, адаптация, performance feedback.
  • Коммуникации со стейкхолдерами: формирование требований, критериев успеха, SLA/SLO.

Требования:

Опыт разработки LLM-продуктов в продакшене: ассистенты/агенты/RAG/tool-use.

  • Сильный software engineering бэкграунд: архитектура сервисов, API, интеграции, отказоустойчивость.
  • Опыт people lead (минимум 3–5 человек) или устойчивый опыт техлидства с ответственностью за поставку.
  • Практики качества: тестирование, evals, мониторинг, работа с инцидентами.
  • Умение переводить бизнес-задачу в техрешение и метрики результата.

Технологический стек:

LLM / Agents / Assistants

  • Agent frameworks: LangGraph / LangChain, LlamaIndex, Semantic Kernel (или аналоги)
  • Tool calling, function routing, planners/executors, multi-agent patterns
  • Prompt/system design, structured outputs (JSON schema, constrained decoding), guardrails

RAG / Search:

  • Vector DB: pgvector / Postgres, Pinecone / Weaviate / Milvus / Qdrant
  • Search: Elasticsearch / OpenSearch, hybrid search, rerankers (cross-encoders)
  • Pipelines: ingestion, chunking, metadata, dedup, doc lifecycle

Backend / Data / Infra:

  • Python (FastAPI), возможно TypeScript/Node.js
  • Async/queues: Kafka / RabbitMQ / Redis Streams, background workers (Celery/RQ)
  • Storage: Postgres, Redis, S3-совместимые хранилища
  • Containerization: Docker, orchestration: Kubernetes
  • CI/CD: GitHub Actions/GitLab CI, IaC (Terraform — плюс)

Observability / Evals:

  • Tracing: OpenTelemetry
  • Monitoring: Prometheus/Grafana
  • LLM observability: Langfuse / Phoenix / Arize (или аналоги)
  • Evals: RAG eval, LLM-as-a-judge, human feedback loops, safety testing

MLOps / Model ops (по необходимости)

  • Fine-tuning: PEFT/LoRA, vLLM/TGI, model serving
  • Cost/latency optimization: caching, batching, token budgets

Будет плюсом:

  • Опыт построения “enterprise” ассистентов: роли/права, аудит, DLP, PII masking, безопасность.
  • Опыт on-prem / air-gapped контуров.
  • Опыт создания внутренних платформ для команд (SDK, templates, best practices).
  • Опыт работы с многоязычными сценариями (RU/EN), длинным контекстом, сложными документами.

Мы предлагаем:

  • Полностью удалённый формат работы.

  • Участие в ML- проектах федерального уровня.

  • Работа в сильной команде экспертов, где ценится открытость, качество и развитие.


Поделиться:

Опубликована 18 часов назад

Похожие вакансии

Стек на проекте: 1) Openshift / k8s; 2) Linux; 3) ELK; 4) Prometheus; 5) Zabbix; 6) Rabbit MQ; 7) Nginx; 8) Postgresql; 9) Jenkins 10) CI/CD Чем предстоит заниматься: Ввод в экслплуатацию и оптимизация работы информационных систем построенных на микр...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Т1Т1
  • Москва
17 часов назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer СТД на 6 месяцев (Удаленно ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
3 дня назад
до 250 000 ₽
Выше средней на 25%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer на Срочный трудовой договор ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
4 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли QA Automation Engineer (Python) и работать над проектом заказчика. ... опыт работы в роли QA Automation Engineer (Python) от 3-х лет; опыт работы в качестве QA-инженера; опыт ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
4 дня назад
Продуктовая IT-компания, разрабатывающая сервис на базе искусственного интеллекта для анализа телефонных ... Ищем DevOps / Infrastructure Engineer на частичную занятость, который возьмёт на себя поддержку и развитие ... Компания имеет государственную IT-аккредитацию.
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании Hi, Rockits!Hi, Rockits!
  • Москва
5 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли QA Automation Engineer (Java) и работать над проектом заказчика. ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.