LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

По договоренности

  • Белорусская
  • Маяковская
  • Тверская

Мы - команда ООО "Салют для бизнеса", дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.

Обязанности:

  • Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
  • Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
  • Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
  • Настраивать и оптимизировать векторный и гибридный поиск
  • Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
  • Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
  • Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
  • Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
  • Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

  • Опыт работы от 3х лет
  • Опыт работы с AI инструментами: от года
  • Опыт создания RAG-систем
  • Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
  • Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
  • LangChain, LlamaIndex
  • LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
  • Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
  • Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
  • Embedding-модели: e5, bge, multilingual-e5
  • Python, Git, Docker, docker-compose
  • PostgreSQL, Redis
  • Методы оценки: hit rate, RAGAS, human evaluation
  • Способность объяснить принятые технические решения и их trade-offs

Условия

  • достойная заработная плата + годовой бонус
  • сильная команда
  • ДМС, с первого рабочего дня
  • работа в аккредитованной IT компании
  • льготная ипотека от Сбера
  • локация: Москва, м. Цветной бульвар.

Адрес: Россия, Москва, Цветной бульвар
Показать на большой карте

Поделиться:

Опубликована 7 дней назад

Похожие вакансии

Мы расширяем команду и ищем опытного Специалист технической поддержки / IT Support Engineer (L1–L2) Что ...
  • Полный день
  • Опыт от 3 лет
Логотип компании red_mad_robotred_mad_robot
  • Москва
20 дней назад
Johnson &Johnson is looking for a talented Reliability Engineer to join our Russia-based IT organization ... Reliability Engineer will be responsible for ensuring the reliability, availability, and performance ... Proven experience as a Reliability Engineer, Site Reliability Engineer, or similar role supporting enterprise-scale ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Johnson & JohnsonJohnson & Johnson
  • Москва
3 дня назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER в офис в Москве.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
6 часов назад
Международная IT-компания, специализирующаяся на создании высоконагруженных онлайн-сервисов ищет в команду ... Кого ищем: Опыт работы в роли DWH Developer / Data Engineer / Database Developer от 3х лет.
  • Полный день
  • Опыт от 3 лет
Логотип компании ТопассистентТопассистент
  • Москва
3 дня назад
Опыт работы на позиции Data Scientist (Machine Learning или Deep Learning Engineer) от 3-4 лет. ... Что мы предлагаем: Работу в аккредитованной IT-компании. Расширенный полис ДМС.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
6 дней назад
Мы в поиске Data Engineer для создания и поддержки витрин данных, использующихся для задач машинного ... страхование для семьи корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
6 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.