LLM/RAG/AI Engineer (Middle, Giga B2B "Салют для Бизнеса")

По договоренности

  • Белорусская
  • Маяковская
  • Тверская

Мы - команда ООО "Салют для бизнеса", дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.

Обязанности:

  • Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
  • Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
  • Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
  • Настраивать и оптимизировать векторный и гибридный поиск
  • Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
  • Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
  • Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
  • Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
  • Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

  • Опыт работы от 3х лет
  • Опыт работы с AI инструментами: от года
  • Опыт создания RAG-систем
  • Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
  • Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
  • LangChain, LlamaIndex
  • LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
  • Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
  • Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
  • Embedding-модели: e5, bge, multilingual-e5
  • Python, Git, Docker, docker-compose
  • PostgreSQL, Redis
  • Методы оценки: hit rate, RAGAS, human evaluation
  • Способность объяснить принятые технические решения и их trade-offs

Условия

  • достойная заработная плата + годовой бонус
  • сильная команда
  • ДМС, с первого рабочего дня
  • работа в аккредитованной IT компании
  • льготная ипотека от Сбера
  • локация: Москва, м. Цветной бульвар.

Адрес: Россия, Москва, Цветной бульвар
Показать на большой карте

Поделиться:

Опубликована 21 день назад

Похожие вакансии

Managing the inventory for all local IT equipment. ... Act as an escalation to global or local IT issues to the BTS IT Director or global reporting line. ... Minimum 2 years in a supervisor IT support role and overall, 5+ years’ experience in IT.
  • Полный день
  • Опыт от 3 лет
Логотип компании AbbVieAbbVie
  • Москва
8 дней назад
Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
21 день назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Processing Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
13 часов назад
Сейчас у нас открыта вакансия Enterprise Engineer в команду, которая занимается поддержкой, обслуживанием ... Экспертная поддержка территориально распределённых IT-подразделений. ... Экспертная поддержка территориально распределенных IT-подразделений.
  • Полный день
  • Опыт от 3 лет
Логотип компании Леста ИгрыЛеста Игры
  • Москва
5 дней назад
Sales Engineer - сотрудник, который знает как общаться с заказчиками на бизнесовом языке, погружен в ... Понимание процесса запуска IT-проектов. ... Работа в аккредитованной IT-компании.
  • Полный день
  • Опыт от 3 лет
Логотип компании VoximplantVoximplant
  • Москва
2 дня назад
С 2006 года создаём масштабируемые и надёжные IT-продукты для крупных брендов: Hoff, Gloria Jeans, Мегафон ... Мы ищем Middle QA Engineer, который готов сочетать ручное тестирование с написанием автотестов и влиять ...
  • Полный день
  • Опыт от 3 лет
Логотип компании АЭРОАЭРО
  • Москва
13 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.