LLM/RAG/AI Engineer (GigaChat Enterprise)
По договоренности
- Белорусская
- Маяковская
- Тверская
Мы - команда GigaChat Enterprise, дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.
Обязанности:
- Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
- Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
- Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
- Настраивать и оптимизировать векторный и гибридный поиск
- Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
- Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
- Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
- Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
- Контейнеризировать и деплоить решения на on-prem инфраструктуру
Требования
- Опыт работы от 3х лет
- Опыт работы с AI инструментами: от года
- Опыт создания RAG-систем
- Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
- Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
- LangChain, LlamaIndex
- LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
- Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
- Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
- Embedding-модели: e5, bge, multilingual-e5
- Python, Git, Docker, docker-compose
- PostgreSQL, Redis
- Методы оценки: hit rate, RAGAS, human evaluation
- Способность объяснить принятые технические решения и их trade-offs
Условия
- достойная заработная плата + годовой бонус
- сильная команда
- ДМС, с первого рабочего дня
- работа в аккредитованной IT компании
- льготная ипотека от Сбера
- локация: Москва, м. Цветной бульвар.
Адрес: Россия, Москва, Цветной бульвар
Опубликована 15 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ОФИС В МСК ФОРМАТ РАБОТЫ ...
- Полный день
- Опыт от 3 лет
- Москва
14 часов назад
до 210 000 ₽
Выше средней на 16%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Analyst/Engineer.
- Полный день
- Опыт от 3 лет
- Москва
14 часов назад
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer ФУНКЦИОНАЛЬНЫЕ ОБЯЗАННОСТИ ...
- Полный день
- Опыт от 3 лет
- Москва
15 часов назад
... взаимодействие с Data Analyst для глубокого понимания бизнес-контекста и feature engineering, с Data Engineer ... — по вопросам пайплайнов данных, с AI Engineer — для вывода результатов ML моделей в AI решения, использования ... Мы ждем от кандидата (требования): Высшее образование в IT/математике/data science опыт 2–4 года в ML-проектах ...
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media ... Предлагаем присоединиться в роли DevOps Engineer и работать над проектом заказчика.
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
до 210 000 ₽
Выше средней на 16%
Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика.
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Вакансия в подборках
Похожие вакансии
до 210 000 ₽