LLM/RAG/AI Engineer
300 000 - 500 000 ₽
Выше средней на 100%
Обязанности:
- Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
- Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
- Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
- Настраивать и оптимизировать векторный и гибридный поиск
- Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
- Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
- Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
- Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
- Контейнеризировать и деплоить решения на on-prem инфраструктуру
Требования
- Опыт работы от 3х лет
- Опыт работы с AI инструментами: от года
- Опыт создания RAG-систем
- Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
- Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
- LangChain, LlamaIndex
- LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
- Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
- Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
- Embedding-модели: e5, bge, multilingual-e5
- Python, Git, Docker, docker-compose
- PostgreSQL, Redis
- Методы оценки: hit rate, RAGAS, human evaluation
- Способность объяснить принятые технические решения и их trade-offs
Условия
- достойная заработная плата + годовой бонус
- сильная команда
- ДМС, с первого рабочего дня
Сравнение со средней зарплатой в похожих вакансиях:
150k
250k
100k
200k
350k
Опубликована 24 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Вакансия: Data Engineer / DWH Engineer / ETL Developer Компания: FOM GROUP Формат работы: удалённо График ... : 5/2, с 9:00 до 18:00 200 000-350 000₽ О компании FOM GROUP Мы — IT-компания в фармацевтической сфере ... Ищем Data Engineer (Middle) в команду разработки хранилища данных.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
DevOps Engineer Мы расширяем команду инженерной разработки и ищем DevOps Engineer (middle) для создания ... Обсуждается индивидуально в зависимости от уровня навыков, опыта и ожиданий кандидата DigitCore — инженерная IT-компания ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... Предлагаем присоединиться в роли MLOps Engineer и работать над проектом заказчика. ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Рыночную зарплату и премии Драйвовые задачи и ресурсы для их реализации Преимущества аккредитованной it-компании ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
до 170 000 ₽
Middle+ QA engineer (Срочный трудовой договор до 01.07.) ... -10 крупнейших IT-компаний России. ... В связи с активным развитием проектов в компании открыта вакансия Middle+/Senior QA engineer.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
13 дней назад
Мы ищем AI Agent Engineer (Fullstack LLM Developer), который сможет создавать инновационные решения в ... формат работы (2 дня в неделю в офисе), Москва-Сити или удаленно из городов РФ; Работу в аккредитованной IT-компании ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад