Senior ML Engineer (LLM, RAG, Agents)

По договоренности

Газпромбанк

Москва

⚡ Откликнуться на hh.ru

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

Строить системы извлечения и анализа ключевой информации из документов (PDF/сканы/HTML/DOCX), парсинг web-сайтов;
Разрабатывать RAG-системы, включая выбор эмбеддингов, стратегии чанкинга, гибридный поиск (BM25+dense), reranking, обучение ретривера, генератора, Reward-модели, мониторинг качества;
Обучать/дообучаать LLM на multi-node/multi-GPU: SFT/PEFT/LoRA, SFT+DPO, проводить распределённое обучение (FSDP/DeepSpeed), профилировать и оптимизировать;
Отвечать за инференс и оптимизацию больших языковых моделей: внедрение и настройка vLLM, TensorRT‑LLM, Triton; реализация батчинга, спекулятивного декодирования и квантования; оптимизация соотношения качества, латентности и стоимости инференса;
Проводить оценку качества: дизайн датасетов и сценариев, автоматические метрики (RAGAS, faithfulness, precision/recall), human-in-the-loop, онлайн-эксперименты и A/B.

МЫ ЖДЕМ, ЧТО ВЫ:

Имеете не менее 5 лет опыта в области ML/DS и не менее 2 лет работы с LLM в промышленной эксплуатации, а также можете продемонстрировать подтверждённые кейсы внедрений (с метриками, ссылками или результатами);
Обладаете экспертизой в извлечении информации: умеете работать с NER, проектируете схемы и онтологии, обеспечиваете структурированный вывод (в том числе через JSON Schema и constrained decoding), выполняете постпроцессинг и валидацию данных;
Имеете практический опыт работы с RAG: владеете векторными БД (Pinecone, Weaviate, Qdrant, Milvus), реализуете гибридный поиск и rerankers, разрабатываете стратегии чанкинга и аннотации метаданными, управляете свежестью индекса;
Занимались разработкой агентных систем: работали с LangChain, LangGraph или LlamaIndex, проектировали и оркестрировали инструменты, реализовывали обработку ошибок;
Имеете опыт многоузловой и многоGPU‑тренировки LLM: владеете PyTorch, FSDP/DeepSpeed, запускаете обучение на Slurm или K8s, проводите профилирование и выявляете узкие места;
Умеете проводить fine‑tuning и организовывать инференс для открытых и проприетарных моделей (например, Qwen, Gemma), а также работаете с OpenAI API;
Уверенно владеете Python и PyTorch, хорошо знакомы с экосистемой Hugging Face (Transformers, Tokenizers, PEFT, Accelerate), имеете опыт работы с MLflow или ClearML;
Умеете работать с данными из документов: применяете OCR‑решения (VLM, PaddleOCR, Surya и др.), парсите PDF, HTML, DOC, XML;
Обладаете базовым пониманием смежных областей (классификация, кластеризация, обработка речи), чтобы корректно выбирать подход: использовать LLM или классические методы ML;
Владеете английским языком на уровне, достаточном для чтения профессиональных статей и технической документации.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

Можете предоставить ссылки на GitHub с реализованными RAG‑системами, демонстрирующими ваш практический опыт;
Имеете опыт формулирования бизнес‑требований и разработки концептуального дизайна для LLM‑приложений, включая проработку сценариев использования и функциональных спецификаций;
Умеете рассчитывать и аргументированно обсуждать с заказчиками финансовый эффект от внедрения LLM‑решений, можете привести примеры расчётов экономического эффекта из реализованных проектов;
Принимали участие в соревнованиях и хакатонах, посвящённых разработке чат‑ботов и RAG‑систем, и можете продемонстрировать достигнутые результаты или решения;
Обладаете пониманием классических NLP‑задач и имеете практический опыт их реализации (классификация текста, извлечение сущностей, суммаризация и др.), умеете сопоставлять их с возможностями LLM;
Имеете опыт в прод‑инженерии и MLOps: работаете с Docker и Kubernetes, настраиваете мониторинг (Prometheus, Grafana), внедряете CI/CD‑пайплайны, интегрируете сервисы через REST, Kafka или gRPC;
Обладаете опытом работы в доменно‑специфичных сферах с интенсивным использованием документов (финтех, юриспруденция), понимаете особенности обработки и анализа текстов в этих областях.

ЧТО МЫ ПРЕДЛАГАЕМ:

Достойный уровень вознаграждения;
ДМС со стоматологией с первого месяца работы;
Отпуск 33 дня;
Полное соблюдение ТК РФ.

⚡ Откликнуться на hh.ru

Опубликована 14 дней назад

IT Support Engineer (3 Line)

до 150 000 ₽

Technopeak.ae is a leading provider of IT solutions and services across the Middle East. As our Remote Support division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer to join our team. This role i...

Можно удаленно
Полный день
Опыт от 3 лет

Первый Бит

Москва

месяц назад

⚡ Откликнуться на hh.ru

QA Engineer for multinational IT company (manual)

Job responsibilities: Manual testing of Frontend, Backend, Mobile Apps Defects discovery and reporting; Test environment preparation (test data, settings); Tests development (test plans, checklists); Test documentation maintenance; Testing automation...

Можно удаленно
Полный день
Опыт от 3 лет

HRS

Москва

24 дня назад

⚡ Откликнуться на hh.ru

QA Automation Engineer (Python)

Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...

Можно удаленно
Полный день
Опыт от 3 лет

Aston

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Дата инженер

Мы строим корпоративную дата-платформу следующего уровня. Это новый сервис с амбициозной задачей: трансформировать наработки компании в единое стандартизированное решение для работы с данными. Отказываемся от легаси, проектируем архитектуру заново, с...

Можно удаленно
Полный день
Опыт от 3 лет

2ГИС

Москва

2 дня назад

⚡ Откликнуться на hh.ru

QA Engineer Flutter (Middle)

Наши партнеры - крупнейшая компания FMCG в поиске QA engineer Flutter – Middle/Middle+ Чем предстоит заниматься: Проведение полного цикла тестирования новых фич и существующих компонентов мобильного приложения (включая WebView-интеграции). Разработка...

Можно удаленно
Полный день
Опыт от 3 лет

ARK

Москва

день назад

⚡ Откликнуться на hh.ru

Site Reliability Engineer (SRE)

В NOVACARD мы создаём продукт, который меняет подход к кредитованию: первая в Мексике карта без процентов и годового обслуживания, полностью управляемая через мобильное приложение. Сейчас мы ищем Site Reliability Engineer (SRE), который будет отвечат...

Можно удаленно
Полный день
Опыт от 3 лет

Finstar Financial Group

Москва

4 дня назад

⚡ Откликнуться на hh.ru

Senior ML Engineer (LLM, RAG, Agents)

По договоренности

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

МЫ ЖДЕМ, ЧТО ВЫ:

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

ЧТО МЫ ПРЕДЛАГАЕМ:

Похожие вакансии

IT Support Engineer (3 Line)

QA Engineer for multinational IT company (manual)

QA Automation Engineer (Python)

Дата инженер

QA Engineer Flutter (Middle)

Site Reliability Engineer (SRE)

Вакансия в подборках

Похожие вакансии