Senior ML Engineer (LLM, RAG, Agents)

По договоренности


ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

  • Строить системы извлечения и анализа ключевой информации из документов (PDF/сканы/HTML/DOCX), парсинг web-сайтов;

  • Разрабатывать RAG-системы, включая выбор эмбеддингов, стратегии чанкинга, гибридный поиск (BM25+dense), reranking, обучение ретривера, генератора, Reward-модели, мониторинг качества;

  • Обучать/дообучаать LLM на multi-node/multi-GPU: SFT/PEFT/LoRA, SFT+DPO, проводить распределённое обучение (FSDP/DeepSpeed), профилировать и оптимизировать;

  • Отвечать за инференс и оптимизацию больших языковых моделей: внедрение и настройка vLLM, TensorRT‑LLM, Triton; реализация батчинга, спекулятивного декодирования и квантования; оптимизация соотношения качества, латентности и стоимости инференса;

  • Проводить оценку качества: дизайн датасетов и сценариев, автоматические метрики (RAGAS, faithfulness, precision/recall), human-in-the-loop, онлайн-эксперименты и A/B.

МЫ ЖДЕМ, ЧТО ВЫ:

  • Имеете не менее 5 лет опыта в области ML/DS и не менее 2 лет работы с LLM в промышленной эксплуатации, а также можете продемонстрировать подтверждённые кейсы внедрений (с метриками, ссылками или результатами);

  • Обладаете экспертизой в извлечении информации: умеете работать с NER, проектируете схемы и онтологии, обеспечиваете структурированный вывод (в том числе через JSON Schema и constrained decoding), выполняете постпроцессинг и валидацию данных;

  • Имеете практический опыт работы с RAG: владеете векторными БД (Pinecone, Weaviate, Qdrant, Milvus), реализуете гибридный поиск и rerankers, разрабатываете стратегии чанкинга и аннотации метаданными, управляете свежестью индекса;

  • Занимались разработкой агентных систем: работали с LangChain, LangGraph или LlamaIndex, проектировали и оркестрировали инструменты, реализовывали обработку ошибок;

  • Имеете опыт многоузловой и многоGPU‑тренировки LLM: владеете PyTorch, FSDP/DeepSpeed, запускаете обучение на Slurm или K8s, проводите профилирование и выявляете узкие места;

  • Умеете проводить fine‑tuning и организовывать инференс для открытых и проприетарных моделей (например, Qwen, Gemma), а также работаете с OpenAI API;

  • Уверенно владеете Python и PyTorch, хорошо знакомы с экосистемой Hugging Face (Transformers, Tokenizers, PEFT, Accelerate), имеете опыт работы с MLflow или ClearML;

  • Умеете работать с данными из документов: применяете OCR‑решения (VLM, PaddleOCR, Surya и др.), парсите PDF, HTML, DOC, XML;

  • Обладаете базовым пониманием смежных областей (классификация, кластеризация, обработка речи), чтобы корректно выбирать подход: использовать LLM или классические методы ML;

  • Владеете английским языком на уровне, достаточном для чтения профессиональных статей и технической документации.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

  • Можете предоставить ссылки на GitHub с реализованными RAG‑системами, демонстрирующими ваш практический опыт;
  • Имеете опыт формулирования бизнес‑требований и разработки концептуального дизайна для LLM‑приложений, включая проработку сценариев использования и функциональных спецификаций;

  • Умеете рассчитывать и аргументированно обсуждать с заказчиками финансовый эффект от внедрения LLM‑решений, можете привести примеры расчётов экономического эффекта из реализованных проектов;

  • Принимали участие в соревнованиях и хакатонах, посвящённых разработке чат‑ботов и RAG‑систем, и можете продемонстрировать достигнутые результаты или решения;

  • Обладаете пониманием классических NLP‑задач и имеете практический опыт их реализации (классификация текста, извлечение сущностей, суммаризация и др.), умеете сопоставлять их с возможностями LLM;

  • Имеете опыт в прод‑инженерии и MLOps: работаете с Docker и Kubernetes, настраиваете мониторинг (Prometheus, Grafana), внедряете CI/CD‑пайплайны, интегрируете сервисы через REST, Kafka или gRPC;

  • Обладаете опытом работы в доменно‑специфичных сферах с интенсивным использованием документов (финтех, юриспруденция), понимаете особенности обработки и анализа текстов в этих областях.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня;
  • Полное соблюдение ТК РФ.

Поделиться:

Опубликована 14 дней назад

Похожие вакансии

до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. As our Remote Support division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer to join our team. This role i...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Москва
месяц назад
Job responsibilities: Manual testing of Frontend, Backend, Mobile Apps Defects discovery and reporting; Test environment preparation (test data, settings); Tests development (test plans, checklists); Test documentation maintenance; Testing automation...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HRSHRS
  • Москва
24 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
2 дня назад
Мы строим корпоративную дата-платформу следующего уровня. Это новый сервис с амбициозной задачей: трансформировать наработки компании в единое стандартизированное решение для работы с данными. Отказываемся от легаси, проектируем архитектуру заново, с...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании 2ГИС2ГИС
  • Москва
2 дня назад
Наши партнеры - крупнейшая компания FMCG в поиске QA engineer Flutter – Middle/Middle+ Чем предстоит заниматься: Проведение полного цикла тестирования новых фич и существующих компонентов мобильного приложения (включая WebView-интеграции). Разработка...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ARKARK
  • Москва
день назад
В NOVACARD мы создаём продукт, который меняет подход к кредитованию: первая в Мексике карта без процентов и годового обслуживания, полностью управляемая через мобильное приложение. Сейчас мы ищем Site Reliability Engineer (SRE), который будет отвечат...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Finstar Financial GroupFinstar Financial Group
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.