Senior ML Engineer (LLM, RAG, Agents)

По договоренности


ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

  • Строить системы извлечения и анализа ключевой информации из документов (PDF/сканы/HTML/DOCX), парсинг web-сайтов;

  • Разрабатывать RAG-системы, включая выбор эмбеддингов, стратегии чанкинга, гибридный поиск (BM25+dense), reranking, обучение ретривера, генератора, Reward-модели, мониторинг качества;

  • Обучать/дообучаать LLM на multi-node/multi-GPU: SFT/PEFT/LoRA, SFT+DPO, проводить распределённое обучение (FSDP/DeepSpeed), профилировать и оптимизировать;

  • Отвечать за инференс и оптимизацию больших языковых моделей: внедрение и настройка vLLM, TensorRT‑LLM, Triton; реализация батчинга, спекулятивного декодирования и квантования; оптимизация соотношения качества, латентности и стоимости инференса;

  • Проводить оценку качества: дизайн датасетов и сценариев, автоматические метрики (RAGAS, faithfulness, precision/recall), human-in-the-loop, онлайн-эксперименты и A/B.

МЫ ЖДЕМ, ЧТО ВЫ:

  • Имеете не менее 5 лет опыта в области ML/DS и не менее 2 лет работы с LLM в промышленной эксплуатации, а также можете продемонстрировать подтверждённые кейсы внедрений (с метриками, ссылками или результатами);

  • Обладаете экспертизой в извлечении информации: умеете работать с NER, проектируете схемы и онтологии, обеспечиваете структурированный вывод (в том числе через JSON Schema и constrained decoding), выполняете постпроцессинг и валидацию данных;

  • Имеете практический опыт работы с RAG: владеете векторными БД (Pinecone, Weaviate, Qdrant, Milvus), реализуете гибридный поиск и rerankers, разрабатываете стратегии чанкинга и аннотации метаданными, управляете свежестью индекса;

  • Занимались разработкой агентных систем: работали с LangChain, LangGraph или LlamaIndex, проектировали и оркестрировали инструменты, реализовывали обработку ошибок;

  • Имеете опыт многоузловой и многоGPU‑тренировки LLM: владеете PyTorch, FSDP/DeepSpeed, запускаете обучение на Slurm или K8s, проводите профилирование и выявляете узкие места;

  • Умеете проводить fine‑tuning и организовывать инференс для открытых и проприетарных моделей (например, Qwen, Gemma), а также работаете с OpenAI API;

  • Уверенно владеете Python и PyTorch, хорошо знакомы с экосистемой Hugging Face (Transformers, Tokenizers, PEFT, Accelerate), имеете опыт работы с MLflow или ClearML;

  • Умеете работать с данными из документов: применяете OCR‑решения (VLM, PaddleOCR, Surya и др.), парсите PDF, HTML, DOC, XML;

  • Обладаете базовым пониманием смежных областей (классификация, кластеризация, обработка речи), чтобы корректно выбирать подход: использовать LLM или классические методы ML;

  • Владеете английским языком на уровне, достаточном для чтения профессиональных статей и технической документации.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

  • Можете предоставить ссылки на GitHub с реализованными RAG‑системами, демонстрирующими ваш практический опыт;
  • Имеете опыт формулирования бизнес‑требований и разработки концептуального дизайна для LLM‑приложений, включая проработку сценариев использования и функциональных спецификаций;

  • Умеете рассчитывать и аргументированно обсуждать с заказчиками финансовый эффект от внедрения LLM‑решений, можете привести примеры расчётов экономического эффекта из реализованных проектов;

  • Принимали участие в соревнованиях и хакатонах, посвящённых разработке чат‑ботов и RAG‑систем, и можете продемонстрировать достигнутые результаты или решения;

  • Обладаете пониманием классических NLP‑задач и имеете практический опыт их реализации (классификация текста, извлечение сущностей, суммаризация и др.), умеете сопоставлять их с возможностями LLM;

  • Имеете опыт в прод‑инженерии и MLOps: работаете с Docker и Kubernetes, настраиваете мониторинг (Prometheus, Grafana), внедряете CI/CD‑пайплайны, интегрируете сервисы через REST, Kafka или gRPC;

  • Обладаете опытом работы в доменно‑специфичных сферах с интенсивным использованием документов (финтех, юриспруденция), понимаете особенности обработки и анализа текстов в этих областях.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня;
  • Полное соблюдение ТК РФ.

Поделиться:

Опубликована 5 дней назад

Похожие вакансии

до 150 000 ₽
Technopeak.ae is a leading provider of IT solutions and services across the Middle East. As our Remote Support division continues to expand, we are looking for an experienced and reliable 3rd Line Server Support Engineer to join our team. This role i...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Первый БитПервый Бит
  • Москва
21 день назад
Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. Мы ищем Data Engineer в команду, которая отвечает...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании WILDBERRIESWILDBERRIES
  • Москва
6 дней назад
Привет, будущий коллега! Мы в поиске сильного QA automation engineer для High Load проекта "Платежная система". Команда работает над высоконагруженным проектом в сфере онлайн-платежей. Мы обеспечиваем надежную обработку и проверку платежей от пользов...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ОпендэвОпендэв
  • Москва
9 дней назад
Привет! Мы — AnyClass, одна из крупнейших IT-платформ в России с курсами от топовых экспертов в lifestyle-сегменте. Мы лидеры в продвижении продуктов для красоты, здоровья и саморазвития. Мы активно внедряем AI и следуем data-driven подходу. Резидент...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AnyClassAnyClass
  • Москва
8 дней назад
The_covert - международная компания, мы входим в группу IT-компаний, занимающихся разработкой собственных продуктов и сервисов более 10 лет. Нашими продуктами для реализации и упрощения бизнес процессов пользуются тысячи людей по всему миру. Мы предо...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании the_covertthe_covert
  • Москва
8 дней назад
MWS AI – это часть экосистемы МТС Web Services, где создаются AI-решения будущего. Голосовые ассистенты и чат-боты могут ответить на любой вопрос клиента, а компьютерное зрение - распознавать лица и эмоции. Мы ищем опытного AI-инженера, который сможе...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МТСМТС
  • Москва
9 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.