Senior ML Engineer (LLM, RAG, Agents)

По договоренности


ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

  • Строить системы извлечения и анализа ключевой информации из документов (PDF/сканы/HTML/DOCX), парсинг web-сайтов;

  • Разрабатывать RAG-системы, включая выбор эмбеддингов, стратегии чанкинга, гибридный поиск (BM25+dense), reranking, обучение ретривера, генератора, Reward-модели, мониторинг качества;

  • Обучать/дообучаать LLM на multi-node/multi-GPU: SFT/PEFT/LoRA, SFT+DPO, проводить распределённое обучение (FSDP/DeepSpeed), профилировать и оптимизировать;

  • Отвечать за инференс и оптимизацию больших языковых моделей: внедрение и настройка vLLM, TensorRT‑LLM, Triton; реализация батчинга, спекулятивного декодирования и квантования; оптимизация соотношения качества, латентности и стоимости инференса;

  • Проводить оценку качества: дизайн датасетов и сценариев, автоматические метрики (RAGAS, faithfulness, precision/recall), human-in-the-loop, онлайн-эксперименты и A/B.

МЫ ЖДЕМ, ЧТО ВЫ:

  • Имеете не менее 5 лет опыта в области ML/DS и не менее 2 лет работы с LLM в промышленной эксплуатации, а также можете продемонстрировать подтверждённые кейсы внедрений (с метриками, ссылками или результатами);

  • Обладаете экспертизой в извлечении информации: умеете работать с NER, проектируете схемы и онтологии, обеспечиваете структурированный вывод (в том числе через JSON Schema и constrained decoding), выполняете постпроцессинг и валидацию данных;

  • Имеете практический опыт работы с RAG: владеете векторными БД (Pinecone, Weaviate, Qdrant, Milvus), реализуете гибридный поиск и rerankers, разрабатываете стратегии чанкинга и аннотации метаданными, управляете свежестью индекса;

  • Занимались разработкой агентных систем: работали с LangChain, LangGraph или LlamaIndex, проектировали и оркестрировали инструменты, реализовывали обработку ошибок;

  • Имеете опыт многоузловой и многоGPU‑тренировки LLM: владеете PyTorch, FSDP/DeepSpeed, запускаете обучение на Slurm или K8s, проводите профилирование и выявляете узкие места;

  • Умеете проводить fine‑tuning и организовывать инференс для открытых и проприетарных моделей (например, Qwen, Gemma), а также работаете с OpenAI API;

  • Уверенно владеете Python и PyTorch, хорошо знакомы с экосистемой Hugging Face (Transformers, Tokenizers, PEFT, Accelerate), имеете опыт работы с MLflow или ClearML;

  • Умеете работать с данными из документов: применяете OCR‑решения (VLM, PaddleOCR, Surya и др.), парсите PDF, HTML, DOC, XML;

  • Обладаете базовым пониманием смежных областей (классификация, кластеризация, обработка речи), чтобы корректно выбирать подход: использовать LLM или классические методы ML;

  • Владеете английским языком на уровне, достаточном для чтения профессиональных статей и технической документации.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

  • Можете предоставить ссылки на GitHub с реализованными RAG‑системами, демонстрирующими ваш практический опыт;
  • Имеете опыт формулирования бизнес‑требований и разработки концептуального дизайна для LLM‑приложений, включая проработку сценариев использования и функциональных спецификаций;

  • Умеете рассчитывать и аргументированно обсуждать с заказчиками финансовый эффект от внедрения LLM‑решений, можете привести примеры расчётов экономического эффекта из реализованных проектов;

  • Принимали участие в соревнованиях и хакатонах, посвящённых разработке чат‑ботов и RAG‑систем, и можете продемонстрировать достигнутые результаты или решения;

  • Обладаете пониманием классических NLP‑задач и имеете практический опыт их реализации (классификация текста, извлечение сущностей, суммаризация и др.), умеете сопоставлять их с возможностями LLM;

  • Имеете опыт в прод‑инженерии и MLOps: работаете с Docker и Kubernetes, настраиваете мониторинг (Prometheus, Grafana), внедряете CI/CD‑пайплайны, интегрируете сервисы через REST, Kafka или gRPC;

  • Обладаете опытом работы в доменно‑специфичных сферах с интенсивным использованием документов (финтех, юриспруденция), понимаете особенности обработки и анализа текстов в этих областях.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня;
  • Полное соблюдение ТК РФ.

Поделиться:

Опубликована 20 дней назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных ... компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках Data Engineer ... Kafka, Trino); Понимание Data Quality и Data Governance процессов; 5+ лет опыта работы на позиции Data Engineer ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
день назад
Компания IT Baltic - ИТ-интегратор, работающий в направлениях ИТ консалтинга, автоматизации процессов ... Благодаря команде отраслевых специалистов, продукты и системы IT Baltic получают опережающее конкурентное ... Мы находимся в поисках AQA engineer (Python) Наши пожелания: 1.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании АЙТИБАЛТИКАЙТИБАЛТИК
  • Москва
4 дня назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. ... опыт работы в роли DevOps Engineer от 3-х лет; опыт работы в роли DevSecOps Engineer от 1 года; владение ... Новая, 28, коворкинг "VMESTE"), Самара (IT парк Монте Роза).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
5 дней назад
200 000 - 280 000 ₽
Выше средней на 20%
Мы — российская аккредитованная IT компания и с 2010 года создаем функциональные цифровые продукты. ... Наши технологии и проектный опыт позволяют решать задачи из сфер: финтех, промышленность, страхование, IT ... Сейчас мы ищем QAA engineer (SDET) middle/senior .
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании IntelsyIntelsy
  • Москва
4 дня назад
QA engineer Мы опытная It команда, занимаемся разработкой разнообразного ПО от Windows приложений, API ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании DPD в РоссииDPD в России
  • Москва
4 дня назад
MANGO OFFICE — лидер на рынке облачных коммуникаций в России с 2001 г., участник топ-20 крупнейших IT-разработчиков ... Команда: Teamlead, Techlead, 3 разработчика, верстальщик, Product Owner, Project Manager, 4 QA engineer ... Что предлагаем мы: Мы предоставляем все льготы для сотрудников как аккредитованная IT-компания; Достойный ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании MANGO OFFICEMANGO OFFICE
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.