Senior ML/AI Engineer
По договоренности
- Смоленская
- Киевская
- Парк Победы
Российская IT-компания, разработчик тиражируемой интеллектуальной платформы по управлению данными. Основным продуктом компании является "Semantic MDM".
Чем предстоит заниматься:
- Проектировать и внедрять NLP/LLM решения в продуктовые сценарии MDM: классификация, извлечение/нормализация атрибутов, дедупликация, поиск/вопрос-ответ по данным и документам;
- Строить retrieval + RAG пайплайны: подготовка корпуса, индексация, ранжирование, промптинг, постобработка, guardrails;
- Адаптировать и дообучать open-source LLM-модели под задачи (prompting, LoRA/QLoRA, PEFT-подходы), оптимизировать инференс (включая квантизацию — при необходимости);
- Выстраивать оценку качества: датасеты, разметка, метрики, регрессионные тесты для retrieval/RAG и качества LLM-ответов;
- Интегрировать ML/LLM-компоненты в продукт совместно с командами backend/frontend (API, контракты, требования к данным);
- Участвовать в выборе технологического стека и принимать архитектурные решения по ML части;
-
Глубокое знание Python и опыт production-разработки(структура проекта, тесты, версионирование моделей, логирование/трассировка);
-
Понимание архитектур трансформеров и опыт их применения для NLP-задач;
-
Практический опыт NLP/LLM в реальных задачах: работа с PyTorch и transformers, понимание fine-tuning/adaptation подходов (например, PEFT/LoRA) и ограничений LLM;
-
Опыт построения retrieval/RAG-компонентов: эмбеддинги, индекс, оценка качества retrieval;
-
Умение проектировать и защищать решения: формулировать гипотезы, проводить эксперименты, анализировать результаты;
-
Умение доводить модели до продакшена: сервисная интеграция, мониторинг качества/ошибок, работа с ограничениями latency/стоимости;
-
Навыки написания чистого, поддерживаемого кода;
- Высшее образование;
- Знание английского языка для чтения и анализа технической документации;
Приветствуется:
- Опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться;
- Опыт интеграции с LLM API (например, GigaChat, YandexGPT, DeepSeek или аналоги), работа со streaming-ответами;
- LangChain/LlamaIndex, tool calling/function calling, оркестрация агентных сценариев;
- Векторные/поисковые хранилища и движки: OpenSearch, pgvector, FAISS; опыт reranking;
- оформление по ТК РФ;
- заработная плата определяется на собеседовании;
- премии по результатам работы;
- возможность профессионального роста и развития;
- ДМС, оплачиваемый отпуск и больничные;
- возможна удаленная работа/гибрид.
Опубликована 4 часа назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва