ML-инженер
По договоренности
- Черкизовская
- Преображенская площадь
- Сокольники
Обязанности:
- разработка приложений с использованием LLM (агентные и RAG системы, системы обработки текстов);
- разработка способов оценивания качества работы LLM приложений;
- оптимизация инференса;
- построение web-интерфейсов для MVP и PoC.
Стек:
- разработка: Python 3.10+, FastAPI (+ сопутствующие инструменты), Docker;
- базовый инструментарий: PyTorch, инструменты экосистемы HuggingFace, pandas, scikit-learn, matplotlib;.
- языковые модели: энкодерные и декодерные языковые модели, инференс на vLLM, transformers, Llama.cpp (+ollama);
- хранилища: Elasticsearch, mongo, pgvecto-rs, HellixDB;
- интерфейсы: streamlit, gradio;
- MLOps: DVC.
- уверенное знание Python;
- знание основ работы с Linux (shell, файловая система, процессы);
- математическая подготовка: математическая статистика (оценка параметров, их характеристики, доверительные интервалы, бутстрап), основы машинного обучения (регрессоры, классификаторы, деревья, метрики, EDA);
- базовое понимание работы LLM: понимание архитектуры, работа с внутренним состоянием, понимание принципов инференса (KV кэш, стратегии декодирования, структурированный вывод);
- опыт построения языковых моделей: SFT, DPO + RL, LoRA, контрастное обучение, метрики качества;
- опыт работы с RAG системами: понимание принципов функционирования, опыт участие в разработке;
- агентные системы: понимание архитектур и их проблем;
- способы замера качества LLM-приложений: метрики поиска данных, LLM-as-a-judge, сбор и разметка данных для специализированных бенчмарков, принципы работы общих бенчмарков.
Будет плюсом:
- опыт проектирования RAG и агентных систем, наличие опыта работы с LLM фреймворками, такими как Flowise, n8n (low code) или LlamaIndex, Langchain, CrewAI (python);
- опыт работы в других областях ML, таких как обработка аудио (TTS, STT, атрибуция), работа с изображениями (детекция объектов с Yolo, подготовка и разметка датасетов в CVAT), работа с мультимодальными LLM;
- опыт в оптимизации инференса: квантизация, дистиляция, использование эффективных фреймворков (TRT, SGLang), спекулятивный декодинг, continuous batching.
Адрес: Россия, Москва, Электрозаводская улица, 27с4
Опубликована 6 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX В связи с активным развитием проектов в компании открыта вакансия DATA ИНЖЕНЕР.
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
от 135 000 ₽
Обязанности: 1.Осуществляет контроль за техническим состоянием обслуживаемых зданий и сооружений путем проведения систематических осмотров. 2. Проверяет готовность зданий к эксплуатации в осеннее - зимний период. 3.Обеспечивает проведение работ по по...
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
160 000 - 180 000 ₽
Рыночная зарплата
Опыт работы инженером, сервис-инженером от 3 лет.
- Полный день
- Опыт от 3 лет
- Москва
6 часов назад
93 700 ₽
ОБЯЗАННОСТИ Организация процесса рассмотрения и согласования ЗНП, проектно-сметной документации по объектам Составление и рассылка факсограмм Составление и ведение реестра рассмотрения проектно-сметной документации Подготовка и выдача технических тре...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Обязанности: Проверка/подготовка ИД (включая исполнительные схемы, АОСР и т.д.); Сбор и подготовка ИРД для обеспечения Подрядчика исходными данными для выполнения Проектирования. Формирование и написание исчерпывающего перечня ИРД в составе т/з на пр...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
от 150 000 ₽
Опыт работы инженером от 6 лет. Знание ЕСКД. ... испытаний и участия в квалификационных испытаниях Навыки сопровождения процессов сертификации в роли инженера-разработчика ... Работа в профессиональной команде инженеров.
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Вакансия в подборках
Похожие вакансии
от 135 000 ₽
160 000 - 180 000 ₽
93 700 ₽