Data Scientist в команду LLM Train
По договоренности
- Динамо
- Белорусская
- Маяковская
Мы активно развиваем GenAI-направление в hh.ru. Уже сейчас в разных командах используются LLM-модели для генерации текстов, ведения диалогов, классификации и анализа вакансий и резюме. Направление является для нас стратегическим, поэтому сейчас мы ищем технического лидера, который поможет выстроить в компании системный подход к обучению и адаптации LLM-моделей под задачи HR-домена.
Если вам интересно закладывать основу для устойчивого использования GenAI в продуктах — через LLM-модели, датасеты, метрики, процессы, которыми будут пользоваться десятки команд, и вы смотрите на ML не просто как на технологию, а как на инструмент влияния на продукт — мы будем рады видеть вас в нашей команде.
Обязанности:
- Файнтюнинг Open Source LLM-моделей для решения HR-задач (генерация описания вакансий, общение с клиентами, анализ резюме, модерация и т.п.).
- Исследование и внедрение современных архитектур, а также подходов к обучению моделей.
- Создание и поддержка специализированных датасетов для адаптации моделей под HR-домен.
- Оптимизация моделей для production-среды (квантизация, дистилляция).
- Тесное взаимодействие с продуктовыми командами, командами оценки качества и MLOps для интеграции моделей в продукты и сервисы hh.
- Разработка стандартов и процессов обучения моделей и помощь другим командам в их внедрении.
Требования:
- Глубокое понимание современных архитектур и методов обучения языковых моделей.
- Практический опыт файнтюнинга различных LLM под продуктовые задачи (SFT, PEFT, RLHF, LoRA, PPO, DPO, GRPO).
- Уверенное владение Python и экосистемой ML и LLM-инструментов (PyTorch, TRL, Accelerate, PEFT, Transformers, VLLM, etc).
- Живой интерес к сфере GenAI, опыт работы с популярными вендорными и open-source моделями (Qwen, Llama, DeepSeek, GPT-OSS).
- Практический опыт создания решений на базе LLM (prompt engineering, RAG, function calling, structured outputs, reasoning, agents).
- Понимание методов оценки качества LLM (бенчмарки, human eval, LLM-as-as-Judge) и метрик для различных NLP-задач.
- Умение балансировать исследовательские задачи и бизнес-требования.
Будет плюсом
- Опыт распределенного обучения LLM на GPU-кластерах.
- Опыт внедрения LLM-решений в продакшн.
Условия:
- Возможность выбора места работы: удаленно или из офиса.
- Гибкий график рабочего дня.
- Оформление в соответствии с ТК РФ, «белая» заработная плата, выплачиваемая точно в срок.
- Корпоративное ДМС с первого месяца работы (решаем вопросы со здоровьем быстро и удобно).
- Возможность профессионального развития, обучение за счет компании, участие в специализированных конференциях.
Адрес: Россия, Москва, 2-я Брестская улица, 48
Опубликована 8 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Сейчас у нас открыта вакансия Data Scientist. ... инженерами для внедрения моделей Поддержка и доработка существующих решений Требования: Опыт работы в Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
Чем предстоит заниматься: Построение и валидация моделей: Разработка линейных и ML-моделей для оценки кредитных и иных видов рисков. Внедрение моделей: Интеграция разработанных решений в существующие бизнес-процессы и системы. Портфельный менеджмент ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
МЫ В ПОИСКЕ DATA SCIENTIST Стек команды: SQL (PosgreSQL, Greenplum), Python, Airflow, MLflow, Spark, ... ДЛЯ НАС ЦЕННО: Опыт работы в Data Science от 3 лет; Уверенное владение Python и SQL (написание чистого ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
Сейчас мы находимся в поиске Data Scientist, который поможет нам в разработке новых прогнозных моделей ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
Задачи: Разработка production NLP/LLM-решений: AI Code Assistant (Co-Pilot), AI Chat, Agents. Проектирование агентских и неагентских LLM-пайплайнов: tool/function calling, маршрутизация, обработка ошибок, управление контекстом/состоянием. Интеграция ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
Наша команда в поиске Data Scientist специалиста в команду RecSys, которая занимается развитием рекомендательных ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад