LLM Fine-Tuning Engineer (Middle)

По договоренности


Ищем специалиста по дообучению (Fine-Tuning) и адаптации открытых LLM под наши задачи.

Фокус — SFT (Supervised Fine-Tuning), подготовка датасетов и оптимизация моделей.

Ключевое требование - Понимание процесса обучения моделей: как выбрать базовую модель, как подготовить данные, чтобы модель не «поглупела» (catastrophic forgetting), и как оценить, что она действительно научилась новому.

Что предстоит делать:

- Проектировать и вести пайплайны обучения:

- Собирать и чистить датасеты (Data Engineering для LLM).

- Выбирать подходящие Open Source модели (Llama, Mistral, Qwen и др.).

- Настраивать гиперпараметры обучения.

- Проводить Fine-Tuning:

- Использовать эффективные методы (LoRA, QLoRA) для адаптации весов.

- Экспериментировать с Full Fine-Tuning.

- Разрабатывать метрики качества для проверки обученной модели.

- Квантовать модели для запуска на ограниченном железе.

Программирование и Техническая часть: Python — уверенный уровень.


Поделиться:

Опубликована 3 дня назад

Похожие вакансии

Big Data – место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС ТВ)...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании МТСМТС
  • Москва
5 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании AstonAston
  • Москва
8 дней назад
Any (ранее DIGINETICA) — лидер в области персонализации пользовательского опыта, продуктов для навигации и выбора товаров в e-commerce. Мы развиваем продукты для топовых онлайн-ритейлеров, в том числе Самокат, Золотое Яблоко, Билайн и многих других. ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании AnyAny
  • Москва
4 дня назад
Wellink- российский разработчик программного обеспечения и дочерняя компания ProoftechIT. Уже 13 лет создаём качественные программные продукты для операторов связи и поставщиков облачных сервисов для непрерывного контроля и управления уровнем обслужи...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Prooftech ITProoftech IT
  • Москва
6 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании AstonAston
  • Москва
11 дней назад
Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 3400+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом друг...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании AstonAston
  • Москва
11 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.