RL+NLP Разработчик

160 000 - 200 000 ₽

МФТИ

Долгопрудный

Физтех
Лианозово
Водники

⚡ Откликнуться на hh.ru

Обязанности:

Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.

Требования:

Обязательное наличие оконченного высшего технического образования
Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
Опыт применения RL для обучения языковых или reasoning-моделей
Понимание архитектуры и механизмов обучения больших языковых моделей
Свободное владение техническим английским языком.

Условия:

работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
оформление в соответствии с ТК РФ;
возможность бесплатного посещения бассейна и тренажерного зала;
в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.

⚡ Откликнуться на hh.ru

Адрес: Россия, Долгопрудный, Первомайская улица, 3

Показать на большой карте

Опубликована месяц назад

1С разработчик-аналитик

Компания "WasserKRAFT", с 2004 года является производителем сантехнического оборудования: смесителей, аксессуаров для ванной комнаты, душевых комплектов, душевых ограждений и поддонов, приглашает на работу: 1С разработчика-аналитика Мы ищем универсал...

Полный день
Опыт от 1 года

WasserKraft

Долгопрудный

24 дня назад

⚡ Откликнуться на hh.ru

FPGA-разработчик/ПЛИС-инженер

150 000 - 250 000 ₽

Выше средней на 5%

Дизайн-центр по проектированию микропроцессорной техники для систем с искусственным интеллектом МФТИ в поиске FPGA-разработчик/ПЛИС-инженер. Мы реализуем алгоритмы обработки изображений под FPGA/ASIC. Наша цель - разработать ISP (Image Signal Process...

Полный день
Опыт от 1 года

МФТИ

Долгопрудный

25 дней назад

⚡ Откликнуться на hh.ru

Инженер-разработчик электроники (г. Долгопрудный, МФТИ)

Приглашаем в команду: Инженер-разработчик электроники (г. Долгопрудный, МФТИ) Мы ищем талантливого и мотивированного инженера, готового взять на себя ключевую роль в разработке современных электронных систем для Li-ion батарей. Если вы увлечены элект...

Полный день
Опыт от 1 года

Н2 Инвест

Долгопрудный

месяц назад

⚡ Откликнуться на hh.ru

RL+NLP Разработчик

160 000 - 200 000 ₽

Похожие вакансии

1С разработчик-аналитик

FPGA-разработчик/ПЛИС-инженер

Инженер-разработчик электроники (г. Долгопрудный, МФТИ)

Вакансия в подборках

Похожие вакансии