RL+NLP Разработчик

160 000 - 200 000 ₽

  • Физтех
  • Лианозово
  • Водники

Институт ИИ МФТИ – ведущий институт по искусственному интеллекту в России. В состав Института входят сильнейшие ученые и ключевые лаборатории Физтеха по направлениям: оптимизация для ИИ, Робототехника, Генеративный ИИ, Компьютерное зрение и Математическое моделирование. Цель Института - создание прорывных научных исследований и прикладных разработок для ключевых отраслей экономики страны.

Немного о нас в цифрах:

1-е место среди технических вузов России в международных рейтинге THE и CWUR (2025);

1-е место в предметном рейтинге RAEX по направлению "Информационные технологии" (2025);

1-е место в рейтинге передовых инженерных школ (2025);

1-е место в рейтинге вузов России по качеству приёма (2024);

1-е место в рейтинге вузов по качеству подготовки специалистов в области искусственного интеллекта (2024).

Центр когнитивного моделирования Института ИИ МФТИ — команда, работающая на стыке фундаментальной науки, инженерии и индустриальных задач. Мы создаём технологии, востребованные ведущими российскими компаниями, и публикуем результаты в сильных международных журналах и на топовых конференциях в области интеллектуальных систем и робототехники. Наша работа охватывает проекты по обучению больших моделей, робототехнические системы, когнитивные архитектуры и методы эффективного взаимодействия человека и машины.

Лаборатория интеллектуального транспорта является частью ЦКМ занимается созданием качественных наукоемких технологий компьютерного зрения для индустриальных партнеров с публикацией результатов в ведущих журналах (Neurocomputing, RA-L, EAAI, IEEE Transactions on ITS и др.) и конференциях (ICRA, IROS, ICCV и т.п.).

Чем тебе предстоит заниматься:

  • Разработка и исследование методов асинхронного обучения с подкреплением для улучшения качества reasoning-моделей
  • Эволюция подходов на основе SAC и PPO/GRPO для устойчивого обучения в условиях задержек между стратегиями, устаревших траекторий и разреженных вознаграждений
  • Создание прототипов и проведение экспериментов по curriculum learning для ускорения освоения сложных математических и программных задач
  • Анализ влияния low-bit представлений (FP8, INT8) на устойчивость и качество обучения
  • Разработка исследовательских пайплайнов и участие в создании фреймворка для асинхронного обучения больших моделей
  • Поддержка рабочего кода, регулярная валидация результатов, проведение сравнительных экспериментов.
Чего мы ждём от тебя:
  • Обязательное наличие оконченного высшего технического образования
  • Уверенные знания статистики, дискретных структур, теории алгоритмов, аналитической геометрии
  • Уверенное владение языком Python, а также опыт работы с фреймворком PyTorch
  • Навыки разработки под Linux (Ubuntu) и опыт использование Docker в реальных проектах
  • Опыт применения RL для обучения языковых или reasoning-моделей
  • Понимание архитектуры и механизмов обучения больших языковых моделей
  • Свободное владение техническим английским языком.
Что мы предлагаем:
  • работа в ведущем техническом вузе страны, в городе Долгопрудный (рядом со станцией Новодачная МЦД-1 или 15 минут от метро Алтуфьево, Ховрино, Физтех);
  • оформление в соответствии с ТК РФ;
  • возможность бесплатного посещения бассейна и тренажерного зала;
  • в соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.

Адрес: Россия, Долгопрудный, Первомайская улица, 3
Показать на большой карте

Поделиться:

Опубликована 3 дня назад

Похожие вакансии

150 000 - 250 000 ₽
Выше средней на 5%
Дизайн-центр по проектированию микропроцессорной техники для систем с искусственным интеллектом МФТИ в поиске FPGA-разработчик/ПЛИС-инженер. Мы реализуем алгоритмы обработки изображений под FPGA/ASIC. Наша цель - разработать ISP (Image Signal Process...
  • Полный день
  • Опыт от 1 года
Логотип компании МФТИМФТИ
  • Долгопрудный
7 часов назад
Компания "WasserKRAFT", с 2004 года является производителем сантехнического оборудования: смесителей, аксессуаров для ванной комнаты, душевых комплектов, душевых ограждений и поддонов, приглашает на работу: 1С разработчика-аналитика Мы ищем универсал...
  • Полный день
  • Опыт от 1 года
Логотип компании WasserKraftWasserKraft
  • Долгопрудный
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.