Автор на курс Обучение с подкреплением — Reinforcement Learning в Практикум

По договоренности


Можно совмещать с основной работой (от 10 часов в неделю)

Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца.

Мы расширяем линейку курсов по ML&AI уровня и ищем авторов, которые совместно с методистами, редакторами, иллюстраторами создадут контент для нового продукта.

Что делает автор?

  • Создаёт материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт‑менеджерами программы.
  • Пишет тексты уроков, в которых поддерживает интерес студентов к обучению.
  • Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.
  • Разрабатывает дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний.
  • Предлагает идеи, как улучшить усвоение материала.
  • Участвует в проектировании программы.

Что мы ожидаем от вас?

Техническая и доменная экспертиза

  • Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования.

  • Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.

  • Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур и обучающего контура.

  • Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование, многоагентные системы.

  • Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей, оптимизация.

  • Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.

  • Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.

  • “Боевой” опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами, дебагинг.

Будет преимуществом

  • Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах или других.

  • Опыт менторства, написания статей или образовательного контента на темы RL.

Что мы предлагаем?

  • Мы предлагаем удаленное сотрудничество, нужно только быть на связи в мессенджерах и иногда в Zoom.

  • Возможность экспериментировать и реализовать свой потенциал: мы доверяем вашему опыту и не тратим время и силы друг друга на микроменеджмент.

  • Плавное погружение в сотрудничество: познакомим вас с инструментами разработки курсов и с командой, которая поможет преобразовать ваши знания в целый курс.

  • Пополнение портфолио: мы выдаем нашим экспертам сертификаты о социально-полезной деятельности.

  • Нетворкинг, поддержка и вдохновение от комьюнити экспертов из разных сфер.

  • Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс Практикума.


Поделиться:

Опубликована 3 дня назад

Похожие вакансии

80 000 - 200 000 ₽
Выше средней на 33%
Описание вакансии: Создаём онлайн-курс по DevOps. Ищем практикующего специалиста с опытом обучения. При успешном сотрудничестве — приглашаем к работе над новыми курсами на постоянной основе. Требования: — Коммерческий опыт в DevOps/SRE от 3 лет — Опы...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании Крупчатников Максим СергеевичКрупчатников Максим Сергеевич
  • Москва
10 дней назад
Можно совмещать с основной работой (от 10 часов в неделю) Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца. ...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании ЯндексЯндекс
  • Москва
5 дней назад
Можно совмещать с основной работой (от 10 часов в неделю) Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца. ...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании ЯндексЯндекс
  • Москва
3 дня назад
от 80 000 ₽
Кто мы такие: Редакция «Выберу.ру» — СМИ, которое пишет про экономику, социальную политику, банки, финансы. Но наша задача не только рассказать о том, что происходит. Мы хотим помочь людям и научить: как реагировать на происходящее, как себя обезопас...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Выберу.руВыберу.ру
  • Москва
14 дней назад
Можно совмещать с основной работой (от 10 часов в неделю) Привет! Команда высшего образования запустила амбициозный проект совместно с МИФИ — программу магистратуры по кибербезопасности, которая даст студентам практические навыки в одной из трёх спец...
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании ЯндексЯндекс
  • Москва
20 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.