LLM-разработчик в команду фреймворка распределённого обучения

По договоренности


Мы отвечаем за ML-инструменты и инфраструктуру всего Яндекса, а нашими сервисами пользуется большинство ML-разработчиков Яндекса. Это команды, которые обучают модели для Алисы, Нейро, Шедеврума.

Сейчас мы приступили к новой большой задаче: разработать эффективный и удобный фреймворк для работы с LLM, от гигантских претрейнов до дообучения моделей под конкретные продуктовые задачи. Мы ищем research-инженера, готового вместе с нами создавать этот фреймворк и находиться на фронтире индустрии. Яндекс — одно из немногих мест в мире, где у вас будет возможность поработать на таких масштабах!

Какие задачи вас ждут:
Вот какие вызовы в работе над фреймворком стоят перед нашей командой и будут стоять перед вами:

  • Добиться state-of-the-art эффективности всех существующих методов параллельного обучения на 10k+ GPU
  • Создать механизмы, которые автоматически дают высокую утилизацию для различных NLP-задач без необходимости сложного тюнинга. Например, с помощью ML for Systems
  • Сделать фреймворк удобным и расширяемым как для опытных специалистов, так и для команд, которые хотят внедрить LLM в свои продукты
Мы ждем, что вы:
  • Отлично владеете Python, знаете лучшие инженерные практики
  • Работали с PyTorch (JAX или TensorFlow тоже подойдут)
  • Понимаете, как устроены современные LLM и как решать типичные NLP-задачи
  • Знаете про современные подходы параллелизма в обучении моделей или готовы быстро с этим разобраться
Будет плюсом, если вы:
  • Интересуетесь или занимались ML/DL-исследованиями
  • Понимаете, как устроены GPU и коммуникации между ними
  • Умеете работать с большим количеством неизвестных

Поделиться:

Опубликована 9 дней назад

Похожие вакансии

Т‑Банке: еще недавно ею пользовались лишь несколько команд, а сейчас она на втором месте по количеству разработчиков ... Сейчас мы ищем разработчиков. ... . — Предоставляем менторов: можно обратиться к ментору из фронтенд-команды и выучиться на фулстек-разработчика ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Т-БанкТ-Банк
  • Санкт-Петербург
день назад
от 100 000 ₽
Государственный научный центр АО Концерн "ЦНИИ "Электроприбор" - многопрофильная приборостроительная организация, один из признанных мировых лидеров рынка в области высокоточной инерциальной навигации, гироскопии, гравиметрии и оптико-электронных сис...
  • Полный день
  • Опыт от 3 лет
Логотип компании Концерн ЦНИИ ЭлектроприборКонцерн ЦНИИ Электроприбор
  • Санкт-Петербург
день назад
У нас большое Scala-комьюнити — более 250 разработчиков.
  • Полный день
  • Опыт от 3 лет
Логотип компании Т-БанкТ-Банк
  • Санкт-Петербург
день назад
200 000 - 250 000 ₽
Выше средней на 29%
Обязанности: Разработка и поддержка клиентского приложения для социального сервиса с использованием современного Android-стека (Compose, Hilt, Coroutines) и интеграцией с защищенным back-end API. Стек проекта: Kotlin, Jetpack Compose, MVVM/Clean Arch...
  • Полный день
  • Опыт от 3 лет
Логотип компании НПК КАТАРСИСНПК КАТАРСИС
  • Санкт-Петербург
3 дня назад
... здорового питания В связи с расширением отдела и добавлением новых брендов мы приглашаем Технолога-разработчика ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ПРАЙМ-КРАФТПРАЙМ-КРАФТ
  • Санкт-Петербург
день назад
... в рейтинге hh.ru, приглашает в команду управления развития фронтальных и процессных систем C#/.NET разработчика ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Банк Санкт-ПетербургБанк Санкт-Петербург
  • Санкт-Петербург
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.