Senior Deep Learning Research Engineer (Diffusion-модели)

По договоренности


Разрабатываем и внедряем передовые методы оптимизации обучения и инференса сверхкрупных нейронных сетей (десятки миллиардов параметров) для мультимодальных генеративных моделей. Фокус — компиляция, квантизация, дистилляция, sparsity и другие техники ускорения, без компромисса по качеству.

Обязанности

  • исследование и внедрение методов оптимизации обучения (gradient checkpointing, activation recomputation, mixed-precision, оптимизация графа вычислений)
  • разработка и интеграция техник инференс-ускорения: quantization (INT8, FP8), pruning, structured sparsity, knowledge distillation
  • использование и доработка ML-компиляторов (TorchDyname, TorchInductor, TensorRT, и другие) для оптимизации вычислительных графов
  • совместная работа с командами CUDA operators и Distributed Learning для обеспечения максимальной производительности на GPU
  • проектирование и проведение экспериментов по компрессии моделей и сравнительный анализ trade-off’ов скорость/качество.

Требования

  • экспертный уровень Python, PyTorch
  • опыт работы с ML-компиляторами и оптимизацией инференса и обучения
  • глубокое понимание методов квантизации, дистилляции и спарсификации
  • навыки профилирования и оптимизации производительности (PyTorch Profiler, Nsight Systems, perf)
  • понимание архитектур современных LLM и Diffusion-моделей

Бонус: Опыт оптимизации на CPU/ASIC/FPGA, публикации на NeurIPS/ICML/MLSys, знание C++.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • формат работы гибрид
  • ежегодный пересмотр зарплаты, квартальная и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • программа адаптации и помощь руководителя на старте
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 21 день назад

Похожие вакансии

Выстроить и запустить устойчивую B2B-модель монетизации интернет-энциклопедии через рекламу. ... Возможность выстроить коммерческую модель на базе сильного актива: высокий органический трафик, авторитет ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Интернет-энциклопедия РУВИКИИнтернет-энциклопедия РУВИКИ
  • Москва
день назад
... будете вносить свой вклад в разработку стратегических инициатив, оценивая их влияние на операционную модель ... Интеграция приобретений: Вы будете разрабатывать модель интеграции и управления компаниями, которые мы ... Умение создавать и анализировать иерархические модели деятельности.
  • Полный день
  • Опыт от 5 лет
Логотип компании Alta PersonnelAlta Personnel
  • Москва
день назад
Обязанности: Математическое моделирование цепочек поставок (модель прогнозирования логистических затрат ... , модель управления запасами и других расчётных моделей для дальнейшей реализации в информационных системах ... Опыт разработки расчётных моделей, работы в УЦП или логистике; навыки имитационного моделирования (Anylogistics ...
  • Полный день
  • Опыт от 5 лет
Логотип компании РГ-СЕРВИСРГ-СЕРВИС
  • Москва
день назад
... задача приземлить текущие процессы на цифры, выстроить прозрачную юнит-экономику и превратить работающую модель ...
  • Полный день
  • Опыт от 5 лет
Логотип компании Аринина Ольга ВладимировнаАринина Ольга Владимировна
  • Москва
день назад
В этой роли вам предстоит выстроить операционную модель пространства, сформировать команду и процессы ... Участвовать в разработке и приемке дизайн-проекта клиентского пространства с точки зрения операционной модели ... Формировать операционную модель пространства до его открытия Нанимать и управлять командой пространства ...
  • Полный день
  • Опыт от 5 лет
Логотип компании АТОНАТОН
  • Москва
день назад
Понимание процессов управления проектами (жизненный цикл, фазовая модель, ролевые модели, матричное управление ...
  • Полный день
  • Опыт от 5 лет
Логотип компании АэродинамикаАэродинамика
  • Москва
3 часа назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.