Senior Deep Learning Research Engineer (Kandinsky)
По договоренности
Разрабатываем и внедряем передовые методы оптимизации обучения и инференса сверхкрупных нейронных сетей (десятки миллиардов параметров) для мультимодальных генеративных моделей. Фокус — компиляция, квантизация, дистилляция, sparsity и другие техники ускорения, без компромисса по качеству.
Обязанности
- исследование и внедрение методов оптимизации обучения (gradient checkpointing, activation recomputation, mixed-precision, оптимизация графа вычислений)
- разработка и интеграция техник инференс-ускорения: quantization (INT8, FP8), pruning, structured sparsity, knowledge distillation
- использование и доработка ML-компиляторов (TorchDyname, TorchInductor, TensorRT, и другие) для оптимизации вычислительных графов
- совместная работа с командами CUDA operators и Distributed Learning для обеспечения максимальной производительности на GPU
- проектирование и проведение экспериментов по компрессии моделей и сравнительный анализ trade-off’ов скорость/качество.
Требования
- экспертный уровень Python, PyTorch
- опыт работы с ML-компиляторами и оптимизацией инференса и обучения
- глубокое понимание методов квантизации, дистилляции и спарсификации
- навыки профилирования и оптимизации производительности (PyTorch Profiler, Nsight Systems, perf)
- понимание архитектур современных LLM и Diffusion-моделей
Бонус: Опыт оптимизации на CPU/ASIC/FPGA, публикации на NeurIPS/ICML/MLSys, знание C++.
Условия
- комфортный современный офис рядом с м. Кутузовская
- формат работы гибрид
- ежегодный пересмотр зарплаты, квартальная и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- программа адаптации и помощь руководителя на старте
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
Опубликована 7 дней назад
Похожие вакансии
Нахожусь в поисках Application Support Engineer в компанию, которая является лидером рынка в сфере доверительного ... Будет плюсом: Насмотренность в IT-поддержке: Опыт не только с приложениями, но и с офисной/инфра-поддержкой ...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
Требования: Опыт работы presale engineer (менеджером по IT решениям) от 2 лет; Опыт работы с серверным ...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад
200 000 - 350 000 ₽
Выше средней на 111%
Наш клиент - аккредитованная IT компания, разработчики ПО Приглашает на работу - ML-Engineer Требования ...
- Полный день
- Опыт от 1 года
- Москва
месяц назад
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных ... основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках iOS Automation Engineer ...
- Полный день
- Опыт от 1 года
- Москва
месяц назад
На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat ... Условия удалённо по России. возможность оформления в аккредитованную IT-компанию годовая премия по итогам ...
- Полный день
- Опыт от 1 года
- Москва
19 дней назад
от 100 000 ₽
Сейчас мы в поиске Junior ML Engineer Мы используем современные технологии и микросервисную архитектуру ... Мы предлагаем: IT-компания с государственной аккредитацией; Работа в современном офисе или гибридный ...
- Полный день
- Опыт от 1 года
- Москва
21 день назад
Вакансия в подборках
Похожие вакансии
200 000 - 350 000 ₽