Technical Lead CUDA/Triton Kernel Development для LLM Acceleration

По договоренности


О проекте
Мы создаём самые сильные языковые модели в России и одни из самых больших в мире такие как GigaChat3 Ultra. Создание таких систем требует оптимизации архитектуры под GPU и решение проблем с масштабированием на кластера из тысяч видеокарт. Все это - нетривиальные инженерные вызовы, решение которых закладывается в следующие поколения наших моделей. У нас вы будете работать с современным набором видеокарт: NVIDIA B200/H100. Наш стек полностью интегрирован с PyTorch/TensorRT/ONNX и активно использует Triton, CUDA, CUTLASS и кастомные ядра для оптимизации: FlashAttention, PagedAttention, DeepEP, и др.

Среди наших достижений — реализация собственных ядер для распределённого обучения: асинхронный Expert & Tensor Parallel, а также Async Liger. Но хочется больше

Цель - снизить latency и увеличить throughput, оптимизировать новые архитектуры, делать их обучение экономически выгодным по сравнению с классическими LLM & MoE

Ключевые обязанности

  • Лидировать направление по разработке и оптимизации CUDA/Triton-ядер для LLM
  • Тесно взаимодействовать с ML-инженерами и research-командами для понимания workload’ов и bottleneck’ов (например: multinode inference, sparse attention, mixture-of-experts, long-context inference).
  • Участвовать в open-source инициативах (возможно — форки/патчи в Triton, upstream в PyTorch/TensorRT/SGLang).

Мы ожидаем, что вы

  • Имеете 5+ лет опыта в low-level GPU программировании (CUDA C++, PTX/SASS, shared memory/coalescing/warp-shuffle, async memcpy, stream management).
  • Глубоко понимаете архитектуру NVIDIA GPU (Tensor Cores, warp execution, occupancy, L2 cache hierarchy) и умеете профилировать через Nsight.
  • Владеете Triton (или готовы освоить быстро) и понимаете его trade-offs vs чистая CUDA.
  • Есть опыт работы с современными фреймворками: PyTorch (custom ops, torch.compile), TensorRT (plugins), возможно — SGLang.
  • Имеете опыт управления технической командой (2+ лет как lead/tech lead)

Условия

  • Формат работы - удиленный или гибрид на выбор из любого города РФ
  • Ежегодный пересмотр зарплаты годовая премия
  • Зоны отдыха
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • Программа адаптации и помощь руководителя на старте (для стартовых позиций)
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • Ипотека для сотрудников выгоднее до 7%
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • Вознаграждение за рекомендацию друзей в команду Сбера

Поделиться:

Опубликована 16 дней назад

Похожие вакансии

Altenar is an international IT company founded in 2011, with offices in Russia, Malta, Greece, Georgia, the Isle of Man, and Uruguay. We specialize in high-load software development and provide one of the best technology solutions worldwide. We would...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AltenarAltenar
  • Москва
7 дней назад
FunnelFox — ведущая платформа для роста выручки мобильных приложений. Solution & Integration Manager Мы ищем Solution & Integration Manager, который будет отвечать за технический онбординг клиентов, настройку интеграций и платежных флоу, а та...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AdaptyAdapty
  • Москва
11 дней назад
Regional Sales Manager – Chemicals for Plastic Packaging Location: Russia (Remote, Moscow) Company: Regional Manufacturer We are an Asia-based company specializing in advanced chemical solutions for plastic packaging, proudly serving leading food and...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Руфил КонсалтингРуфил Консалтинг
  • Москва
15 дней назад
We’re Novakid School, the English academy for kids of the future. We teach English as a foreign language to children all over the world, using our live 1:1 and group class platform, AI tutoring features, and learning games. We’re the biggest English ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Novakid IncNovakid Inc
  • Москва
21 день назад
We are seeking a motivated and talented Python/AI Engineer to join our dynamic, fast-growing team. The ideal candidate will have a strong foundation in Python programming, experience with machine learning frameworks, and a passion for artificial inte...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании EmFi Technologies LimitedEmFi Technologies Limited
  • Москва
месяц назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.