ML-инженер

По договоренности


Мы создаём передовой блокчейн для распределенных вычислений в сфере ИИ. Мы ищем инженера, специализирующегося на инфраструктуре и производительности вывода машинного обучения. Ваша задача — сделать крупномасштабный вывод ИИ быстрым, экономически эффективным и безопасным в среде гетерогенных GPU-узлов, включая конфиденциальные и минимизированные по уровню доверия среды.

Обязанности:

  • Архитектура и разработка децентрализованных ИИ-систем корпоративного уровня (pro-code);
  • Создание и масштабирование ИИ-инфраструктуры на базе Kubernetes с использованием Docker, K8s, Terraform/Pulumi и распределенных фреймворков (KubeRay, SkyPilot);
  • Оптимизация вывода LLM / Transformer (задержки, пропускная способность, память);
  • Работа с vLLM, SGLang, пакетной обработкой, KV-кэшем, потоковым выводом;
  • Развертывание и настройка Triton Inference Server, TensorRT, ONNX Runtime;
  • Применение квантования (INT8 / FP16 / FP8) и анализ компромиссов между точностью и скоростью;
  • Профилирование и оптимизация использования CUDA/GPU;
  • Выбор и тестирование GPU для распределенных рабочих нагрузок;
  • Построение защищенных конвейеров вывода с использованием TEE (Intel SGX, NVIDIA Confidential Computing, аттестация):
  • Интеграция вывода ИИ с планированием на основе блокчейна и уровнями доверия.
Требования:
  • AI / Inference: PyTorch, ONNX; vLLM, SGLang; Triton Inference Server, TensorRT; CUDA, NVIDIA NGC;

  • Знания в области систем машинного обучения: Архитектура Transformer, механизм внимания; KV-кэш, токенизация, эмбеддинги; Линейная алгебра для повышения производительности машинного обучения;

  • Языки программирования: Python, Rust.

Будет плюсом:

— Понимание основ блокчейна;

— Опыт работы с распределенными системами / P2P-сетями;

— Масштабируемые системы машинного обучения в производственной среде;

— Сильный технический английский.


Поделиться:

Опубликована 21 день назад

Похожие вакансии

Обязанности: Эксплуатация и развитие технических сервисов систем передачи данных; Эксплуатация сетевых фабрик публичных облаков; Диагностика и решение сетевых проблем, реакция на инциденты и их последующий анализ; Техническое и организационное сопров...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РТК-ЦОДРТК-ЦОД
  • Москва
7 часов назад
Команда облачных сервисов Рунити активно развивается и ищет инженера с опытом работы с Kubernetes для ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РунитиРунити
  • Москва
20 часов назад
60 000 - 100 000 ₽
Наши ожидания: Опыт работы программистом или инженером-программистом от 3 лет.
  • Можно удаленно
  • Частичная занятость
  • Опыт от 3 лет
Логотип компании СтудияФСтудияФ
  • Москва
20 часов назад
Мы ищем опытного и увлеченного DevOps/SRE инженера, который готов взять на себя ответственность за настройку ... deb), опыт от 2х лет, эксплуатация HighLoad систем; Не менее 3-х лет опыта работы в роли DevOps/SRE инженера ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РостелекомРостелеком
  • Москва
20 часов назад
И сейчас мы ищем Middle DevOps-инженера В DevOps-команде сейчас 25 человек: DevOps-инженеры, инженеры ... инфраструктуры в Yandex Cloud, провести бесшовный переезд без даунтайма приложений командой из 1-3 инженеров ... данных между контурами Развивать MLOps платформу: развивать контур обучения моделей для Data Science инженеров ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании KTSKTS
  • Москва
20 часов назад
Сейчас во «Фланте» работают 500+ человек, большая часть из которых — инженеры. ... Наши продукты закрывают для инженеров других компаний весь спектр инфраструктурных задач: от управления ... которые при этом должны быть понятными конечному пользователю и надёжно работать без вмешательства инженеров ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ФлантФлант
  • Москва
20 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.