Старший Go разработчик, ML платформа

По договоренности

  • Смоленская
  • Киевская
  • Парк Победы

Привет! Мы — команда платформы инференса Ozon.

Мы строим ML-инфраструктуру, отвечающую за финальный и самый критичный этап жизненного цикла моделей — их работу в реальных продуктах. Через нашу платформу проходят ранжирование, рекомендации, компьютерное зрение и другие ML-сценарии, влияющие на миллионы пользователей.

Наша миссия — создавать отказоустойчивую и высокопроизводительную платформу инференса, способную выдерживать пиковую нагрузку 200K+ RPS и эффективно управлять кластерами GPU-серверов.

Мы работаем на стыке сильной backend-инженерии (многопоточность, распределённые системы, Kubernetes) и глубокой ML-специфики с фокусом на оптимизацию работы моделей на GPU.

Наш стек

  • Go, Java — платформенные сервисы

  • Python — ML-интеграции

  • Kubernetes, Docker, Nvidia Device Plugin

  • Triton Inference Server

  • Kafka, PostgreSQL, Redis, S3

  • GitLab CI

Чем предстоит заниматься

  • Проектировать и разрабатывать высоконагруженные сервисы для инференса ML-моделей в облачной среде.

  • Оптимизировать выполнение моделей на GPU: batching, управление GPU-памятью, настройка GPU sharing (MIG), снижение latency.

  • Интегрировать ML-рантаймы (TensorRT, ONNX Runtime) в платформенную инфраструктуру на Java и Go.

  • Разрабатывать механизмы автоскейлинга и эффективного распределения нагрузки между инференс-сервисами.

  • Обеспечивать SLA платформы: участвовать в разборе инцидентов, выявлять узкие места и внедрять системные решения для повышения стабильности и производительности.

    Примеры задач

  • Разработка унифицированного API инференса, абстрагирующего команды Data Science от особенностей GPU и рантаймов.

  • Создание платформы A/B-тестирования ML-моделей на продакшен-трафике.

  • Автоматическая оптимизация и конвертация моделей под различные типы GPU.

  • Реализация асинхронного инференса с автоскейлингом в Kubernetes.

  • Повышение утилизации GPU-кластера без деградации latency

Нам важно

  • Коммерческий опыт разработки на Go или Java/Kotlin от 4-х лет.

  • Опыт проектирования микросервисной архитектуры и работы с распределёнными системами.

  • Понимание многопоточности и конкурентного программирования.

  • Умение писать чистый, тестируемый и поддерживаемый код.

  • Опыт работы с облачной инфраструктурой (желательно Kubernetes).

Будет плюсом

  • Опыт работы с ML-инфраструктурой и GPU (CUDA, Triton, KServe).

  • Понимание MLOps-практик.

  • Опыт работы с Kafka или другими системами очередей.

  • Опыт оптимизации высоконагруженных систем.


Адрес: Россия, Москва, Пресненская набережная, 10блокС
Показать на большой карте

Поделиться:

Опубликована 23 дня назад

Похожие вакансии

до 220 000 ₽
Группа компаний Фордевинд – быстрорастущая финансовая компания, занимающая лидирующие позиции на рынке краткосрочных займов малому и среднему бизнесу. Помимо кредитного бизнеса мы также оказываем инвестиционно-банковские и консультационные услуги для...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МФК ФордевиндМФК Фордевинд
  • Москва
5 дней назад
АО «Р7» — российский разработчик офисного программного обеспечения, создатель «Р7-Офис». ... Мы в поиске C++ разработчика Чем тебе предстоит заниматься: Разработка и поддержка компонентов офисных ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Р7Р7
  • Москва
5 дней назад
Мы - AI-стартап в области медицины, строим продукт вокруг современных моделей и RAG-архитектур. Ищем сильного Backend-инженера, который поможет масштабировать платформу. Обязанности: Разработка и развитие backend-части продукта на Python + FastAPI; П...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании StaffberryStaffberry
  • Москва
5 дней назад
Сейчас мы ищем уверенного Android разработчика, с высоким уровнем самостоятельности и инициативы, готового ... между клиентским приложением и сервером; Работать в одной команде с мобильными, фронтенд- и бэкенд-разработчиками ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ПИК-специализированный застройщикПИК-специализированный застройщик
  • Москва
5 дней назад
Что тебя ждёт: Работа с Drupal 7, но это не просто Drupal 7 Мы честно признаём: Drupal 7 больше не поддерживается. Но благодаря доработке ядра наша система стабильно работает даже под высокой нагрузкой. Очереди, Kafka и воркеры — Большинство задач (в...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ФГБУ ИАЦ МЧС РОССИИФГБУ ИАЦ МЧС РОССИИ
  • Москва
5 дней назад
Ищем backend-разработчика для разработки инструмента мониторинга позиций товаров на Wildberries. ... Нам важно, чтобы разработчик предложил и реализовал способ получения: органических позиций рекламных ...
  • Можно удаленно
  • Подработка
  • Опыт от 3 лет
Логотип компании ShatteShatte
  • Москва
6 дней назад

Похожие вакансии

до 220 000 ₽
Логотип компании МФК ФордевиндМФК Фордевинд
Логотип компании ПИК-специализированный застройщикПИК-специализированный застройщик
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.