C++ разработчик (TPU Cloud)

По договоренности

  • Текстильщики
  • Кузьминки
  • Кожуховская

Мы развиваем направление облачного AI-инференса (Inference as a Service), использующего ускоритель инференса собственный разработки (Tensor Processing Unit, TPU) . В настоящее время существует прототип сервиса, реализованный на Python, который демонстрирует базовую функциональность инференса моделей в облаке.

Ищем разработчика, который сможет:
* разобраться в рабочем прототипе на Python и пре-альфа версии на С++,
* сформировать полноценные системные требования,
* спроектировать и реализовать высокопроизводительное решение,
* перенести и модифицировать критически важные компоненты на C++,
* предложить архитектуру развертывания, тестирования и мониторинга сервиса.

Обязанности:

  • Анализ и формализация требований

  • Изучение существующего Python-прототипа сервиса инференса.

  • Изучение существующего пре-альфа реализованной на C++.

  • Изучение документации и концептуальной архитектуры сервиса, предложения по изменению архитектурной части при необходимости.

  • Уточнение и формализация требований к системе:
    * метрики производительности (latency, throughput, tail latency),
    * требования к отказоустойчивости и надежности,
    * критерии масштабируемости,
    * компромиссы между пропускной способностью и задержками,
    * требования к SLI / SLO.

  • Участие в формировании технического видения и roadmap развития сервиса.

  • Разработка и оптимизация
    * Переписывание и оптимизация критически важных участков системы на C++.
    * Учет требований к низкой латентности и высокой загрузке оборудования TPU.

  • Бенчмаркинг и тестирование
    * Разработка бенчмарков для оценки:
    * latency (p50/p95/p99),
    * throughput,
    * стабильности под нагрузкой,
    * поведения при деградациях.
    * Проведение нагрузочного тестирования и анализ узких мест.
    * Создание тестовых клиентских приложений (CLI / simple SDK), демонстрирующих работу с сервисом.

  • Архитектура развертывания
    * Предложение архитектуры развертывания сервиса:
    * single-node / multi-node,
    * масштабирование,
    * балансировка нагрузки * отказоустойчивость * Проработка вариантов использования контейнеризации (Docker) и оркестрации (Kubernetes или аналоги).

  • * Предложение схем обновления.

  • Мониторинг и эксплуатация
    * Определение ключевых метрик для мониторинга сервиса.
    * Формирование end point для ключевых метрик сервиса для последующей интеграцией в систему мониторинга.
    * Участие в формировании подходов к эксплуатации и поддержке сервиса.

Требования:
  • Обязательные

    * Отличное знание C++.
    * Опыт разработки высоконагруженных или низколатентных сервисов.
    * Понимание принципов:
    * многопоточности и синхронизации,
    * управления памятью,
    * сетевого программирования.
    * Опыт работы с Linux.
    * Умение читать и дорабатывать существующий код (в том числе на Python).
    * Системное мышление, умение формализовать требования и метрики.

  • Желательные

    * Опыт работы с ML-инференсом или ML runtime (ONNX Runtime, TensorRT, TorchScript и т.п.).
    * Опыт разработки distributed / cloud-сервисов.
    * Знание gRPC, REST, protobuf.
    * Опыт работы с Docker / Kubernetes.
    * Понимание принципов SRE, SLA/SLO, observability.
    * Навыки профилирования и performance tuning.
  • Будет плюсом

    * Опыт проектирования inference-as-a-service или аналогичных платформ.
    * Опыт построения бенчмарков и нагрузочных тестов.
    * Участие в разработке платформ или инфраструктурных сервисов.
Условия:
  • Официальное оформление по ТК РФ;

  • Гибридный формат работы, гибкое начало рабочего дня, также фрукты и печеньки в офисе;

  • Конкурентоспособный уровень заработной платы;

  • Социальный пакет – медицинское страхование;

  • Оплачиваемый выходной день в честь дня рождения;


Адрес: Россия, Москва, Волгоградский проспект, 42
Показать на большой карте

Поделиться:

Опубликована 21 день назад

Похожие вакансии

БУЛАТ — Ведущий российский производитель, разрабатывает и производит высокотехнологичное инфраструктурное оборудование для построения телеком- и ИТ- систем, а также внедряет интеграционные проекты «под ключ» БУЛАТ в цифрах: с 2015 года на рынке; 5 оф...
  • Полный день
  • Опыт от 3 лет
Логотип компании БУЛАТБУЛАТ
  • Москва
2 дня назад
Обязанности: Поддержка существующих ETL-процессов Разработка новых ETL-процессов Поддержка документации в актуальном состоянии Требования: Знание SQL * оконные функции * хранимые процедуры, функции * партиционирование * оптимизация запросов * агрегат...
  • Полный день
  • Опыт от 3 лет
Логотип компании Ситуационно-Информационный Центр Министерства Транспорта Российской ФедерацииСитуационно-Информационный Центр Министерства Транспорта Российской Федерации
  • Москва
2 дня назад
Мы в поиске Аналитика/разработчика в команду, занимающуюся развитием витрин данных (Hadoop) для целей ... оптимизации, бизнес решений и архитектурных стандартов Требования: • опыт работы в качестве Data-инженера / Разработчика ... ETL / Разработчика SQL / Разработчика DWH/ Аналитика DWH / Системного аналитика от 3-х лет • опыт работы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании IT_OneIT_One
  • Москва
2 дня назад
АО «Валента Фарм» – крупная российская инновационная фармацевтическая компания. Мы более 29 лет успешно занимаемся разработкой и производством новых оригинальных препаратов в следующих терапевтических направлениях: психоневрология, гастроэнтерология,...
  • Полный день
  • Опыт от 3 лет
Логотип компании Валента ФармацевтикаВалента Фармацевтика
  • Москва
2 дня назад
Основы веб-технологий: HTML, CSS, JavaScript (особенно при работе в команде с фронтенд-разработчиками ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Ситуационно-Информационный Центр Министерства Транспорта Российской ФедерацииСитуационно-Информационный Центр Министерства Транспорта Российской Федерации
  • Москва
2 дня назад
250 000 - 252 000 ₽
Выше средней на 25%
ООО "RostJob" — ведущая аутсорсинговая IT-компания, предоставляющая высококлассные решения для клиентов по всему миру. Мы специализируемся на разработке масштабных корпоративных приложений, веб-сервисов и мобильных решений, обеспечивая нашим партнера...
  • Полный день
  • Опыт от 3 лет
Логотип компании РостДжобРостДжоб
  • Москва
3 дня назад

Похожие вакансии

Логотип компании Ситуационно-Информационный Центр Министерства Транспорта Российской ФедерацииСитуационно-Информационный Центр Министерства Транспорта Российской Федерации
Логотип компании Валента ФармацевтикаВалента Фармацевтика
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.