Inference Engineer

По договоренности

  • Марксистская
  • Третьяковская
  • Маяковская

Ищем Inference инженера в международную продуктовую AI-компанию, которая уже более 4 лет разрабатывает приложение для редактирования фото и видео на базе компьютерного зрения и искусственного интеллекта. Продукт активно растёт, используется пользователями в США и Европе, а команда работает над тем, чтобы сложные AI-модели работали быстро и стабильно в реальном продукте.

Чем предстоит заниматься:

  • Оптимизировать инференс нейросетей в продакшене: искать узкие места, измерять производительность, ускорять работу моделей

  • Адаптировать и оптимизировать модели для запуска на мобильных устройствах (latency, потребление памяти, батарея, стабильность)

  • Улучшать серверный инференс: повышать пропускную способность и снижать стоимость вычислений

  • Работать совместно с ML-исследователями над архитектурой моделей с учётом их эффективности в реальном использовании

  • Внедрять готовые решения и, при необходимости, разрабатывать кастомные оптимизации под конкретные сценарии

Кого мы ищем:

  • Коммерческий опыт оптимизации инференса нейросетей (mobile / edge / server)

  • Глубокий практический опыт хотя бы с одним из инструментов: Core ML / TFLite / ONNX Runtime / TensorRT или низкоуровневые технологии: Metal / Vulkan / OpenCL / OpenGL / CUDA / Triton

  • Понимание архитектуры GPU / NPU и принципов их работы

  • Опыт применения техник оптимизации инференса.

  • Будет плюсом: Опыт on-device inference (особенно iOS), опыт работы с моделями компьютерного зрения (фото / видео)

Что предлагает компания:

  • Гибридный график работы в Тбилиси (помощь по релокации предоставляется);

  • Конкурентный доход (вилка обсуждается индивидуально);

  • Возможность работать с реальными AI-продуктами, которые используются сотнями тысяч пользователей ($50M ARR and 250K+ пользователей);

  • Работа в сильной инженерной команде в быстрорастущем стартапе, сотрудники компании имели опыт работы в топ-компаниях отрасли, таких как Lensa, Picsart, Viber, AIRI, Yandex.


Адрес: Россия, Москва
Показать на большой карте

Поделиться:

Опубликована 10 дней назад

Похожие вакансии

red_mad_robot — технологическая компания с экспертизой в запуске цифровых продуктов и новых бизнесов. Включает red_mad_robot AI — центр исследований и разработки ИИ-решений. Мы расширяем команду и ищем опытного Специалист технической поддержки / IT S...
  • Полный день
  • Опыт от 3 лет
Логотип компании red_mad_robotred_mad_robot
  • Москва
9 дней назад
Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
19 дней назад
Задачи: Настройка и сопровождение рабочих мест (Windows, macOS, iOS, Android, Linux); Поддержка мобильной техники, ноутбуков, планшетов, периферии Интеграция пользовательских устройств с корпоративными ИТ-системами; Поддержка сервисов Microsoft (AD, ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Управляющая компания РОСНАНОУправляющая компания РОСНАНО
  • Москва
19 дней назад
КОМПАНИЯ «АЙ-ТЕКО» - ведущий российский системный интегратор и поставщик информационных технологий для корпоративных заказчиков. Активно действует на рынке IT России с 1997 года, входит в ТОП-400 крупнейших российских компаний, ТОП-10 крупнейших IT-к...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
13 дней назад
Мечтай о большем с Napoleon IT Мы — не просто IT-компания, а место, в котором искусственный интеллект объединяется с человеческим. Мы — это более 250 сотрудников, 3 офиса в России, 3 разных направления развития: заказная разработка, outstaffing, собс...
  • Полный день
  • Опыт от 3 лет
Логотип компании Napoleon ITNapoleon IT
  • Москва
6 дней назад
Data Engineer / Data Architect (крупная международная FMCG-компания) Формат: гибрид — 1 день в неделю в офисе, м. Сокол Мы приглашаем Data Engineer уровня архитектора в команду, которая является ключевым IT-партнёром eCommerce-функции крупной междуна...
  • Полный день
  • Опыт от 3 лет
Логотип компании ARKARK
  • Москва
12 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.