Senior ML / AI Engineer Lead AI Voice / MLOps Engineer (Streaming Audio / vLLM)

350 000 - 650 000 ₽

Выше средней на 177%

Lead AI Voice / MLOps Engineer (Streaming Audio / vLLM)

Мы — DeepTech стартап. Мы строим собственный in-house конвейер потокового голосового ИИ (ASR ➔ LLM ➔ TTS) сверхнизкой задержки на Nvidia GPU-кластерах.

Мы не делаем очередную «обертку» над OpenAI API или Vapi. Мы создаем свой проприетарный движок. Днем наша система обслуживает реальный сектор SMB (AI-администраторы по SIP-телефонии для малого бизнеса), а ночью интегрируется в качестве бэкенда для умных голосовых NPC в крупнейшие игровые проекты ( пиковый онлайн 14,000+).

Инфраструктуру со стороны DevOps, K8s и автомасштабирования нам помогает выстраивать и валидировать действующий архитектор из Apple. Нам нужен человек, который заберет на себя сердце продукта — ML-пайплайн и задержки.

Главный технический вызов (Твой KPI): Time-to-First-Audio (TTFA) в реальном диалоге с ботом должен составлять строго менее 1000 миллисекунд.

Что нужно будет делать:

  • Развернуть и оптимизировать streaming-пайплайн на GPU (A6000/A100/H100).

  • Слух (ASR): Настроить потоковый Speech-to-Text (Faster-Whisper / Deepgram on-prem).

  • Мозг (LLM): Развернуть Llama 3 (8B) или аналоги через vLLM / TensorRT с минимальным Time-to-First-Token.

  • Голос (TTS): Внедрить быстрый потоковый синтез речи (XTTSv2, OpenVoice или аналоги).

  • Оркестрация: Написать жесткую логику VAD (Voice Activity Detection). Бот должен моментально замолкать при перебивании, но при этом не должно быть пауз в 2 секунды между репликами.

  • Упаковать всё это в production-ready Docker-контейнеры и отдать нам быстрый локальный API.

Наш идеальный кандидат:

  • Уверенно пишет на Python (C++ будет жирным плюсом для оптимизаций).

  • Понимает, как на низком уровне работает память видеокарт (VRAM, CUDA, TensorRT).

  • Имеет реальный опыт работы с vLLM / llama.cpp в продакшене.

  • Понимает основы телефонии и стриминга (WebRTC, SIP, Websockets).

  • Не боится слова "оптимизация" и умеет считать миллисекунды в логах.

  • Самостоятелен: вам не нужен микроменеджмент, вы берете задачу и приносите работающий "черный ящик".

Условия:

  • Оплата: в USD или крипте (USDT), если вы находитесь вне РФ, либо обсуждаем удобные варианты.

  • Полная удаленка, асинхронный формат работы (команда в часовом поясе Калифорнии / PST, но мы не заставляем сидеть на ночных созвонах).

  • Нулевая бюрократия. Никаких Jira-билетов ради билетов — работаем спринтами в Linear на результат.

  • Доступ к топовым GPU-мощностям для любых тестов.

    В сопроводительном письме указывайте тех стэк, опыт работы.

Сравнение со средней зарплатой в похожих вакансиях:

120k

200k

90k

150k

300k


Поделиться:

Опубликована 7 часов назад

Похожие вакансии

Сейчас мы ищем уверенного Linux инженера в команду IT Operations, которая работает на стыке инфраструктуры ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании QuadcodeQuadcode
  • Санкт-Петербург
день назад
Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных ... крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках QA Engineer ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Санкт-Петербург
день назад
Мы - международная финтех IT-компания с главным офисом в Санкт-Петербурге и распределенной командой по ... Наш опыт в IT-разработке финтех решений насчитывает более 10 лет. ... Сейчас мы ищем Platform infrastructure engineer, эксперта по инфраструктуре, который будет следить за ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HeadlinerHeadliner
  • Санкт-Петербург
4 дня назад
АЛРОСА Информационные технологии – представляет различные IT-услуги структурным подразделениям и дочерним ... Мы приглашаем на работу Data engineer в направление КХД и BI центра компетенции по управлению данными ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании АЛРОСААЛРОСА
  • Санкт-Петербург
2 дня назад
Сейчас мы находимся в поиске Lead ML engineer / Lead Researcher в нашу R&D команду. ... IT-аккредитация — компания входит в реестр аккредитованных IT-организаций. ... Возможности группы i-Free: 16 IT-компаний и ~1000 специалистов — митапы, обмен опытом, горизонтальное ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Just AIJust AI
  • Санкт-Петербург
3 дня назад
... 250+ профессионалов, которые сегодня создают то, что казалось невозможным вчера Сейчас мы в поиске QA Engineer ... — компания входит в реестр аккредитованных IT-организаций; Ежегодный выбор бенефита: компенсация ДМС ... клуб, английский язык, Just Talks и другие форматы для вашего развития; Возможности группы i-Free: 16 IT-компаний ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Just AIJust AI
  • Санкт-Петербург
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.