Middle / Senior Data Scientist ASR в команду голосовых технологий

По договоренности


Команда голосовых технологий создает онлайн и офлайн модели распознания голоса и извлечения признаков, синтеза и клонирования речи.

Используемый технологический стек:

  • Исследование и обучение: PyTorch, PyTorch Lightning, NeMo
  • Инференс: Triton Inference Server (ONNX, TensorRT)

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

  • Собирать данные под домен, размечать данные;
  • Файнтюнить компоненты пайплайна под термины домена;
  • Развивать микросервисы инференса моделей;
  • Подбирать лучшие практики сбора и предобработки датасетов (в т.ч. Nemo Forced Aligner);
  • Разрабатывать модели поло-возрастной классификации.

МЫ ЖДЕМ, ЧТО ВЫ:

  • Обладаете уверенными знаниями теории отрасли speech (сигналы, распознание, синтез, VAD, диаризация, фреймворки, токенизация);
  • Имеете высшее образование по компьютерным наукам, математике, физике (бакалавриат / магистратура / специалитет / аспирантура);

  • Пишете код на python с механиками асинхронизма для создания датасетов, pipeline;
  • Занимались обучением ASR CTC/RNN-T Conformer, NeMo (в т.ч. метрики обучения, пре-процессинг/пост-процессинг, лоссы);
  • Иметее опыт инференса Torch, ONNX, TensorRT, MultiGPU, pytorch-lightning;
  • Обладаете знаниями в отрасли NLP (n-gram, TF-IDF, Transformers);
  • Обладаете знаниями и опытом в отрасли синтеза речи.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня;
  • Полное соблюдение ТК РФ.


Поделиться:

Опубликована 25 дней назад

Похожие вакансии

Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо это...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
17 дней назад
Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет нам развивать платформу данных для персонализации маркетинга и рекламы Ламода: разрабатывать ML-инструменты и предиктивные модели, которые позволя...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
18 дней назад
Обязанности: Проведение исследований и анализ экспериментов с данными (структурированными и неструктурированными: текст, изображения, видео, аудио). Разработка и внедрение моделей машинного и глубокого обучения (TensorFlow, PyTorch, scikit-learn). Оп...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Электронная торговая площадка ГазпромбанкаЭлектронная торговая площадка Газпромбанка
  • Москва
24 дня назад
Привет! Мы - коммуникационная группа Okkam. Наша специализация — услуги в области маркетинга, рекламы и консалтинга. В России мы уже 25 лет создаем связи между брендами и людьми, профессионально объединяя медиа, креатив и IT технологии. У нас ничего ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OkkamOkkam
  • Москва
18 дней назад
Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату. Мы ищем п...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
12 дней назад
Обязанности: Разработка и реализация подходов для решения задач в области компьютерного зрения (CV), совместное формирование требований с командой; Планирование экспериментов, обучение моделей, оценка их качества и интеграция в пайплайны; Работа с да...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РУСАЛРУСАЛ
  • Москва
20 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.