Middle / Senior Data Scientist ASR в команду голосовых технологий
По договоренности
Команда голосовых технологий создает онлайн и офлайн модели распознания голоса и извлечения признаков, синтеза и клонирования речи.
Используемый технологический стек:
- Исследование и обучение: PyTorch, PyTorch Lightning, NeMo
- Инференс: Triton Inference Server (ONNX, TensorRT)
ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:
- Собирать данные под домен, размечать данные;
- Файнтюнить компоненты пайплайна под термины домена;
- Развивать микросервисы инференса моделей;
- Подбирать лучшие практики сбора и предобработки датасетов (в т.ч. Nemo Forced Aligner);
- Разрабатывать модели поло-возрастной классификации.
МЫ ЖДЕМ, ЧТО ВЫ:
- Обладаете уверенными знаниями теории отрасли speech (сигналы, распознание, синтез, VAD, диаризация, фреймворки, токенизация);
-
Имеете высшее образование по компьютерным наукам, математике, физике (бакалавриат / магистратура / специалитет / аспирантура);
- Пишете код на python с механиками асинхронизма для создания датасетов, pipeline;
- Занимались обучением ASR CTC/RNN-T Conformer, NeMo (в т.ч. метрики обучения, пре-процессинг/пост-процессинг, лоссы);
- Иметее опыт инференса Torch, ONNX, TensorRT, MultiGPU, pytorch-lightning;
- Обладаете знаниями в отрасли NLP (n-gram, TF-IDF, Transformers);
- Обладаете знаниями и опытом в отрасли синтеза речи.
ЧТО МЫ ПРЕДЛАГАЕМ:
- Достойный уровень вознаграждения;
- ДМС со стоматологией с первого месяца работы;
- Отпуск 33 дня;
- Полное соблюдение ТК РФ.
Опубликована 25 дней назад
Похожие вакансии
Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо это...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
17 дней назад
Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет нам развивать платформу данных для персонализации маркетинга и рекламы Ламода: разрабатывать ML-инструменты и предиктивные модели, которые позволя...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
18 дней назад
Обязанности: Проведение исследований и анализ экспериментов с данными (структурированными и неструктурированными: текст, изображения, видео, аудио). Разработка и внедрение моделей машинного и глубокого обучения (TensorFlow, PyTorch, scikit-learn). Оп...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
24 дня назад
Привет! Мы - коммуникационная группа Okkam. Наша специализация — услуги в области маркетинга, рекламы и консалтинга. В России мы уже 25 лет создаем связи между брендами и людьми, профессионально объединяя медиа, креатив и IT технологии. У нас ничего ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
18 дней назад
Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату. Мы ищем п...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
12 дней назад
Обязанности: Разработка и реализация подходов для решения задач в области компьютерного зрения (CV), совместное формирование требований с командой; Планирование экспериментов, обучение моделей, оценка их качества и интеграция в пайплайны; Работа с да...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
20 дней назад