Data Scientist в команду Horizontal ML Technologies

По договоренности

  • Динамо
  • Белорусская
  • Маяковская

О команде

Наша команда создаёт и развивает технологии, которые используются во всем Авито. Мы отвечаем за распознавание и синтез звука, OCR, ряд продуктовых метрик, создаём модели для маркетинга. Мы тщательно подходим к сбору и разметке данных, проводим различные исследования, обучаем свои модели, пишем высоконагруженные сервисы, занимаемся аналитикой.

Мы ищем талантливого коллегу, который усилит стрим Звука. Работа будет разнообразной — от проведения исследований до вывода моделей Звука в продакшен.

Примеры будущих задач:

— исследовать научные статьи и тренды для поиска новых эффективных подходов к решению задач в Звуке, проводить эксперименты, внедрять лучшие практики в продакшен;

— разрабатывать алгоритмы и акустические модели распознавания речи, в том числе для потокового распознавания и на иностранных языках;

— разрабатывать языковые модели для улучшения качества транскрибации;

создавать датасеты для обучения и валидации (есть асессоры и внутренний инструмент для разметки).

Мы ждём, что вы:

— обладаете широкой насмотренностью и опытом работы в области обработки речи (ASR/TTS);

— пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;

— имеете продакшен-опыт в домене NLP (PyTorch, Docker и др.);

— глубоко понимаете алгоритмы обучения моделей для распознавания звука, знакомы с основными фреймворками (NeMo, ESPnet, fairseq);

— имеете опыт сбора качественных данных для обучения моделей распознавания звука, работали с асессорами;

— при необходимости можете самостоятельно собрать разметку, в том числе с помощью опенсорс-моделей и LLM.

Будет здорово, если вы:

— имеете научные публикации или проекты на GitHub;

— имеете опыт реализации моделей, описанных в научных статьях, в домене STT/TTS;

— имеете более года рабочего опыта в STT/TTS.

Работа у нас — это:

— возможность улучшать опыт миллионов пользователей;

— интересные и сложные задачи на большом масштабе;

— сильная команда, которая всегда готова прийти на помощь;

— возможность изучать и пробовать новое, мощное железо для этого;

— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— возможность работать удалённо или из офисов в четырёх городах России.


Адрес: Россия, Москва, Лесная улица, 7
Показать на большой карте

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

Привет! Мы - Медиапоинт - digital-платформа игровой тематики. Мы работаем не только на территории России, но и на международном рынке. В нашу дружную команду ищем Data Scientist В твои задачи будет входить: Полный цикл: от анализа данных, до внедрени...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МедиапоинтМедиапоинт
  • Москва
4 дня назад
«Лучи» — это новая онлайн-страховая: простая, быстрая и честная. Мы объединили страхование, медицину и IT, чтобы создать экосистему полезных сервисов. Так мы упрощаем жизни более миллиона людей по всей стране. В основе нашей компании — собственная те...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ЛучиЛучи
  • Москва
2 дня назад
Основная наша задача - кредитный скоринг в Банке. С помощью ML моделей мы прогнозируем вероятность возврата кредита клиентом и на основе этого принимаем решение о выдаче кредита. Предсказывая риски, Банк может принимать более обоснованные решения о к...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГазпромбанкГазпромбанк
  • Москва
9 часов назад
Fintech компания AMarkets с 2007 года предоставляет передовые решения для торговли на финансовых рынках для трейдеров и инвесторов во всем мире. Мы строим глобальную компанию, конкурируем с мировыми игроками и, главное, получаем удовольствие, занимая...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AMarketsAMarkets
  • Москва
4 дня назад
Мы в поиске Senior Data Scientist в команду Advertising DMP (Data Management Platform), который поможет нам развивать платформу данных для персонализации маркетинга и рекламы Ламода: разрабатывать ML-инструменты и предиктивные модели, которые позволя...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Lamoda TechLamoda Tech
  • Москва
4 дня назад
Наша команда занимается отбором кандидатов во всех рекомендательных алгоритмах Ozon. Команда отвечает за формирование всех источников кандидатов, разработку офлайн и рантайм алгоритмов кандидатогенерации, оптимизацию и улучшение пайплайнов сбора данн...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.