Data Scientist в команду Horizontal ML Technologies

По договоренности

  • Динамо
  • Белорусская
  • Маяковская

О команде

Наша команда создаёт и развивает технологии, которые используются во всем Авито. Мы отвечаем за распознавание и синтез звука, OCR, ряд продуктовых метрик, создаём модели для маркетинга. Мы тщательно подходим к сбору и разметке данных, проводим различные исследования, обучаем свои модели, пишем высоконагруженные сервисы, занимаемся аналитикой.

Мы ищем талантливого коллегу, который усилит стрим Звука. Работа будет разнообразной — от проведения исследований до вывода моделей Звука в продакшен.

Примеры будущих задач:

— исследовать научные статьи и тренды для поиска новых эффективных подходов к решению задач в Звуке, проводить эксперименты, внедрять лучшие практики в продакшен;

— разрабатывать алгоритмы и акустические модели распознавания речи, в том числе для потокового распознавания и на иностранных языках;

— разрабатывать языковые модели для улучшения качества транскрибации;

создавать датасеты для обучения и валидации (есть асессоры и внутренний инструмент для разметки).

Мы ждём, что вы:

— обладаете широкой насмотренностью и опытом работы в области обработки речи (ASR/TTS);

— пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;

— имеете продакшен-опыт в домене NLP (PyTorch, Docker и др.);

— глубоко понимаете алгоритмы обучения моделей для распознавания звука, знакомы с основными фреймворками (NeMo, ESPnet, fairseq);

— имеете опыт сбора качественных данных для обучения моделей распознавания звука, работали с асессорами;

— при необходимости можете самостоятельно собрать разметку, в том числе с помощью опенсорс-моделей и LLM.

Будет здорово, если вы:

— имеете научные публикации или проекты на GitHub;

— имеете опыт реализации моделей, описанных в научных статьях, в домене STT/TTS;

— имеете более года рабочего опыта в STT/TTS.

Работа у нас — это:

— возможность улучшать опыт миллионов пользователей;

— интересные и сложные задачи на большом масштабе;

— сильная команда, которая всегда готова прийти на помощь;

— возможность изучать и пробовать новое, мощное железо для этого;

— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— возможность работать удалённо или из офисов в четырёх городах России.


Адрес: Россия, Москва, Лесная улица, 7
Показать на большой карте

Поделиться:

Опубликована 24 дня назад

Похожие вакансии

... разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data ... Предлагаем присоединиться в роли Data Scientist! ... опыт работы в роли Data Scientist/Data Engineer от 3-х лет; опыт работы со стеком: Python, SQL, airflow ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
день назад
250 000 - 350 000 ₽
Выше средней на 20%
... работы с SQL Понимание статистики, машинного обучения и методов валидации Опыт работы по imbalance data ... преимуществом Опыт внедрения моделей в продакшн Работа с ML pipelines Знание PySpark или работа с Big Data ... Опыт работы по альтернативным данным (open banking, behavioral data) Мы предлагаем Конкурентная заработная ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Уткин Сергей ВладимировичУткин Сергей Владимирович
  • Москва
день назад
Сейчас ищем Data Scientist'а, в задачи которого будет входить углубленная клиентская аналитика, создание ... Мы развиваем и поддерживаем ETL-процессы, выстраиваем Data Governance, поддерживаем BI, встраиваем ML ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Лента, федеральная розничная сетьЛента, федеральная розничная сеть
  • Москва
4 дня назад
от 350 000 ₽
Выше средней на 40%
Мы ищем опытного Data Scientist, который не только умеет работать с данными, но и понимает специфику ... Вклад в формирование стратегического roadmap компании по data-driven торговым решениям. ... Магистерская степень в области прикладной информатики, Data Science, математики, эконометрики или смежной ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании getmatchgetmatch
  • Москва
6 дней назад
... предлагаешь решения и презентуешь результаты; Имеешь опыт работы в продуктовых компаниях на позиции Data ... Scientist / ML Engineer и уверенно закрываешь задачи уровня Senior; Владеешь Python на высоком уровне ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HeadHunterHeadHunter
  • Москва
день назад
Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. О команде и проектах: Команда MLE, DS, DA, MLops ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
4 дня назад

Похожие вакансии

250 000 - 350 000 ₽
Логотип компании Уткин Сергей ВладимировичУткин Сергей Владимирович
Логотип компании Лента, федеральная розничная сетьЛента, федеральная розничная сеть
от 350 000 ₽
Логотип компании getmatchgetmatch
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.