Data Scientist в ML-сервисы Yandex Cloud

По договоренности

  • Третьяковская
  • Новокузнецкая
  • Третьяковская

Наша команда разрабатывает ML-сервисы Yandex SpeechKit, OCR и Vision, Translate, YandexGPT, Alice AI и инструменты, которые помогают специалистам по Data Science обучать нейросетевые модели на десятках терабайт данных и сотнях GPU, контролировать эксплуатацию этих моделей в облаке и в контуре клиента.

Помимо этих базовых ML-технологий, мы сами разрабатываем и продукты поверх них. Например, Realtime API (для speech-to-speech голосовых помощников), AI Search (платформу для построения раг-решений), SpeechSense (платформу речевой аналитики).

Мы ищем специалиста по Data Science и аналитике.

Какие задачи вас ждут:

  • Анализировать пользовательский опыт и строить метрики и процессы оценки качества ML-сервисов и продуктов

Чтобы улучшать качество наших моделей и продуктов, понимать их сильные и слабые места и приоритизировать планы разработки новой функциональности, необходима качественная и количественная аналитика. Без метрик и приборов, которые покажут, куда необходимо двигаться, жить нельзя — и вы поможете нам строить такие приборы и процессы их регулярного обновления.

  • Строить процессы разметки данных для обучения ML-моделей

Один из ключевых факторов, влияющих на качество ML-моделей, — это данные для обучения. Вы будете разрабатывать процессы сбора и разметки данных, оценивать и улучшать качество процессов. Примеры задач: разметка данных для распознавания речи на узбекском языке; сбор обучающих данных для задач текстовой классификации.

  • Помогать проверять продуктовые гипотезы

Мы не только разрабатываем модели, но и помогаем внедрять их в продукты. При внедрении возникает множество гипотез о том, что и как можно сделать с помощью моделей. Для проверки гипотез часто требуется разработать и проанализировать прототип, выбрать лучший вариант решения задачи. Вы поможете менеджерам продукта и разработчикам строить прототипы и изучать варианты технических решений. Пример задачи: анализ разных алгоритмов кластеризации текстов на основе GPT.

Мы ждем, что вы:

  • Пишете на Python
  • Хорошо знаете статистику
  • Разбираетесь в современных методах ML и NLP
  • Обрабатывали и анализировали большие объёмы данных с помощью pandas, SQL, статистических пакетов, библиотек для визуализации данных, Spark SQL, Spark, Hadoop
  • Работали с системами контроля версий, например с Git

Будет плюсом, если вы:

  • Работали с DataLens
  • Работали с краудсорсингом (Яндекс Толокой, Яндекс Заданиями)

Адрес: Россия, Москва, Центральный административный округ, район Хамовники, 445-й квартал
Показать на большой карте

Поделиться:

Опубликована 8 часов назад

Похожие вакансии

Ищем коллегу в команду разработки AI-агентов Департамента Инфраструктрных решений для построения мультиагентной системы оптимизации инфраструктуры. В рамках проекта предполагается построение ряда Classic-ML моделей и LLM-приложений, чей эффект напрям...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
8 часов назад
В связи с активным развитием проектов в компании открыта вакансия Data Scientist.
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
8 часов назад
Ищем Senior Data Scientist для разработки и масштабирования AI-продуктов с измеримым бизнес-эффектом ...
  • Полный день
  • Опыт от 3 лет
Логотип компании РУСАЛРУСАЛ
  • Москва
8 часов назад
... крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках Data ... Scientist. ... Ожидания от кандидата: Опыт работы Data Scientist от 3,5 лет+; Отличные знания Python и SQL; Понимание ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
3 дня назад
... отвечать на любой вопрос к государству и оказать более 30 миллионов услуг в режиме диалога Сейчас мы ищем Data ... Scientist , который усилит команду Что ты будешь делать Работать над проектом, который напрямую влияет ... аналитиков, разметчиков, тестировщиков, владельца продукта и архитектора Мы ждём, что ты Имеешь опыт в Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании РТЛабсРТЛабс
  • Москва
8 часов назад
Обязанности: • разработка и поддержание различных внутренних моделей кредитного риска ЮЛ (PD, оценка выручки, модели оценки лимитов и др.) с помощью методов классического машинного обучения (обобщенные линейные модели, градиентный бустинг, случайный ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Альфа-БанкАльфа-Банк
  • Москва
8 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.