Senior Data Engineer (TTS)

По договоренности


Наша команда отвечает за качество моделей TTS в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем тех, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.

Задачи:

  • писать пайплайны обработки аудио/видео данных
  • подготавливать датасеты для обучения и дообучения llm
  • интегрироваться с ml/llm пайплайнами, бэкендом
  • внедрять новые решения/фреймворки/тулы в части работы с данными
  • улучшать надежность и масштабируемость дата процессов
  • инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
  • поддерживать хранилище данных.

Мы ждем от тебя:

  • python и алгоритмы на хорошем уровне, ООП (от 3 лет коммерческого опыта)
  • опыт с multithreading и multiprocess
  • опыт разработки продакшн-сервисов и дата-пайплайнов
  • понимание жизненного цикла LLM
  • понимание подходов к контролю качества данных.
  • S3, dvc.

Мы предлагаем:

  • гибридный или удаленный формат работы
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

Поделиться:

Опубликована 15 часов назад

Похожие вакансии

210 000 - 275 000 ₽
Ищем Data Engineer на проект дочки ВТБ. О проекте: компания работает в области инвестиционного анализа (акции, облигации, индексы, рынки и компании). Разрабатывает новый и без преувеличения инновационный цифровой продукт для российского рынка, которы...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании WIT recruitmentWIT recruitment
  • Москва
15 часов назад
Чем предстоит заниматься: Анализ требований/методик заказчика (Финансовый блок) Поиск и обработка необходимых данных Проектирование решений, разработка прототипов Самостоятельное принятие решений в спорных вопросах Оптимизация процессов Поддержка и т...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Альфа-БанкАльфа-Банк
  • Москва
4 дня назад
Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем ребят, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами. Обязанн...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
4 дня назад
Чем предстоит заниматься: Настройка инфраструктуры Разработка первых пайплайнов для интеграции с источниками данных (MSSQL, PostgreSQL, API) Проектирование и разработка ETL/ELT пайплайнов Настройка интеграций с источниками данных (MSSQL, PostgreSQL, ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании FUN&SUNFUN&SUN
  • Москва
7 дней назад
250 000 - 350 000 ₽
Рыночная зарплата
Компания «Про.Потолок» приглашает в команду Senior ML Engineer / Data Scientist (Computer Vision & NLP) для работы над масштабными и технологически сложными проектами в сфере цифровизации строительства. Мы создаем будущее строительной индустрии и...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Про.ПотолокПро.Потолок
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.