Data engineer в команду GigaChat (TTS)
По договоренности
Наша команда отвечает за качество моделей TTS в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем сотрудников, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
Обязанности
Писать пайплайны обработки аудио/видео данных.
Хотим обрабатывать десятки тысяч часов в день на кластере
инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
поддержка сетевого хранилища данных
Требования
- python и алгоритмы на хорошем уровне
- опыт с multithreading и multiprocess
- опыт обучения и/или инференса тяжелых моделей на нескольких гпу
- s3, dvc, git
Условия
- гибридный или удаленный формат работы
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Опубликована 2 дня назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAXПрикладная аналитическая платформа Блока Риски - это решение, позволяющее создавать аналитические витрины на Облаке Данных по различным направлениям бизнеса таких как: расчет оптимальных стратегий взыскания расчет предложений по реструктуризации расч...
- Полный день
- Опыт от 3 лет
- Москва
4 часа назад
Наша команда решает широкий спектр Data Science задач с применением актуальных ML/DL алгоритмов и инструментов ... бизнесу увеличивать доходность за счет моделей машинного обучения, для чего развиваем аналитическую Data ...
- Полный день
- Опыт от 3 лет
- Москва
день назад
В связи с активным развитием проектов в компании открыта вакансия DATA ENGINEER.
- Полный день
- Опыт от 3 лет
- Москва
день назад
НАШ СТЕК: Hadoop, GreenPlum, S3; Airflow, Spark, Kafka, Debezium; ClickHouse, Superset; ЧТО ТЕБЯ ЖДЕТ: Анализ имеющегося функционала хранилища данных для целей миграции бизнес-процессов; Анализ новых требований от заказчиков по задачам развития отчет...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Группа Rubytech — лидирующий производитель программно-аппаратных комплексов и разработчик технологий для высоконагруженных ИТ-инфраструктур. Мы выпускаем собственную линейку ПАК Скала^р, а также строим и защищаем от киберугроз инфраструктуру, обеспеч...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
... оркестраторами ETL процессов владение SQL на уровне native speaker уверенное знание Python опыт работы с Big Data ...
- Полный день
- Опыт от 3 лет
- Москва
4 часа назад