Senior Data Engineer / ML Engineer (GigaChat)
По договоренности
Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем ребят, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
Обязанности
- 60% data engineer, 25% developer, 15% ML
- писать пайплайны обработки аудио/видео данных
- подготовка датасетов для обучения и дообучения llm
- интегрироваться с ml/llm пайплайнами, бэкендом
- внедрять новые решения/фреймворки/тулы в части работы с данными
- улучшать надежность и масштабируемость дата процессов
- инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
- поддержка хранилища данных.
Требования
- python и алгоритмы на хорошем уровне + ООП
- опыт с multithreading и multiprocess
- опыт разработки продакшн-сервисов и дата-пайплайнов
- понимание жизненного цикла LLM
- понимание подходов к контролю качества данных.
- S3 (важно), dvc.
Условия
- гибридный или удаленный формат работы
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 7%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Опубликована 4 часа назад
Похожие вакансии
Чем предстоит заниматься: Анализ требований/методик заказчика (Финансовый блок) Поиск и обработка необходимых данных Проектирование решений, разработка прототипов Самостоятельное принятие решений в спорных вопросах Оптимизация процессов Поддержка и т...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 часа назад
Чем предстоит заниматься: Настройка инфраструктуры Разработка первых пайплайнов для интеграции с источниками данных (MSSQL, PostgreSQL, API) Проектирование и разработка ETL/ELT пайплайнов Настройка интеграций с источниками данных (MSSQL, PostgreSQL, ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Чем предстоит заниматься: Разработка и тестирование интеграционных решений на указанном стеке, системный анализ Анализ существующих решений, документаций Создание документаций по разработанным решениям Оптимизация процессов Наши ожидания от кандидата...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
Чем предстоит заниматься: Разработка и тестирование интеграционных решений на указанном стеке, системный анализ Анализ существующих решений, документаций Создание документаций по разработанным решениям Оптимизация процессов Наши ожидания от кандидата...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
Привет! Мы Родная Речь/RORE — ведущая российская группа компаний, оказываем весь спектр рекламно-коммуникационных услуг: медиа, креатив, исследования и технологии. Мы — это работа с топовыми брендами, создание новых трендов и множество известных кейс...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад