Senior Data Engineer / ML Engineer (GigaChat)
По договоренности
Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком.
Сейчас мы ищем сотрудников, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
Обязанности
- 60% data engineer, 25% developer, 15% ML
- писать пайплайны обработки аудио/видео данных
- подготовка датасетов для обучения и дообучения llm
- интегрироваться с ml/llm пайплайнами, бэкендом
- внедрять новые решения/фреймворки/тулы в части работы с данными
- улучшать надежность и масштабируемость дата процессов
- инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
- поддержка хранилища данных.
Требования
- python и алгоритмы на хорошем уровне + ООП
- опыт с multithreading и multiprocess
- опыт разработки продакшн-сервисов и дата-пайплайнов
- понимание жизненного цикла LLM
- понимание подходов к контролю качества данных.
- S3 (важно), dvc.
Условия
- гибридный или удаленный формат работы
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 7%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Опубликована 6 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ... мониторинга качества данных Документирование архитектурных решений и процессов Что мы от вас ждем : 4+ лет в data ... в распределённых командах Глубокое знание SQL, оптимизация запросов Python (3+ года) для разработки data ... pipelines Колоночные СУБД: ClickHouse Оркестрация ETL/ELT: Airflow Понимание моделирования данных: Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Мы ищем опытного Data Engineer, который усилит команду разработки внутренней платформы Flocktory. ... Engineer/инженер хранилища данных от 3х лет; опыт решения задач репликации данных, создания слоев данных ... data mesh.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Сейчас мы находимся в поиске Data Science инженера данных в команду, которая занимается разработкой платформы ... Требования: Опыт работы с Python и ключевыми библиотеками для Data Science, такими как: Pandas, NumPy ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
... методов машинного обучения; Владение SQL — мы используем PySpark (SQL API) и Hadoop-стек; опыт с Big Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
от 300 000 ₽
Выше средней на 20%
Ищем Data-science эксперта по работе с нейронными сетями и трасформерами для компании из сферы финтех ... Команда В направлении скоринга задействовано 7 Data Scientists (грейды middle, senior). ... Что ожидаем от тебя Опыт работы не менее 3-5 лет в роли Data Scientist.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад