Data engineer GigaData
По договоренности
Проект: Создаем поисковый сервис для ответа на запросы пользователей на естественном языке. Ломаем барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.
Обязанности
- разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
- разрабатывать пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования в задачах поиска
- проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи поиска
- применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы – мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых.
Требования
- опыт работы с движками для распределенной обработки данных (Spark, Trino), оркестраторы Airflow
- умение проектировать DWH, Data Lake, Data Management Platform
- опыт построения и развития высоконагруженных систем
- опыт разработки и оптимизации пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
- продвинутый уровень владения Python и SQL
БУДЕТ ПЛЮСОМ:
- опыт работы с таблицами формата Iceberg
- опыт работы с индексами ElasticSearch/OpenSearch
- опыт работы с GPU (инференс моделей).
Условия
- комфортный современный офис - м. Кутузовская
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.
Опубликована 20 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Мы в поиске Data Engineer для создания и поддержки витрин данных, использующихся для задач машинного ...
- Полный день
- Опыт от 3 лет
- Москва
20 часов назад
Сейчас мы находимся в поисках Teamlead Data Engineer в команду Data office S7.
- Полный день
- Опыт от 3 лет
- Москва
18 часов назад
Автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари • Работать в связке с Data ...
- Полный день
- Опыт от 3 лет
- Москва
19 часов назад
Сейчас у нас открыта позиция Data Infrastructure Engineer.
- Полный день
- Опыт от 3 лет
- Москва
19 часов назад
... архитектуры хранилищ данных Знания в области технологий сбора, хранения и обработки данных (Datalake, DWH, Data ... Lakehouse, Data Mesh и др.).
- Полный день
- Опыт от 3 лет
- Москва
20 часов назад