Data engineer (Авторешения)
По договоренности
Мы — амбициозная команда, которая занимается развитием BI-отчетности, автоматизацией процессов регистрации инцидентов операционного риска и подготовкой данных для ML моделей. Мы создаём инновационные продукты, которые повышают эффективность и прозрачность бизнеса.
- основные технологии: Airflow, PostgreSQL, Kafka, Superset, Hadoop, Spark
- языки программирования и инструменты: Python, Spark, SQL
- системы управления кодом и CI/CD: BitBucket (Git), Jenkins
- управление задачами и документацией: Jira, Confluence
- работа по методологии Agile.
Обязанности
- проектирование архитектуры и модели витрин данных
- разработка и оптимизация ETL-процессов для загрузки и обработки данных в DWH
- создание процессов мониторинга, проверок качества данных и автотестов разработанного функционала
- ведение технической документации по потокам данных.
Требования
- опыт разработки автоматизированных ETL-потоков (желательно в Airflow и/или Hadoop (Spark)) или схожего функционала от 1 года
- продвинутый уровень владения Python и SQL
- понимание принципов работы баз данных, обработки больших данных и концепций непрерывной интеграции и доставки (CI/CD)
- высшее образование и широкий технический кругозор
- проактивность и ответственность за конечный результат
- английский язык на уровне чтения документации
- опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
- инструментальное владение AI для анализа, генерации и автоматизации.
Условия
- регулярное обучение hard и soft skills в нашем корпоративном университете
- большое количество различных митапов и хакатонов с возможностью выступить на мероприятиях в качестве спикера
- льготная ипотека от Сбера для сотрудников
- прекрасный ДМС с лучшими клиниками города Москвы
- работа в лучшем офисе страны
- регулярный пересмотр заработной платы в зависимости от результатов
- бесплатный фитнес и тренажерный зал.
Опубликована 4 часа назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX SberData отвечает за развитие платформы для работы с данными в Сбере. У нас свыше 230 Петабайт данных, около сотни продуктов и сервисов для клиентов, включая Супермаркет данных, Дататеку, Лабораторию данных, Графовую платформу и многие другие. Мы соз...
- Полный день
- Опыт от 1 года
- Москва
день назад
Проект предполагает создание полностью нового дашборда на BI-платформе Банка (АС Навигатор), который мог бы выполнять те же функции, что и текущие дашборды в QlikSense, с учетом того, что не весь функционал при миграции возможно наследовать. Для этог...
- Полный день
- Опыт от 1 года
- Москва
2 дня назад
... разрабатывать витрины данных Проектировать, разрабатывать и поддерживать процессы ETL для загрузки данных в/из Data ... Lake Оптимизировать работу существующих дата-пайплайнов Интегрировать новые источники данных в Data ...
- Полный день
- Опыт от 1 года
- Москва
4 часа назад
Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных ...
- Полный день
- Опыт от 1 года
- Москва
5 дней назад
Обязанности: Подготовка и очистка датасетов для задач компьютерного зрения Разметка и валидация данных (самостоятельно и с помощью инструментов/команды) Конвертация датасетов между форматами (COCO, YOLO, Pascal VOC и др.) Анализ качества датасета, ба...
- Полный день
- Опыт от 1 года
- Москва
день назад