Data Engineer
По договоренности
Обязанности:
1. Разработка и поддержка ETL/ELT процессов
- Проектирование, разработка и оптимизация пайплайнов в Airflow для загрузки и трансформации данных.
- Автоматизация загрузки данных из различных источников (БД, API, файловые хранилища).
- Оптимизация ETL-процессов для работы с большими объемами данных.
2. Работа с базами данных (ClickHouse, PostgreSQL)
- Проектирование моделей данных и схем хранения для аналитики.
- Оптимизация SQL-запросов, индексация, настройка партиционирования и репликации.
- Настройка и поддержка ClickHouse и PostgreSQL для высоконагруженных аналитических задач.
3. Витринизация данных и подготовка аналитики
- Разработка агрегированных витрин данных для BI-инструментов (Tableau).
- Настройка процессов обновления данных в витринах.
- Оптимизация хранения данных и построение OLAP-структур.
4. Интеграция и работа с API
- Подключение к внешним API и автоматизация выгрузок данных.
- Разработка сервисов для передачи данных между системами.
- Создание механизмов стриминговой обработки данных (Kafka/RabbitMQ).
5. Автоматизация и DevOps-практики
- Настройка мониторинга процессов (логирование, алерты, метрики).
- Поддержка CI/CD-процессов для деплоя ETL-скриптов.
- Контейнеризация сервисов с использованием Docker/Kubernetes.
6. Работа с аналитиками и бизнес-командами
- Сбор требований от аналитиков и продуктовых команд.
- Дизайн моделей данных с учетом бизнес-логики и аналитических нужд.
- Поддержка пользователей BI-отчетности (оптимизация запросов, настройка дашбордов).
7. Обеспечение качества и безопасности данных
- Контроль целостности данных и обработка ошибок загрузки.
- Настройка доступов и ролевой модели для работы с данными.
- Разработка тестов и механизмов валидации данных.
- Высшее образование в области информационных технологий, математики или смежных дисциплин.
- Опыт работы с инструментами ETL/ELT (Apache Airflow) не менее 2-х лет.
- Уверенные знания SQL и опыт работы с базами данных ClickHouse и PostgreSQL.
- Опыт разработки BI-решений и работы с инструментами визуализации данных (Tableau).
- Знания в области интеграции API и опыт работы с Kafka/RabbitMQ.
- Опыт работы с Docker/Kubernetes и понимание DevOps-практик.
- Умение работать в команде, высокая степень ответственности и внимание к деталям.
- Хорошие коммуникативные навыки и способность взаимодействовать с аналитиками и бизнес-командами.
- Применяется удаленный формат работы, место работы возможно в любом городе или любой стране.
- График: 5/2 с 10.00 до 19.00 по московскому времени.
- Динамичная работа в команде профессионалов.
Опубликована 8 дней назад
Похожие вакансии
Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. Ищем дата инженера в направление Data Platform! В...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
15 часов назад
300 000 - 380 000 ₽
Выше средней на 13%
LIAN — системный интегратор с фокусом в аналитике и управлении данными. Мы работаем в трех направлениях: 1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Основная наша цель - это создание и эффективное внедрение ML моделей для решения бизнес - задач в Банке. Мы ищем инженера данных, который поможет обеспечивать ML инженеров надёжными и качественными данными. Вам предстоит организовывать хранение и обр...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
300 000 - 350 000 ₽
Выше средней на 8%
Обязанности: Выполнение роли разработчика корпоративного аналитического Хранилища данных и роли технического эксперта по миграции ХД с Oracle на новый технологический стек (конфигурация хранилища Iceberg, S3, Clickhouse). Построение и оптимизация цел...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Чем предстоит заниматься: Проектирование архитектуры DWH (выбор подхода: Data Vault, Kimball, гибрид) Выбор и обоснование технологического стека Настройка инфраструктуры Разработка первых пайплайнов для интеграции с источниками данных (MSSQL, Postgre...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Мы занимаемся разработкой сложных систем и приложений в айгейминг сфере. Это качественные и современные продукты под все платформы. В нашу команду анализа данных мы ищем инженера данных, который будет развивать инфраструктуру данных: проектировать и ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
Вакансия в подборках
Похожие вакансии
300 000 - 380 000 ₽
300 000 - 350 000 ₽