Data Engineer
300 000 - 350 000 ₽
Выше средней на 8%
Обязанности:
- Выполнение роли разработчика корпоративного аналитического Хранилища данных и роли технического эксперта по миграции ХД с Oracle на новый технологический стек (конфигурация хранилища Iceberg, S3, Clickhouse).
- Построение и оптимизация целевого масштабируемого отказоустойчивого аналитического ХД.
- Реализация сложной логики и задач ядра хранилища данных.
- Проектирование и реализация структур данных, алгоритмов загрузки и обработки данных в ХД.
- Создание отказоустойчивых, масштабируемых ETL/ELT пайплайнов с использованием Apache Spark (PySpark/Spark SQL) для обработки больших объемов данных.
- Реализация и управление процессами оркестрации с помощью Apache Airflow, создание сложных DAG с эффективным handling'ом ошибок.
- Настройка и оптимизация ClickHouse для обеспечения низкой задержки в отчетах и дашбордах поверх данных из Iceberg.
- Документирование ХД, включая архитектурные диаграммы, описание структур баз данных, алгоритмов обработки данных и др.
- Формирование состава документов для процесса миграции и эксплуатации ХД на новой платформе.
- Участие в процессе приемки-передачи ХД на новой платформе в промышленную эксплуатацию.
- Взаимодействие со смежными подразделениями. Тесная работа с аналитиками данных и владельцами источников для понимания требований и тестирования результатов.
- Установление лучших практик (best practices) в области инжиниринга данных внутри команды.
- Код-ревью, менторство мидл-инженеров и участие в построения эффективной команды.
Требования:
- Продвинутый опыт работы с Apache Spark (архитектура, оптимизация, tuning) для обработки больших данных;
- Практический опыт построения платформ данных с использованием Apache Iceberg на S3-совместимых хранилищах;
- Опыт настройки и оптимизации ClickHouse под высокие нагрузки;
- Глубокое понимание принципов построения DWH и современных подходов (Lakehouse);
- Опыт разработки и поддержки сложных пайплайнов в Apache Airflow;
- Умение работать в команде и нести ответственность за архитектурные решения. Практически экспертный опыт реализации ETL / ELT;
- Экспертный уровень SQL и глубокое понимание внутренних механизмов работы СУБД;
- Знание подходов к разработке, документированию, тестированию ХД;
- Знание методологий разработки (Agile, Scrum, Waterfall);
- Оконченное высшее образование технических специальностей.
-
Будет сильным преимуществом:
- Опыт построения и эксплуатации платформ данных на Kubernetes.
- Навыки настройки мониторинга и алертинга для пайплайнов и инфраструктуры (Prometheus, Grafana).
- Комфортный график, вы можете работать удаленно.
- Наша компания является аккредитованной ИТ-компанией.
- Мы работает с разными проектами (банки, крупные ритейлеры, обучающие платформы, сети ресторанов) с различным технологическим стеком. Это отличная возможность для роста компетенций наших сотрудников!
- Мы предлагаем работу в команде профессионалов с богатым опытом в крутых технологичных проектах, готовых делиться своими знаниями.
- У нас в компании проектная организационная структура, все возникшие вопросы решаются оперативно. Мы готовы слышать своих сотрудников!
- Мы предлагаем прозрачный карьерный рост, программу личного развития, включающую внешнее и внутреннее обучение.
- Оплачиваем изучение английского языка с репетиром в мини-группах.
- Официальное трудоустройство по трудовому договору, или как ИП (по вашему выбору).
Сравнение со средней зарплатой в похожих вакансиях:
220 тыс. ₽
270 тыс. ₽
280 тыс. ₽
300 тыс. ₽
388 тыс. ₽
Опубликована 3 дня назад
Похожие вакансии
Чем предстоит заниматься: Проектирование архитектуры DWH (выбор подхода: Data Vault, Kimball, гибрид) Выбор и обоснование технологического стека Настройка инфраструктуры Разработка первых пайплайнов для интеграции с источниками данных (MSSQL, Postgre...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Мы занимаемся разработкой сложных систем и приложений в айгейминг сфере. Это качественные и современные продукты под все платформы. В нашу команду анализа данных мы ищем инженера данных, который будет развивать инфраструктуру данных: проектировать и ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
Обязанности: 1. Разработка и поддержка ETL/ELT процессов Проектирование, разработка и оптимизация пайплайнов в Airflow для загрузки и трансформации данных. Автоматизация загрузки данных из различных источников (БД, API, файловые хранилища). Оптимизац...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
до 300 000 ₽
Рыночная зарплата
LIAN — системный интегратор с фокусом в аналитике и управлении данными. Мы работаем в трех направлениях: 1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Ищем Data Engineer в направление рекомендаций, который будет совместно с нами строить пайплайны и развивать платформу данных. В нашей команде коллеги быстро растут и получают опыт в разных задачах — от классического ETL для аналитических витрин до по...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад