Data Engineer

По договоренности

  • Павелецкая
  • Автозаводская
  • Технопарк

Мы ищем Data Engineer, который поможет построить data-инфраструктуру с нуля: наладить ETL/ELT-процессы, организовать регулярную загрузку данных из Oracle и PostgreSQL, подготовить аналитические витрины для бизнеса и заложить основу для дальнейшего развития BI и ML-направлений.

Первоочередные задачи:

  • Разобраться в текущих источниках данных: Oracle, PostgreSQL, существующие таблицы, связи и бизнес-сущности;

  • Совместно с DBA определить безопасные способы регулярной выгрузки данных из production-баз;

  • Спроектировать и внедрить первые ETL/ELT-процессы;

  • Настроить регулярную загрузку данных из Oracle и PostgreSQL;

  • Построить staging-слой и первые аналитические витрины;

  • Подготовить данные для отчетности, BI-дашбордов и бизнес-аналитики;

  • Помогать бизнесу формулировать метрики, KPI и требования к данным;

  • Настроить базовые проверки качества данных: полнота, дубликаты, актуальность, сверки между источниками и витринами;

  • Документировать источники данных, пайплайны, таблицы и бизнес-логику;

  • Постепенно заложить основу для будущих ML-задач: подготовка датасетов, feature tables и регулярное обновление данных.

Мы ищем человека, который:

  • Имеет опыт работы Data Engineer / ETL Developer / DWH Developer / BI Data Engineer от 3 лет;

  • Уверенно знает SQL и имеет опыт работы с реляционными базами данных;

  • Имеет опыт работы с PostgreSQL;

  • Имеет опыт с Oracle (будет большим плюсом);

  • Уверенно знает Python для автоматизации, загрузки и обработки данных;

  • Понимает ETL/ELT-процессы и принципы построения DWH / ODS / data marts;

  • Имеет опыт создания аналитических витрин;

  • Понимает инкрементальные загрузки и безопасное извлечение данных из production-баз;

  • Умеет работать с большими таблицами без лишней нагрузки на операционные базы;

  • Имеет опыт работы с Git;

  • Имеет базовый опыт с Linux;

  • Умеет взаимодействовать с DBA, аналитиками, разработчиками и бизнес-заказчиками;
  • Готов работать в условиях, где data-инфраструктура только формируется.

Будет плюсом

  • Опыт с Airflow, Prefect, Dagster или другими инструментами оркестрации;
  • Опыт с dbt;
  • Опыт с BI-инструментами: Power BI, Tableau, Metabase, Superset, Looker;
  • Опыт построения DWH, ODS или аналитических витрин с нуля;
  • Опыт внедрения data quality-проверок;
  • Опыт с Docker и базовым CI/CD;
  • Понимание CDC, логической репликации PostgreSQL, Debezium, Oracle GoldenGate или аналогичных подходов;
  • Опыт подготовки данных для ML-моделей;
  • Базовое понимание ML: датасеты, признаки, обучение моделей, оценка качества;
  • Опыт с pandas, scikit-learn, XGBoost / LightGBM.

Мы предлагаем:

  • Возможен вариант работы: удаленно (в пределах РФ)/ частично удаленно/ офис
  • Компенсацию за переезд также из регионов в Москву
  • Конкурентную заработную плату, квартальные премии по результатам работы.

Адрес: Россия, Москва, улица Ленинская Слобода, 19
Показать на большой карте

Поделиться:

Опубликована 21 час назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
Наши ключевые требования: Опыт от 3 лет в роли Data / DWH / ETL-инженера в production-среде.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HeadHunterHeadHunter
  • Москва
2 дня назад
... различные инструменты для сбора и анализа данных, и сейчас ищем человека, который будет развивать наше Data-направление ... metastore, Spark, Flink, Airflow, Trino Задачи: Проектирование и разработка конвейеров обработки данных (Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании HeadHunterHeadHunter
  • Москва
2 дня назад
Вам предстоит: Проводить интеграцию потоков данных в единый контур хранения (Data Lake); строить аналитических ... Вы нам подходите, если: Имеете опыт работы с Data lake-ами (на базе S3 и/или HDFS); владеете опытом работы ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
2 дня назад
Проектировать, разрабатывать и оптимизировать ETL‑процессы и пайплайны данных с использованием Talend Data ... Ключевые Technical skills Опыт работы в data engineering от 3 лет, с акцентом на стек Talend (Talend ... Data Integration, Talend Cloud, Talend JobServer).
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МоккаМокка
  • Москва
3 дня назад
Review, быть гарантом архитектурной целостности и соблюдения командных стандартов; Улучшать практики Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании MarfatechMarfatech
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.