Data Engineer

По договоренности


Мы — многопрофильный холдинг ИТР, один из наших проектов — аналитическая платформа рыночных данных на базе ИИ для стратегического планирования и оптимизации расходов, времени и ресурсов. Сейчас мы в поиске Data Engineer в нашу команду.

Твои задачи:
— Создание и поддержка DAG в Apache Airflow для автоматической обработки входящих файлов (PDF, XLSX, CSV) в количестве 55 000+ единиц.
— Парсинг сложных документов, написание скриптов на Python для обработки Excel-файлов с мультилистами, объединенными ячейками и нестандартными сдвигами по годам.
— Очистка данных, приведение временных срезов к единому формату, извлечение и обогащение метаданных для последующего анализа.
— Организация загрузки данных в PostgreSQL с использованием модели schema-per-tenant. Автоматизация создания и клонирования шаблонов схем при подключении (onboarding) нового клиента.
— Обеспечение взаимодействия пайплайнов с enterprise-хранилищами (MinIO / S3) для чтения исходных файлов и сохранения результатов обработки.

Что важно для нас:
— Уверенное владение Python и библиотеками для работы с данными (Pandas, OpenPyXL, PyPDF2 и аналоги).
— Понимание архитектуры Airflow, умение проектировать DAG, настраивать сенсоры (file sensors) и работать с очередями задач.
— Опыт управления схемами (schema-per-tenant), понимание процессов резервного копирования и восстановления (pg_dump/pg_restore) на уровне схем.
— Готовность разбираться в нестандартных структурах таблиц, умение писать устойчивый к ошибкам код для парсинга сложных Excel-отчетов.
— Опыт с Docker / Docker Compose для развертывания и локального тестирования сервисов.

Условия и возможности:
— График 5/2, гибридный формат работы (возможна полная удаленка).
— Работа с передовыми технологиями: Реальные задачи ИИ и аналитики, работа с большим объемом данных и современным стеком.
— Конкурентная заработная плата, обсуждаемая по итогам собеседования с учетом ваших компетенций.


Поделиться:

Опубликована 21 день назад

Похожие вакансии

Чем предстоит заниматься: Проектирование и развитие data-пайплайнов для обработки событий кибербезопасности ... Что мы ждем от кандидата: Опыт построения и эксплуатации data pipelines (ETL, ELT и/или streaming) в ... ; Практики data quality (валидации, контроль пропусков и объёмов данных.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Cloud.ruCloud.ru
  • Москва
19 часов назад
Требования: Опыт работы в роли Data инженера / ETL-инженера от 3 лет; Отличное знание SQL, умение писать ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Coral ClubCoral Club
  • Москва
3 дня назад
В связи с активным развитием проектов в компании открыта вакансия Data Engineer СТД на 6 месяцев (Удаленно ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
2 дня назад
до 250 000 ₽
... архитектуры хранилища; Документирование архитектуры и процессов обработки данных; Требования: Опыт работы Data ... Engineer от 2-ух лет; Уверенное владение Python 3.8+.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МФК ВЭББАНКИРМФК ВЭББАНКИР
  • Москва
4 дня назад
до 250 000 ₽
В связи с активным развитием проектов в компании открыта вакансия Data Engineer на Срочный трудовой договор ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
3 дня назад
... мониторинга качества данных Документирование архитектурных решений и процессов Что мы от вас ждем : 4+ лет в data ... в распределённых командах Глубокое знание SQL, оптимизация запросов Python (3+ года) для разработки data ... pipelines Колоночные СУБД: ClickHouse Оркестрация ETL/ELT: Airflow Понимание моделирования данных: Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании FUN&SUNFUN&SUN
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.