Data Engineer

По договоренности


Мы — многопрофильный холдинг ИТР, один из наших проектов — аналитическая платформа рыночных данных на базе ИИ для стратегического планирования и оптимизации расходов, времени и ресурсов. Сейчас мы в поиске Data Engineer в нашу команду.

Твои задачи:
— Создание и поддержка DAG в Apache Airflow для автоматической обработки входящих файлов (PDF, XLSX, CSV) в количестве 55 000+ единиц.
— Парсинг сложных документов, написание скриптов на Python для обработки Excel-файлов с мультилистами, объединенными ячейками и нестандартными сдвигами по годам.
— Очистка данных, приведение временных срезов к единому формату, извлечение и обогащение метаданных для последующего анализа.
— Организация загрузки данных в PostgreSQL с использованием модели schema-per-tenant. Автоматизация создания и клонирования шаблонов схем при подключении (onboarding) нового клиента.
— Обеспечение взаимодействия пайплайнов с enterprise-хранилищами (MinIO / S3) для чтения исходных файлов и сохранения результатов обработки.

Что важно для нас:
— Уверенное владение Python и библиотеками для работы с данными (Pandas, OpenPyXL, PyPDF2 и аналоги).
— Понимание архитектуры Airflow, умение проектировать DAG, настраивать сенсоры (file sensors) и работать с очередями задач.
— Опыт управления схемами (schema-per-tenant), понимание процессов резервного копирования и восстановления (pg_dump/pg_restore) на уровне схем.
— Готовность разбираться в нестандартных структурах таблиц, умение писать устойчивый к ошибкам код для парсинга сложных Excel-отчетов.
— Опыт с Docker / Docker Compose для развертывания и локального тестирования сервисов.

Условия и возможности:
— График 5/2, гибридный формат работы (возможна полная удаленка).
— Работа с передовыми технологиями: Реальные задачи ИИ и аналитики, работа с большим объемом данных и современным стеком.
— Конкурентная заработная плата, обсуждаемая по итогам собеседования с учетом ваших компетенций.


Поделиться:

Опубликована 10 часов назад

Похожие вакансии

Сейчас мы приглашаем в свою команду Data Engineer, который будет отвечать за совершенствование нашего ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Онлайн-школа ТетрикаОнлайн-школа Тетрика
  • Москва
10 часов назад
Практика Applied Intelligence включает консультационные услуги по Data-driven трансформации, услуги по ... разработке корпоративных хранилищ и фабрик данных, включая Big Data / Data Lakes, автоматизации отчетности ... источников данных Активное взаимодействие со смежными командами Требования: Опыт в разработке DWH/ETL, Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Axenix (ранее Accenture)Axenix (ранее Accenture)
  • Москва
день назад
300 000 - 315 000 ₽
Выше средней на 11%
Мы с удовольствием рассмотрим твою кандидатуру, если ты имеешь: - опыт работы в роли Data Engineer от ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Снэп АйТиСнэп АйТи
  • Москва
2 дня назад
Цель — заменить унаследованное решение на гибкую, управляемую и прозрачную data-инфраструктуру в составе ... GitLab, dbt tests, Airflow DAG validation); Следить за качеством данных и стабильностью пайплайнов (data-quality ... Знание подходов Data Vault 2.0, SCD2. Навыки работы с Docker, GitLab CI/CD, Linux.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РТК-ЦОДРТК-ЦОД
  • Москва
3 дня назад
Мы ожидаем: Опыт работы на позиции Data Engineer; Глубокое, практическое понимание ClickHouse; Опыт построения ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании STARTSTART
  • Москва
день назад

Похожие вакансии

Логотип компании Онлайн-школа ТетрикаОнлайн-школа Тетрика
Логотип компании Axenix (ранее Accenture)Axenix (ранее Accenture)
300 000 - 315 000 ₽
Логотип компании Снэп АйТиСнэп АйТи
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.