Data Engineer (S3, Spark)

По договоренности


Обязанности:
  • Разрабатывать и сопровождать ETL процессы и инженерию данных на базе Spark как основного движка обработки и загрузки данных.

  • Настраивать интеграции источников данных: подключение по JDBC к базам и стендбаям, а также стриминговые интеграции через Kafka, работу с топиками и JSON.

  • Разрабатывать и поддерживать оркестрацию процессов в Airflow (DAG’и), используя Python в связке со Spark.

  • Работать с большими объемами данных (от десятков тысяч строк до сотен миллионов и миллиардов), решать задачи оптимизации обработки.

  • Разрабатывать и обслуживать слой данных на S3 и MinIO: работа с файловой системой, компрессией, охлаждением данных, обслуживанием и пересозданием таблиц, понимание партиционирования и форматов (в т.ч. JSON).

  • Участвовать в алгоритмизации и оптимизации хранения и обработки данных в объектном хранилище (S3/MinIO) с учетом особенностей, отличных от классических реляционных СУБД вроде Greenplum.

Требования:
  • Опыт работы в области ETL и Data разработки.

  • Уверенная работа с S3, опыт работы с MinIO.

  • Опыт работы с MinIO.

  • Уверенная работа со Spark.

  • Понимание табличного формата Iceberg.

  • Опыт интеграций с Kafka, умение работать с форматом JSON.

  • Навыки разработки DAG’ов в Airflow.

  • Владение Python на уровне для написания ETL процессов и служебного кода.

  • Опыт работы с JDBC подключениями к БД и источникам данных.

  • Опыт работы с ClickHouse (в том числе в окружении Arenadata ClickHouse).

Условия:
  • Оформление по ТК РФ в ИТ-аккредитованную компанию
  • Годовой бонус до 15% от годового дохода
  • Выстроенная система работы с персоналом: индивидуальный план развития, выделенный бюджет на обучение у сторонних подрядчиков, регулярные 1:1 с руководителем
  • ДМС, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой;
  • Программа корпоративных скидок Best benefits
  • Дополнительный оплачиваемый отпуск

Поделиться:

Опубликована 15 часов назад

Похожие вакансии

СберАналитика в цифрах: Более 7 лет развиваем продукты для анализа данных 18 продуктов в портфеле 9 патентов Более 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Сквозная аналитика - это единая платформа сбора, обработки, хранен...
  • Полный день
  • Опыт до 1 года
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
  • Москва
13 дней назад
... (Greenplum, Clickhouse, S3 + Impala) Разработка и поддержка ETL/ELT-процессов с использованием DBT (Data ...
  • Полный день
  • Опыт до 1 года
Логотип компании Тера ИнтегроТера Интегро
  • Москва
месяц назад
Приглашаем в команду Центра развития транспортного рынка Аналитика данных (с навыками в области data ...
  • Полный день
  • Опыт до 1 года
Логотип компании Институт экономики и развития транспортаИнститут экономики и развития транспорта
  • Москва
6 дней назад
Компания Piklema разрабатывает решения для горнодобывающей промышленности, применяя технологии искусственного интеллекта. Наши продукты позволяют снять с человека часть работы в сложных промышленных условиях с перспективой дальнейшего перехода к полн...
  • Полный день
  • Опыт до 1 года
Логотип компании ПиклемаПиклема
  • Москва
6 дней назад
Мы подбираем QA Automation инженеров для работы на проектах наших клиентов - продуктовых компаний, финтеха, e-commerce и IT-интеграторов. Проекты различаются по масштабу и технологическому стеку: от внутренних систем до высоконагруженных сервисов и м...
  • Полный день
  • Опыт до 1 года
Логотип компании TechSearchTechSearch
  • Москва
11 дней назад

Похожие вакансии

Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
Логотип компании Тера ИнтегроТера Интегро
Логотип компании Институт экономики и развития транспортаИнститут экономики и развития транспорта
Логотип компании ПиклемаПиклема
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.