Data Engineer (S3, Spark)

По договоренности


Обязанности:
  • Разрабатывать и сопровождать ETL процессы и инженерию данных на базе Spark как основного движка обработки и загрузки данных.

  • Настраивать интеграции источников данных: подключение по JDBC к базам и стендбаям, а также стриминговые интеграции через Kafka, работу с топиками и JSON.

  • Разрабатывать и поддерживать оркестрацию процессов в Airflow (DAG’и), используя Python в связке со Spark.

  • Работать с большими объемами данных (от десятков тысяч строк до сотен миллионов и миллиардов), решать задачи оптимизации обработки.

  • Разрабатывать и обслуживать слой данных на S3 и MinIO: работа с файловой системой, компрессией, охлаждением данных, обслуживанием и пересозданием таблиц, понимание партиционирования и форматов (в т.ч. JSON).

  • Участвовать в алгоритмизации и оптимизации хранения и обработки данных в объектном хранилище (S3/MinIO) с учетом особенностей, отличных от классических реляционных СУБД вроде Greenplum.

Требования:
  • Опыт работы в области ETL и Data разработки.

  • Уверенная работа с S3, опыт работы с MinIO.

  • Опыт работы с MinIO.

  • Уверенная работа со Spark.

  • Понимание табличного формата Iceberg.

  • Опыт интеграций с Kafka, умение работать с форматом JSON.

  • Навыки разработки DAG’ов в Airflow.

  • Владение Python на уровне для написания ETL процессов и служебного кода.

  • Опыт работы с JDBC подключениями к БД и источникам данных.

  • Опыт работы с ClickHouse (в том числе в окружении Arenadata ClickHouse).

Условия:
  • Оформление по ТК РФ в ИТ-аккредитованную компанию
  • Годовой бонус до 15% от годового дохода
  • Выстроенная система работы с персоналом: индивидуальный план развития, выделенный бюджет на обучение у сторонних подрядчиков, регулярные 1:1 с руководителем
  • ДМС, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой;
  • Программа корпоративных скидок Best benefits
  • Дополнительный оплачиваемый отпуск

Поделиться:

Опубликована 21 день назад

Похожие вакансии

Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX
СберАналитика в цифрах: Более 7 лет развиваем продукты для анализа данных 18 продуктов в портфеле 9 патентов Более 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Сквозная аналитика - это единая платформа сбора, обработки, хранен...
  • Полный день
  • Опыт до 1 года
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
  • Москва
9 часов назад
... (Greenplum, Clickhouse, S3 + Impala) Разработка и поддержка ETL/ELT-процессов с использованием DBT (Data ...
  • Полный день
  • Опыт до 1 года
Логотип компании Тера ИнтегроТера Интегро
  • Москва
15 дней назад
до 250 000 ₽
Выше средней на 138%
Что входит в задачи: Анализ и оценка требований бизнеса (Управление данными / Data Governance); Анализ ... данных; Опыт работы в Atlassian JIRA и Confluence; Понимание банковских продуктов и процессов, принципов Data ...
  • Полный день
  • Опыт до 1 года
Логотип компании DatanomicaDatanomica
  • Москва
день назад
... 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Наши технологии на основе big data ...
  • Полный день
  • Опыт до 1 года
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
  • Москва
день назад
Увлекательная работа в инновационной компании полного цикла (от идеи до серийного выпуска продукции), включая аппаратную и программную часть, являющейся лидером рынка в ряде секторов радиоэлектронной промышленности. Чем предстоит заниматься: Демонстр...
  • Полный день
  • Опыт до 1 года
Логотип компании INWAVE (ООО Микроволновая Электроника)INWAVE (ООО Микроволновая Электроника)
  • Москва
14 дней назад

Похожие вакансии

Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
до 250 000 ₽
Логотип компании DatanomicaDatanomica
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.