Data Engineer (Middle)

По договоренности

  • Ленинский проспект
  • Академическая
  • Профсоюзная

Мечтай о большем с Napoleon IT

Мы — не просто IT-компания, а место, в котором искусственный интеллект объединяется с человеческим.
Мы — это более 250 сотрудников, 3 офиса в России, 3 разных направления развития: заказная разработка, outstaffing, собственные продукты.

Помимо уже существующих продуктов и решений на основе AI, мы активно развиваем разработку с использованием технологий LLM и Generative AI. Мы строим мультиагентные системы и платформенные решения для брендов, ритейла и маркетплейсов.

Мы ищем Data Engineer, который будет работать на внешних проектах наших клиентов (формат аутстаффинга), включая проекты в банковском и финансовом секторе с высокими требованиями к надежности, безопасности и обработке больших объемов данных.

Обязанности:

• Разработка ETL на Apache Spark (Java стек);

• Разработка ETL-пайплайнов (Apache Spark, HDFS (parquets), Hive, Greenplum, ClickHouse);

• Разработка витрин данных в Greenplum и ClickHouse;

• Оркестрация ETL-процессов;

• Оптимизация ETL-процессов (батчинг, ретраи, SLA-контроль);

• Взаимодействие с BI-разработчиками и DevOps для своевременной доставки данных в Superset;

Требования:

  • Стек технологий: HDFS, Greenplum, Clickhouse, Apache Spark, Apache Airflow, Python, Qlik Sense, Apache Superset, PL/Pg SQL, OpenShift, Bitbucket, Jira & Confluence, Docker, Kubernetes, Kibana, Grafana
  • Обязательное наличие опыта разработки, можно не владеть java, но иметь опыт со Spark (мы готов обучить Java, но важно, чтобы был опыт с pyspark);

• Опыт работы с Apache Spark от 1 года;

• Опыт работы с СУБД (Greenplum, ClickHouse, PostgreSQL) от 2 лет;

• Опыт работы с Hadoop (HDFS, Hive);

• Опыт проектирования и разработки потоков данных, алгоритмов загрузки и обработки данных;

• Опыт оптимизации ETL-пайплайнов и SQL кода;

• Продвинутые знания SQL;

• Понимание принципов работы распределенных систем;

• Готовность осваивать Java для использования Spark.

Будет плюсом:

  • Опыт разработки на Java;
  • Опыт работы в проектах, связанных с миграцией данных или BI-платформ;
  • Опыт работы в банковской сфере, понимание бизнес домена;
  • Опыт работы в крупных проектах с высокими требованиями к надежности.

Условия:

  • Формат работы: гибрид в Москве на Вавилова, на старте 3 дня и более в офисе, далее опционально;
  • Гибкие варианты сотрудничества;
  • Индивидуальный план развития с возможностью освоения новых технологий;
  • Компенсацию расходов на покупку профессиональной литературы;
  • Доступ к курсам нашей объединенной IT-школы GIGASCHOOL.

Адрес: Россия, Москва, улица Вавилова
Показать на большой карте

Поделиться:

Опубликована 9 часов назад

Похожие вакансии

Нужен Data Engineer, который сможет взять на себя часть непрофильной для аналитиков работы по автоматизации ...
  • Полный день
  • Опыт от 3 лет
Логотип компании OzonOzon
  • Москва
9 часов назад
Мы в поиске Data Engineer для создания и поддержки витрин данных, использующихся для задач машинного ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
9 часов назад
Сейчас у нас открыта позиция Data Infrastructure Engineer.
  • Полный день
  • Опыт от 3 лет
Логотип компании Лаборатория КасперскогоЛаборатория Касперского
  • Москва
9 часов назад
... оркестраторами ETL процессов владение SQL на уровне native speaker уверенное знание Python опыт работы с Big Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
день назад
Мы - команда ML-инженеров GigaChat Data.
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
9 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.