Data Engineer (Python/SQL/Spark/ETL)

По договоренности


О компании:

Амаркон — российская компания с 15-летним опытом работы на рынке информационных технологий.

Мы специализируемся на разработке и внедрении российских программных продуктов и решений. Наш успешный опыт включает автоматизацию в ритейле, телекоме и производственных компаниях. Амаркон разрабатывает и внедряет собственные решения класса ECM, PIM, DAM, системы бизнес-аналитики BI, портальные решения, а также сервисы для электронной коммерции.

Мы также осуществляем заказную разработку, внедряем, настраиваем и модифицируем партнерские IT-продукты.

Наша команда опытных IT-специалистов предоставляет консалтинговые услуги, осуществляет сопровождение и поддержку IT-проектов.

Среди наших клиентов такие известные компании, как X5 Group, Tele2, Русатом Сервис, НЛМК, Metro CC, Лента и другие.

Чем предстоит заниматься (Задачи):

  • Собирать и интегрировать данные из разных источников (API, логи, БД, CRM и т.п.) в data‑lake, хранилище или прод‑модели.
  • Проектировать и развёртывать ETL/ELT‑пайплайны, настраивать их автоматизацию, мониторинг и обработку ошибок.
  • Оптимизировать производительность запросов, хранилищ и пайплайнов (партиционирование, индексы, кластеризация, ресайз процессов).
  • Обеспечивать качество, стабильность и безопасность данных (валидация, контроль дублей, права доступа, маскировка PII).
  • Играться с архитектурой данных (data warehouse vs data lakehouse, потоковая vs партия, схемы iPaaS, CDC и т.п.) под текущие задачи и нагрузку.

Наши ожидания (Ключевые требования):

  • Язык: Python (чистый код, модули, библиотеки типа pandas, requests и т.п.) плюс понимание ООП и архитектурных паттернов.
  • SQL: продвинутый уровень — CTE, оконные функции, сложные JOIN‑ы, понимание execution plan, индексов, партиционирования.
  • Базы и хранилища: PostgreSQL/MySQL/ClickHouse/Redshift/BigQuery/SparkSQL и т.п., понимание, где и как хранить данные.
  • Пайплайны и оркестрация: Airflow / Prefect / Dagster или аналоги; умение писать и поддерживать DAG‑и, обработку ошибок, логирование.
  • Облака: AWS или GCP либо Azure (S3/Bucket, EMR/Dataproc, Fargate/Lambda, IAM, VPC, бюджеты).
  • Big‑data минимум: Spark (PySpark или Scala) и/или Flink/Kafka при работе с потоковыми/большими данными; разбор партиционирования, сериализации, форматов (Parquet/ORC/Avro).

Мы предлагаем:

  • Удалённый формат работы
  • Официальное оформление (ИП, СЗ)

Поделиться:

Опубликована 23 дня назад

Похожие вакансии

300 000 - 315 000 ₽
Выше средней на 23%
Мы с удовольствием рассмотрим твою кандидатуру, если ты имеешь: - опыт работы в роли Data Engineer от ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Снэп АйТиСнэп АйТи
  • Москва
20 часов назад
... разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data ... Предлагаем присоединиться в роли Data Engineer и работать над проектом заказчика. ... опыт работы в роли Data Engineer от 3-х лет; опыт работы в роли Lead команды дата-инженеров или аналитиков ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании AstonAston
  • Москва
2 дня назад
Сейчас у вас есть возможность присоединиться к лучшей команде в роли Data Engineer! ... Мы будем рады рассмотреть вашу кандидатуру, если у вас есть: Опыт работы Data Engineer от 2 лет. ... Навыки работы с JupyterHub, подготовка data notebooks.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании билайнбилайн
  • Москва
5 дней назад
Участие в Data Governance (техническая реализация стандартов). ... (работа с библиотеками Spark/PySpark/pandas/numpy) Глубокое понимание архитектуры Big Data-платформ ( ... включая DWH, Data Lakes), принципов работы ETL/ELT.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Альфа-БанкАльфа-Банк
  • Москва
6 дней назад
Holocron — команда, которая отвечает за инфраструктуру данных в 2ГИС. Мы строим и поддерживаем системы, через которые проходят события от боевых сервисов до аналитических витрин. Обеспечиваем надёжную доставку данных, их хранение, обработку и доступ ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании 2ГИС2ГИС
  • Москва
день назад
Flink DataStream Реализация архитектуры потоков данных Написание и доработка Java приложений для Big Data ... исключения и generics Spring Boot: Опыт разработки микросервисов и REST API с Spring Boot, включая Spring Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании X5 TechX5 Tech
  • Москва
6 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.