Data Quality Engineer

По договоренности


В трайбе SberWorks (Сбер) мы создаём Productivity Platform — единую платформу для автоматизации производственных процессов и внедрения искусственного интеллекта в Сбере. В основе платформы лежит DataLake — централизованное хранилище, которое накапливает и структурирует данные для аналитики, обучения AI-ассистентов и построения витрин.

Цель создания платформы Productivity Platform — обеспечить единый и бесшовный путь для команд Банка, сократив производственные затраты благодаря максимальной автоматизации и применению искусственного интеллекта на каждом этапе производственного процесса.

Команда DataLake отвечает за развитие и сопровождение холодного хранилища на базе Hadoop. Мы ищем специалиста, который поможет нам развить с нуля практики тестирования данных в нашей системе и выстроить процессы обеспечения качества данных на всех этапах их жизненного цикла.

Стек технологий проекта: Python, PySpark, Airflow, Hadoop (Hive), Kafka, Postgres, CDC, OpenMetaData

Обязанности

· Разрабатывать и поддерживать автоматизированные тесты Data Quality для данных, хранящихся в Hadoop (Hive).

· Интегрировать тесты в Airflow-пайплайны, обеспечивать их запуск по расписанию и мониторинг результатов.

· Анализировать причины инцидентов с качеством данных, взаимодействовать с владельцами источников и потребителями данных.

· Разрабатывать и внедрять метрики, правила и стандарты качества данных для DataLake.

· Участвовать в развитии инфраструктуры тестирования данных, внедрять новые инструменты и подходы.

Требования

· Опыт работы с Hadoop/Hive, понимание принципов организации данных в DWH.

· Уверенное владение Python и PySpark для написания тестов и обработки данных.

· Опыт работы с Airflow: создание, отладка и поддержка DAG’ов.

· Понимание принципов тестирования данных (Data Quality), опыт разработки автотестов для ETL-процессов.

· Навыки работы с SQL, опыт анализа данных и поиска аномалий.

· Будет плюсом: опыт работы с Kafka, CDC, Postgres.

· Будешь стремиться погружаться в продукт, а не "просто писать код"

Условия

· Современный комфортный офис рядом с м. Кутузовская.

· Ежегодный пересмотр зарплаты и годовая премия

· Более 400 образовательных программ СберУниверситета. Возможность постоянно совершенствоваться и развивать профессиональные навыки.

· Программа адаптации и помощь руководителя на старте. Мы поможем вам быстро влиться в коллектив и начать продуктивную работу.

· Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа. Забота о вас и ваших близких — важный аспект нашего сотрудничества.

· Корпоративный спортзал и зоны отдыха.

· Ипотека выгоднее до 7% для каждого сотрудника. Специальные условия ипотечного кредитования сделают покупку жилья доступной.

· Подписка СберПрайм+, скидки на продукты компаний-партнеров

· Вознаграждение за рекомендацию друзей в команду Сбера. Привлекая новых талантливых специалистов, вы можете заработать дополнительное вознаграждение.


Поделиться:

Опубликована 13 часов назад

Похожие вакансии

Наши пожелания к кандидатам: 3+ лет опыта работы с данными в роли Data Engineer; Опыт проектирования ... построения CI/CD процессов и мониторинга data pipeline’ов; Понимание принципов data governance, data quality ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Альфа-БанкАльфа-Банк
  • Москва
6 дней назад
Интегрировать автотесты и quality checks в CI/CD (Jenkins), снижать флейки и время обратной связи. ... требования Сильный практический опыт в QA (от 4+ лет), из них заметная часть в роли SDET / QA Automation Engineer ... Будет плюсом Опыт внедрения LLM-практик в SDLC: quality checks, автогенерация артефактов, анализ логов ...
  • Полный день
  • Опыт от 3 лет
Логотип компании OneTwoTripOneTwoTrip
  • Москва
3 дня назад
... представляет собой B2B решения развлекательной, игровой и спортивной тематики находится в поиске ML Engineer ... инкрементального эффекта; Понимание процессов контроля качества данных и production monitoring: drift, data quality ...
  • Полный день
  • Опыт от 3 лет
Логотип компании EmploycityEmploycity
  • Москва
5 дней назад
Вакансия: Руководитель группы по сбору данных - Data Engineer Чем предстоит заниматься: Наша команда ... Governance, который включает лучшие практики по руководству данными, а также инструменты ETL, EDW, BI, Data Quality ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИнтерлизингИнтерлизинг
  • Москва
23 дня назад
В международной фармацевтической компании открыта вакансия Менеджер по качеству для контрактных производственных организаций (CMO) Ваши задачи на данной роли: Выступать в качестве основного руководителя по качеству для всех контрактных производственн...
  • Полный день
  • Опыт от 3 лет
Логотип компании ANCORANCOR
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.