Data Engineer (SafeHub)

По договоренности


Мы — команда специалистов, создающая сервисы и компоненты для платформы внутренней безопасности, а также разрабатывающая AI-агенты для выявления внутренних угроз и мошенничества. Нам нужен специалист, способный эффективно анализировать табличные и текстовые данные, необходимые для построения AI-агентов.

Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и очисткой данных, а также поддержкой моделей машинного обучения. Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. Ты станешь частью команды опытных инженеров и аналитиков, работающих над сложными проектами в сфере информационной безопасности.

Задачи:

  • анализ структур данных в разных источниках и форматов, оценка их пригодности для конкретных бизнес-задач
  • загрузка, обработка и преобразование больших объемов данных из разнородных хранилищ (Oracle, Teradata, MS SQL, GreenPlum) в рабочие среды (GreenPlum, Hadoop)
  • проектирование и создание аналитических витрин данных
  • подготовка и препроцессинг данных для обучения моделей машинного обучения
  • мониторинг и оптимизация рабочих процессов обработки и загрузки данных
  • контроль качества входных данных и автоматизация проверки качества данных
  • разработка инфраструктуры и внутренних сервисов для эффективной обработки больших объемов данных
  • автоматизация повторяющихся операций с данными
  • создание технической документации и поддержка баз знаний по работе с данными
  • консультация пользователей внутри компании по вопросам использования данных.

Требования

  • высшее образование
  • опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика
  • продвинутый уровень владения SQL (аналитические функции, подзапросы, хранимые процедуры, производительность запросов)
  • практический опыт работы с большими объемами данных в реляционных СУБД (Oracle, Teradata, MS SQL, GreenPlum)
  • понимание концепции и принципов организации хранилища данных (DWH)
  • работа с технологическим стеком Hadoop (HDFS, YARN, Hive) и Apache Spark
  • опыт программирования на Java/Scala
  • понимание базовых принципов построения распределенных систем хранения и обработки данных.

Будет плюсом:

  • опыта проектирования витрин данных
  • опыт переноса и интеграции больших объемов данных между разными источниками
  • владение инструментами системы контроля версий (например Git)
  • начальные знания и интерес к развитию в области Machine Learning и Data Analysis
  • осведомленность в процессах ETL и технологиях хранилищ данных (DWH).

Мы предлагаем:

  • работа в офисе по адресу г. Москва, Кутузовский проспект, 32
  • на испытательном периоде работа в офисе, далее возможен смешанный режим работы возможен (но не более 1-2 дней в неделю удаленно)
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Поделиться:

Опубликована 16 часов назад

Похожие вакансии

Мы - Команда разработки DATA решений для Программы Лояльности СберСпасибо – отвечаем за промышленную ... обработку данных: Big Data, реальные SLA, живой драйвовый бизнес. ... Требования не менее 2 лет работы в качестве Data Engineer или ETL Developer; отличное знание SQL и современных ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
2 дня назад
Мы ищем опытного Data Engineer / DWH-разработчика для работы над аналитическими системами в финансовом ... с разработчиками, аналитиками и бизнесом для формализации требований Требования: • От 3 лет опыта в Data ... Quality, Data Governance и историзации данных Мы предлагаем: • Полную занятость • Офисный формат работы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании HAAS PLATFORMHAAS PLATFORM
  • Москва
2 дня назад
Основные обязанности: анализ и оценка требований к потокам загрузки; обследование источников, системный анализ структур данных источников; разработка интеграционных решений для подключения к новым источникам; проектирование модели данных DWH (stage-о...
  • Полный день
  • Опыт от 3 лет
Логотип компании Вкусно — и точкаВкусно — и точка
  • Москва
4 дня назад
193 000 - 309 700 ₽
Выше средней на 11%
... обработки и хранения данных разбор инцидентов качества данных, развитие автоматизированных тестов (Data ... Java/Scala и опыт разработки на нём опыт разработки на Python понимание инструментов и технологий Big Data ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
3 дня назад
АНО «Цифровой аудит» специализируется на внедрении инноваций в области Big Data и AI для создания надежных ... инструментами: Kafka, Airflow, Pentaho, S3 или совместимые хранилища. - Опыт работы инженером данных / data ... engineer / ETL-разработчиком от 3 лет. - Уверенное владение SQL. - Понимание ETL/ELT-концепций, построения ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Цифровой аудитЦифровой аудит
  • Москва
5 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.