Data Engineer (SafeHub)

По договоренности

  • Спортивная
  • Киевская
  • Парк Победы

Мы — команда специалистов, создающая сервисы и компоненты для платформы внутренней безопасности, а также разрабатывающая AI-агенты для выявления внутренних угроз и мошенничества. Нам нужен специалист, способный эффективно анализировать табличные и текстовые данные, необходимые для построения AI-агентов.

Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и очисткой данных, а также поддержкой моделей машинного обучения. Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. Ты станешь частью команды опытных инженеров и аналитиков, работающих над сложными проектами в сфере информационной безопасности.

Задачи:

  • анализ структур данных в разных источниках и форматов, оценка их пригодности для конкретных бизнес-задач
  • загрузка, обработка и преобразование больших объемов данных из разнородных хранилищ (Oracle, Teradata, MS SQL, GreenPlum) в рабочие среды (GreenPlum, Hadoop)
  • проектирование и создание аналитических витрин данных
  • подготовка и препроцессинг данных для обучения моделей машинного обучения
  • мониторинг и оптимизация рабочих процессов обработки и загрузки данных
  • контроль качества входных данных и автоматизация проверки качества данных
  • разработка инфраструктуры и внутренних сервисов для эффективной обработки больших объемов данных
  • автоматизация повторяющихся операций с данными
  • создание технической документации и поддержка баз знаний по работе с данными
  • консультация пользователей внутри компании по вопросам использования данных.

Требования

  • высшее образование
  • опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика
  • продвинутый уровень владения SQL (аналитические функции, подзапросы, хранимые процедуры, производительность запросов)
  • практический опыт работы с большими объемами данных в реляционных СУБД (Oracle, Teradata, MS SQL, GreenPlum)
  • понимание концепции и принципов организации хранилища данных (DWH)
  • работа с технологическим стеком Hadoop (HDFS, YARN, Hive) и Apache Spark
  • опыт программирования на Java/Scala
  • понимание базовых принципов построения распределенных систем хранения и обработки данных.

Будет плюсом:

  • опыта проектирования витрин данных
  • опыт переноса и интеграции больших объемов данных между разными источниками
  • владение инструментами системы контроля версий (например Git)
  • начальные знания и интерес к развитию в области Machine Learning и Data Analysis
  • осведомленность в процессах ETL и технологиях хранилищ данных (DWH).

Мы предлагаем:

  • работа в офисе по адресу г. Москва, Кутузовский проспект, 32
  • на испытательном периоде работа в офисе, далее возможен смешанный режим работы возможен (но не более 1-2 дней в неделю удаленно)
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Адрес: Россия, Москва, Кутузовский проспект, 32
Показать на большой карте

Поделиться:

Опубликована 20 дней назад

Похожие вакансии

до 210 000 ₽
Рыночная зарплата
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
12 дней назад
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и д...
  • Полный день
  • Опыт от 3 лет
Логотип компании NavioNavio
  • Москва
8 дней назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
13 дней назад
Мы – команда разработки DATA решений для Программы Лояльности СберСпасибо. ... В роли Data Engineer Вы получите опыт работы с настоящими большими данными, современным технологическим ... Engineer или ETL Developer Отличное знание SQL и современных реляционных/MPP СУБД (на выбор PostgreSQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СберСпасибоСберСпасибо
  • Москва
13 дней назад
AERO — провайдер e-commerce и data-решений. ... (K8s), Debezium VCS: Git (GitLab) Подходы: Data Vault / Business Data Vault И место для технологии, ... Будет плюсом: опыт со streaming (Kafka), CDC (Debezium), Spark, K8s, Data Vault.
  • Полный день
  • Опыт от 3 лет
Логотип компании АЭРОАЭРО
  • Москва
8 дней назад
Проекты: Data Engineer (Инженер данных) с уклоном в разработку инструментов для повышения эффективности ... Обязательно: 2+ года опыта в роли Data Engineer или в проектах, связанных с построением и поддержкой ... Хранение Данных: Понимание различий и применение: Data Warehouses, Data Lakes, NoSQL (знание принципов ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Bell IntegratorBell Integrator
  • Москва
14 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.