Data Engineer (SafeHub)
По договоренности
Мы — команда специалистов, создающая сервисы и компоненты для платформы внутренней безопасности, а также разрабатывающая AI-агенты для выявления внутренних угроз и мошенничества. Нам нужен специалист, способный эффективно анализировать табличные и текстовые данные, необходимые для построения AI-агентов.
Ищем Data Engineer c уклоном в Data Science, которому предстоит заниматься извлечением, подготовкой и очисткой данных, а также поддержкой моделей машинного обучения. Мы предлагаем карьерный рост как в Data Engineering, так и в Data Science направлениях. Ты станешь частью команды опытных инженеров и аналитиков, работающих над сложными проектами в сфере информационной безопасности.
Задачи:
- анализ структур данных в разных источниках и форматов, оценка их пригодности для конкретных бизнес-задач
- загрузка, обработка и преобразование больших объемов данных из разнородных хранилищ (Oracle, Teradata, MS SQL, GreenPlum) в рабочие среды (GreenPlum, Hadoop)
- проектирование и создание аналитических витрин данных
- подготовка и препроцессинг данных для обучения моделей машинного обучения
- мониторинг и оптимизация рабочих процессов обработки и загрузки данных
- контроль качества входных данных и автоматизация проверки качества данных
- разработка инфраструктуры и внутренних сервисов для эффективной обработки больших объемов данных
- автоматизация повторяющихся операций с данными
- создание технической документации и поддержка баз знаний по работе с данными
- консультация пользователей внутри компании по вопросам использования данных.
Требования
- высшее образование
- опыт работы от 2х лет в роли Data Engineer, Data Analyst или ETL-разработчика
- продвинутый уровень владения SQL (аналитические функции, подзапросы, хранимые процедуры, производительность запросов)
- практический опыт работы с большими объемами данных в реляционных СУБД (Oracle, Teradata, MS SQL, GreenPlum)
- понимание концепции и принципов организации хранилища данных (DWH)
- работа с технологическим стеком Hadoop (HDFS, YARN, Hive) и Apache Spark
- опыт программирования на Java/Scala
- понимание базовых принципов построения распределенных систем хранения и обработки данных.
Будет плюсом:
- опыта проектирования витрин данных
- опыт переноса и интеграции больших объемов данных между разными источниками
- владение инструментами системы контроля версий (например Git)
- начальные знания и интерес к развитию в области Machine Learning и Data Analysis
- осведомленность в процессах ETL и технологиях хранилищ данных (DWH).
Мы предлагаем:
- работа в офисе по адресу г. Москва, Кутузовский проспект, 32
- на испытательном периоде работа в офисе, далее возможен смешанный режим работы возможен (но не более 1-2 дней в неделю удаленно)
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Опубликована 16 часов назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Мы - Команда разработки DATA решений для Программы Лояльности СберСпасибо – отвечаем за промышленную ... обработку данных: Big Data, реальные SLA, живой драйвовый бизнес. ... Требования не менее 2 лет работы в качестве Data Engineer или ETL Developer; отличное знание SQL и современных ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Мы ищем опытного Data Engineer / DWH-разработчика для работы над аналитическими системами в финансовом ... с разработчиками, аналитиками и бизнесом для формализации требований Требования: • От 3 лет опыта в Data ... Quality, Data Governance и историзации данных Мы предлагаем: • Полную занятость • Офисный формат работы ...
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Основные обязанности: анализ и оценка требований к потокам загрузки; обследование источников, системный анализ структур данных источников; разработка интеграционных решений для подключения к новым источникам; проектирование модели данных DWH (stage-о...
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
193 000 - 309 700 ₽
Выше средней на 11%
... обработки и хранения данных разбор инцидентов качества данных, развитие автоматизированных тестов (Data ... Java/Scala и опыт разработки на нём опыт разработки на Python понимание инструментов и технологий Big Data ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
АНО «Цифровой аудит» специализируется на внедрении инноваций в области Big Data и AI для создания надежных ... инструментами: Kafka, Airflow, Pentaho, S3 или совместимые хранилища. - Опыт работы инженером данных / data ... engineer / ETL-разработчиком от 3 лет. - Уверенное владение SQL. - Понимание ETL/ELT-концепций, построения ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Вакансия в подборках
Похожие вакансии
193 000 - 309 700 ₽