Data Engineer NLP
По договоренности
- Киевская
- Парк Победы
- Багратионовская
Лаборатория искусственного интеллекта отвечает за внедрение технологий ИИ в бизнес-процессы банка. Мы занимаемся продуктовой аналитикой, разрабатываем модели машинного обучения для решения прикладных задач и развиваем собственную MLOps/AnalyticsOps‑платформу. На её основе создаются инструменты и фреймворки как для внутренних нужд Лаборатории, так и для специалистов по данным РСХБ.
Команда NLP фокусируется на разработке моделей и сервисов для обработки естественного языка, которые используются как в бизнес‑подразделениях, так и во внутренних ИТ-сервисах банка.
Сейчас в связи с активным расширением нам нужен Инженер данных.
Обязанности:
- Проектирование и разработка ETL и ELT потоков, витрин данных для моделей;
- Очистка и стандартизация сырых данных, разработка проверок качества данных;
- Осуществление переливки данных из источников в Озеро Данных;
- Оптимизация и автоматизация процессов работы с данными;
- Сопровождение существующих регламентов на Airflow;
- Анализ и мониторинг производительности существующих запросов и их последующая оптимизация;
- Внедрение современных практик и инженерных подходов;
- Регулярное взаимодействие с Data Science и Data Analyst, ревью и валидация написанных запросов, помощь в оптимизации.
Требования:
- Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, AirFlow, Pandas;
- Опыт работы с распределенными хранилищами данных (Greenplum, Hadoop) и классический BigData стек (Hive/Impala, hdfs, PySpark);
- Знание Python-библиотек для работы обработки данных;
- Навыки работы с Jupyter (notebook, lab, hub) ;
- Уверенное понимание Git и принципов разработки, базовое понимание CI/CD;
- Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными;
- Умение покрывать код и артефакты разработки документацией;
- Английский, достаточный для чтения и понимания документации.
Будет плюсом:
- Понимание принципов контейнеризации, базовые знания Docker/Kubernetes;
- Опыт работы в команде вместе с DS и ML специалистами.
Мы предлагаем:
- Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.);
- Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
- Забота о вашем здоровье: ДМС после испытательного срока, куда входит стоматология;
- Гибкий график или полная удаленка (по итогам общения с командой);
- Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Новосибирск, Белгород и т.д.);
- Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д.).
Адрес: Россия, Москва, Пресненская набережная, 10с2
Опубликована 24 дня назад
Похожие вакансии
250 000 - 340 000 ₽
Выше средней на 18%
Наши пожелания к кандидатам: От 2-3 лет в роли, связанной с построением аналитической инфраструктуры (Data ... Engineer) или созданием инструментов для бизнес-анализа (BI-разработчик), с применением сходного технологического ... Будет плюсом: Визуализация данных с помощью Power BI (DAX, Power Query, работа с Data Gateways) и/или ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Находимся в поисках Инженера данных (data engineer) для главного Портала Москвы - Mos.ru, на котором ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
Мы ищем опытного Data Engineer, который усилит команду разработки внутренней платформы Flocktory. ... Engineer, инженер хранилища данных от 3х лет; опыт решения задач репликации данных, создания слоев данных ... data mesh.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
до 250 000 ₽
Рыночная зарплата
... архитектуры хранилища; Документирование архитектуры и процессов обработки данных; Требования: Опыт работы Data ... Engineer от 2-ух лет; Уверенное владение Python 3.8+.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Spark (от 3 лет), знание Pyspark; • Опыт с Iceberg (обязательно); • Знания Spark архитектуры, и Big Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
Обязанности: Разработка и поддержка логической и физической моделей данных хранилища Проектирование, разработка и поддержка ETL процессов Создание витрин данных для BI-отчетности и аналитики Взаимодействие с аналитиками и смежными подразделениями для...
- Можно удаленно
- Подработка
- Опыт от 3 лет
- Москва
день назад
Вакансия в подборках
Похожие вакансии
250 000 - 340 000 ₽
до 250 000 ₽