Data Engineer NLP

По договоренности

  • Киевская
  • Парк Победы
  • Багратионовская

Лаборатория искусственного интеллекта отвечает за внедрение технологий ИИ в бизнес-процессы банка. Мы занимаемся продуктовой аналитикой, разрабатываем модели машинного обучения для решения прикладных задач и развиваем собственную MLOps/AnalyticsOps‑платформу. На её основе создаются инструменты и фреймворки как для внутренних нужд Лаборатории, так и для специалистов по данным РСХБ.
Команда NLP фокусируется на разработке моделей и сервисов для обработки естественного языка, которые используются как в бизнес‑подразделениях, так и во внутренних ИТ-сервисах банка.

Сейчас в связи с активным расширением нам нужен Инженер данных.

Обязанности:

  • Проектирование и разработка ETL и ELT потоков, витрин данных для моделей;
  • Очистка и стандартизация сырых данных, разработка проверок качества данных;
  • Осуществление переливки данных из источников в Озеро Данных;
  • Оптимизация и автоматизация процессов работы с данными;
  • Сопровождение существующих регламентов на Airflow;
  • Анализ и мониторинг производительности существующих запросов и их последующая оптимизация;
  • Внедрение современных практик и инженерных подходов;
  • Регулярное взаимодействие с Data Science и Data Analyst, ревью и валидация написанных запросов, помощь в оптимизации.

Требования:

  • Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, AirFlow, Pandas;
  • Опыт работы с распределенными хранилищами данных (Greenplum, Hadoop) и классический BigData стек (Hive/Impala, hdfs, PySpark);
  • Знание Python-библиотек для работы обработки данных;
  • Навыки работы с Jupyter (notebook, lab, hub) ;
  • Уверенное понимание Git и принципов разработки, базовое понимание CI/CD;
  • Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными;
  • Умение покрывать код и артефакты разработки документацией;
  • Английский, достаточный для чтения и понимания документации.

Будет плюсом:

  • Понимание принципов контейнеризации, базовые знания Docker/Kubernetes;
  • Опыт работы в команде вместе с DS и ML специалистами.

Мы предлагаем:

  • Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.);
  • Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
  • Забота о вашем здоровье: ДМС после испытательного срока, куда входит стоматология;
  • Гибкий график или полная удаленка (по итогам общения с командой);
  • Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Новосибирск, Белгород и т.д.);
  • Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д.).

Адрес: Россия, Москва, Пресненская набережная, 10с2
Показать на большой карте

Поделиться:

Опубликована 24 дня назад

Похожие вакансии

250 000 - 340 000 ₽
Выше средней на 18%
Наши пожелания к кандидатам: От 2-3 лет в роли, связанной с построением аналитической инфраструктуры (Data ... Engineer) или созданием инструментов для бизнес-анализа (BI-разработчик), с применением сходного технологического ... Будет плюсом: Визуализация данных с помощью Power BI (DAX, Power Query, работа с Data Gateways) и/или ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании LIANLIAN
  • Москва
4 дня назад
Находимся в поисках Инженера данных (data engineer) для главного Портала Москвы - Mos.ru, на котором ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
день назад
Мы ищем опытного Data Engineer, который усилит команду разработки внутренней платформы Flocktory. ... Engineer, инженер хранилища данных от 3х лет; опыт решения задач репликации данных, создания слоев данных ... data mesh.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании FlocktoryFlocktory
  • Москва
4 дня назад
до 250 000 ₽
Рыночная зарплата
... архитектуры хранилища; Документирование архитектуры и процессов обработки данных; Требования: Опыт работы Data ... Engineer от 2-ух лет; Уверенное владение Python 3.8+.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МФК ВЭББАНКИРМФК ВЭББАНКИР
  • Москва
7 дней назад
Spark (от 3 лет), знание Pyspark; • Опыт с Iceberg (обязательно); • Знания Spark архитектуры, и Big Data ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании NeoflexNeoflex
  • Москва
день назад
Обязанности: Разработка и поддержка логической и физической моделей данных хранилища Проектирование, разработка и поддержка ETL процессов Создание витрин данных для BI-отчетности и аналитики Взаимодействие с аналитиками и смежными подразделениями для...
  • Можно удаленно
  • Подработка
  • Опыт от 3 лет
Логотип компании LAB IndustriesLAB Industries
  • Москва
день назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.