Главный Data Engineer

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

Мы ищем data engineer’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а также готовы внедрять эти решения и влиять на бизнес, то мы будем рады видеть вас в нашей команде.

Наши модели работают в online-режиме 24/7, решая задачи оценки риска, выявления фрода, ценообразования и формирования индивидуальных предложений. Мы оцениваем влияние нашей работы на бизнес-метрики с помощью A/B-тестов. Используем в работе open-source решения: Spark, MLFlow, DVC, Feast, CatBoost, Docker, данные готовим на Hadoop-кластере.

Обязанности:

  • Заниматься разработкой новых data-пайплайнов с использованием Pyspark, Airflow, как и батч загрузку, так и стриминг с помощью Kafka
  • Готовить витрины данных, в том числе из сырых логов
  • Разрабатывать API и сервисы по данным
  • Подключать новые источники и отвечать за бесперебойную поставку данных
Требования:
  • Уверенный Python и Отличные знания SQL (JOIN, подзапросы, оконные функции);

  • Уверенные знания стека Hadoop (HDFS, YARN, Hive) и Pyspark;

  • Понимание принципов построения data-пайплайнов (kappa И lambda - архитектуры);

  • Знакомство с Kafka и Airflow, понимание их роли в data-пайплайне;

  • Знание базовых команд Linux-консоли, git;

  • Интерес к технологиям больших данных и большое желание учиться;

    Будет плюсом:

  • Знакомство с системами контейнеризации и виртуализации Linux (Docker, Kubernetes);

  • Опыт разработки REST-сервисов на Python (Flask / FastAPI);

  • Знакомство с Kafka;

  • Знакомство с CDC (Debezium);

  • Работа с No-SQL БД (Redis. Hbase);

  • Оптимизация и хранение данных в Clickhouse

Что мы предлагаем:
  • Работу в профессиональной команде, которая готова делиться знаниями и опытом;
  • Возможность внешнего обучения и прокачки твоих скиллов за счет Компании;
  • Заботу о сотрудниках: возможность прохождения медицинских chek-апов, безлимитные бесплатные консультации с финансовыми консультантами, юристами и психологом. В компании поддерживается и развивается культура ЗОЖ;
  • Отличный социальный пакет, включающий ДМС, скидки на страховые продукты компании, скидки от наших партнеров (туризм, фитнес и т.д.);
  • Обеспечение техникой для работы;
  • Гибридный график работы 5\2 (гибкое начало дня с 8 до 10)

Адрес: Россия, Москва, проспект Лихачёва, 15
Показать на большой карте

Поделиться:

Опубликована день назад

Похожие вакансии

В связи с активным расширением команды мы в поисках Senior Data Engineer в Лабораторию искусственного интеллекта. ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Разработка, поддержка и оптимизация пакетных пайплайнов данных, а также инструментов по работе с данными Работ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании РСХБ-ИнтехРСХБ-Интех
  • Москва
15 часов назад
300 000 - 380 000 ₽
Рыночная зарплата
LIAN — системный интегратор с фокусом в аналитике и управлении данными. Мы работаем в трех направлениях: 1. Автоматизация управленческой отчетности (BI) в малом и среднем бизнесе. Строим хранилища данных, настраиваем сбор и интеграцию, разрабатываем ...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании LIANLIAN
  • Москва
13 часов назад
Мы ищем data engineer’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а та...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании АльфаСтрахованиеАльфаСтрахование
  • Москва
14 часов назад
Ваши задачи: Проектировать, разрабатывать и поддерживать ETL/ELT-пайплайны; Настраивать процессы доставки изменений данных (CDC) из транзакционных баз (PostgreSQL, MongoDB); Проектированием схем, настройкой кластера (шардирование, репликация), оптими...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании STARTSTART
  • Москва
день назад
Наш клиент, крупная международная FMCG-компания, находится в поиске Lead Data Engineer. Основная задача: Проектирование домена и разработка базы данных для Отдела Продаж на основе корпоративной платформы данных в хранилище S3. Задачи: Исследовать биз...
  • Можно удаленно
  • Полный день
  • Опыт от 5 лет
Логотип компании VentraVentra
  • Москва
14 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.