Data Engineer (Геосервисы, Core)

По договоренности


Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ.

Мы развиваем собственную геоплатформу Wildberries, которая обеспечивает работу сервисов отображения карт, геопоиска и маршрутизации для других сервисов компании. Платформа обрабатывает большие объёмы геоданных: адресные базы, дорожные графы, пользовательские треки и события дорожной ситуации. Data-инженер будет отвечать за построение и развитие инфраструктуры обработки данных, подготовку датасетов для ML-моделей, алгоритмов поиска и маршрутизации.

Вам предстоит:

  • Разрабатывать и поддерживать ETL/ELT-пайплайны обработки геоданных (адресные данные, дорожные графы, события трафика, пользовательские треки);
  • Обеспечивать сбор, очистку и нормализацию геоданных из различных источников (внутренние сервисы, внешние датасеты, телеметрия);
  • Подготавливать датасеты для ML-моделей геопоиска и маршрутизации (ранжирование результатов поиска, ETA, анализ трафика);
  • Разрабатывать хранилища и витрины данных для аналитики, алгоритмических сервисов и ML-команд;
  • Оптимизировать производительность обработки больших объёмов геоданных и обеспечивать надёжность пайплайнов;
  • Работать совместно с командами ML, алгоритмистов и backend-разработчиков над интеграцией данных в сервисы геоплатформы.

Вы нам подходите, если:

  • Имеете опыт работы Data-инженером от 3-х лет и опыт построения ETL/ELT-процессов;
  • уверенно владеете Python, SQL, опыт работы с инструментами обработки больших данных, желательно владение Go или желание изучения (Основной язык сервисов);
  • имеете опыт работы с системами обработки данных (Spark, Hadoop, ClickHouse, Kafka или аналогичные технологии), опыт работы и понимание архитектуры OpenSearch/ElasticSearch;
  • понимаете принципов построения хранилищ данных и витрин для аналитики и ML;
  • имеете опыт работы с большими объёмами данных и оптимизации пайплайнов обработки;
  • работали с геоданными, треками или графами дорог будет преимуществом.

Поделиться:

Опубликована 7 часов назад

Похожие вакансии

Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
день назад
Мы – команда разработки DATA решений для Программы Лояльности СберСпасибо. ... В роли Data Engineer Вы получите опыт работы с настоящими большими данными, современным технологическим ... Engineer или ETL Developer Отличное знание SQL и современных реляционных/MPP СУБД (на выбор PostgreSQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СберСпасибоСберСпасибо
  • Москва
день назад
до 210 000 ₽
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
7 часов назад
Проекты: Data Engineer (Инженер данных) с уклоном в разработку инструментов для повышения эффективности ... Обязательно: 2+ года опыта в роли Data Engineer или в проектах, связанных с построением и поддержкой ... Хранение Данных: Понимание различий и применение: Data Warehouses, Data Lakes, NoSQL (знание принципов ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Bell IntegratorBell Integrator
  • Москва
2 дня назад
до 250 000 ₽
Выше средней на 8%
В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ : Data Engineer. ... тестирование и внедрение ETL/ELT процессов; Работа с большими объемами данных; Создание и поддержка data ... pipelines и хранилищ; Взаимодействие с аналитиками и data scientist’ами; Оптимизация производительности ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
2 дня назад
Мы строим Data Lake House платформу с современным стеком: S3, Trino, Apache Icberg, DBT, Airflow, Kafka ... реализация в тандеме с архитектором физического уровня архитектуры данных в DWH для всех слоев (raw data ... layer, core data layer, data mart layer); реализация ETL-пайплайнов передачи данных из различных внутренних ...
  • Полный день
  • Опыт от 3 лет
Логотип компании WINLINEWINLINE
  • Москва
7 часов назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.