Data Engineer

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.

Чем предстоит заниматься:

  • Разработка пайплайнов обработки данных;
  • Формирование витрин с метриками;
  • Постановка на регламент алгоритмов расчета метрик функций беспилотного вождения.

Примеры задач на первое время:

  • Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
  • Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.

Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase

Что мы ждем от кандидата:

  • Разработка на языке Python
  • Хорошее знание SQL (на уровне джойнов и оконных функций)
  • Был опыт обработки данных с использованием Python (Pandas/Polars)
  • Знакомство со Spark и Airflow

Будет плюсом:

  • Опыт работы с Clickhouse
  • Опыт работы с Airflow/Luidgi/Dagster

Адрес: Россия, Москва, проспект Андропова, 10А
Показать на большой карте

Поделиться:

Опубликована 4 часа назад

Похожие вакансии

Мы разрабатываем новые банковские продукты и улучшаем текущие. Наши сервисы помогают миллионам клиентов удалённо пользоваться банковскими услугами, оформлять карты, брать кредиты и инвестировать. Мы даём возможность агропредпринимателям продавать и п...
  • Полный день
  • Опыт от 3 лет
Логотип компании РСХБ-ИнтехРСХБ-Интех
  • Москва
3 часа назад
Мы - команда разработки Аналитической Платформы (АПЛ) розничного взыскания, занимаемся разработкой дата-продуктов на основе большого объема данных и ищем высоквалифицированного разработчика / дата инженера хранилища данных, способного принять активно...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
4 часа назад
СберАналитика в цифрах: Более 7 лет развиваем продукты для анализа данных 18 продуктов в портфеле 9 патентов Более 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Чем предстоит заниматься: Проектирование и разработка аналитически...
  • Полный день
  • Опыт от 3 лет
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
  • Москва
час назад
Требования умение проектировать DWH, Data Lake, Data Management Platform опыт построения и развития высоконагруженных ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
час назад
Ищем опытного специалиста на позицию Дата Инженера, который будет отвечать за создание и поддержку инфраструктуры обработки больших объемов данных. Вы будете вовлечены в разработку эффективных процессов сбора, преобразования и хранения данных, чтобы ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СБЕРСБЕР
  • Москва
10 часов назад

Похожие вакансии

Логотип компании РСХБ-ИнтехРСХБ-Интех
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.