Data Engineer

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.

Чем предстоит заниматься:

  • Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
  • Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.
  • Разрабатывать пайплайны обработки данных
  • Формировать витрины с метриками
  • Регламентация алгоритмов расчета метрик функций беспилотного вождения.

Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase

Что мы ждем от кандидатов:

  • Разработка на языке Python;
  • Хорошее знание SQL (на уровне джойнов и оконных функций);
  • Был опыт обработки данных с использованием Python (Pandas/Polars);
  • Знакомство со Spark и Airflow.

Будет плюсом:

  • Опыт работы с Clickhouse;
  • Опыт работы с Airflow/Luidgi/Dagster.

Адрес: Россия, Москва, проспект Андропова, 10А
Показать на большой карте

Поделиться:

Опубликована 6 дней назад

Похожие вакансии

Обязанности: Участие в проекте построения Платформы данных на технологиях (Greenplum, Clickhouse, S3 + Impala) Разработка и поддержка ETL/ELT-процессов с использованием DBT (Data Build Tool). Написание и оптимизация SQL-трансформаций разной сложности...
  • Полный день
  • Опыт от 1 года
Логотип компании Тера ИнтегроТера Интегро
  • Москва
5 дней назад
Обязанности: • Повышение качества данных во внутренних системах • Подготовка данных для BI-аналитики • Ad hoc задачи • Взаимодействие с другими структурными подразделениями по вопросам, связанным с техническим сопровождением проектов • Написание и до...
  • Полный день
  • Опыт от 1 года
Логотип компании Diamond Personnel R&CDiamond Personnel R&C
  • Москва
4 дня назад
СберАналитика в цифрах: Более 7 лет развиваем продукты для анализа данных 18 продуктов в портфеле 9 патентов Более 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Чем предстоит заниматься: Проектирование и разработка аналитически...
  • Полный день
  • Опыт от 1 года
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
  • Москва
9 дней назад
Мы занимаемся построением и поддержкой надежных data-процессов, которые лежат в основе аналитики и машинного обучения. Вам предстоит работать с полным циклом данных: от их сбора и очистки до организации pipelines и обеспечения их качества. Обязанност...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
4 дня назад
Мы - команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококач...
  • Полный день
  • Опыт от 1 года
Логотип компании СБЕРСБЕР
  • Москва
7 дней назад

Похожие вакансии

Логотип компании Тера ИнтегроТера Интегро
Логотип компании ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.