Data Engineer
По договоренности
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.
Чем предстоит заниматься:
- Разработка пайплайнов обработки данных;
- Формирование витрин с метриками;
- Постановка на регламент алгоритмов расчета метрик функций беспилотного вождения.
Примеры задач на первое время:
- Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
- Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.
Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase
Что мы ждем от кандидата:
- Разработка на языке Python
- Хорошее знание SQL (на уровне джойнов и оконных функций)
- Был опыт обработки данных с использованием Python (Pandas/Polars)
- Знакомство со Spark и Airflow
Будет плюсом:
- Опыт работы с Clickhouse
- Опыт работы с Airflow/Luidgi/Dagster
Адрес: Россия, Москва, проспект Андропова, 10А
Опубликована 5 часов назад
Похожие вакансии
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и д...
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
Мы - команда разработки Аналитической Платформы (АПЛ) розничного взыскания, занимаемся разработкой дата-продуктов на основе большого объема данных и ищем высоквалифицированного разработчика / дата инженера хранилища данных, способного принять активно...
- Полный день
- Опыт от 3 лет
- Москва
час назад
Ищем опытного специалиста на позицию Дата Инженера, который будет отвечать за создание и поддержку инфраструктуры обработки больших объемов данных. Вы будете вовлечены в разработку эффективных процессов сбора, преобразования и хранения данных, чтобы ...
- Полный день
- Опыт от 3 лет
- Москва
7 часов назад
АНО «Цифровой аудит» специализируется на внедрении инноваций в области Big Data и AI для создания надежных ... Мы ищем Lead Data Engineer / руководителя команды, который возьмет на себя техническое лидерство и организацию ... OLTP и OLAP, Опыт работы с Data Warehouse и Data Lake; Опыт разработки на языке программирования Python ...
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
до 380 000 ₽
Выше средней на 72%
... . • Понимание принципов data quality (контроль, мониторинг, валидации). • Знание HDFS-стека: Hive, Spark ...
- Полный день
- Опыт от 3 лет
- Москва
5 часов назад