Инженер данных/ Data Engineer
По договоренности
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark, где объемы данных позволяют.
Чем предстоит заниматься:
- Разработка пайплайнов обработки данных;
- Формирование витрин с метриками;
- Постановка на регламент алгоритмов расчета метрик функций беспилотного вождения.
Примеры задач на первое время:
- Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
- Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.
Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase
Что мы ждем от кандидата:
- Разработка на языке Python
- Хорошее знание SQL (на уровне джойнов и оконных функций)
- Был опыт обработки данных с использованием Python (Pandas/Polars)
- Знакомство со Spark и Airflow
Будет плюсом:
- Опыт работы с Clickhouse
- Опыт работы с Airflow/Luidgi/Dagster
Адрес: Россия, Москва, проспект Андропова, 10А
Опубликована день назад
Похожие вакансии
... интеграционно-функционального тестирования опыт работы с ETL-инструментами (Informatica PC, Oracle Data ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
... имеете опыт работы c Airflow; понимаете принципы работы с колоночными БД; имеете базовое понимание data ...
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
до 210 000 ₽
Рыночная зарплата
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
AERO — провайдер e-commerce и data-решений. ... (K8s), Debezium VCS: Git (GitLab) Подходы: Data Vault / Business Data Vault И место для технологии, ... Будет плюсом: опыт со streaming (Kafka), CDC (Debezium), Spark, K8s, Data Vault.
- Полный день
- Опыт от 3 лет
- Москва
день назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
- Полный день
- Опыт от 3 лет
- Москва
6 дней назад
Вакансия в подборках
Похожие вакансии
до 210 000 ₽