Data Engineer
По договоренности
- Автозаводская
- Технопарк
- Коломенская
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.
Чем предстоит заниматься:
- Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
- Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.
- Разрабатывать пайплайны обработки данных
- Формировать витрины с метриками
- Регламентация алгоритмов расчета метрик функций беспилотного вождения.
Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase
Что мы ждем от кандидатов:
- Разработка на языке Python;
- Хорошее знание SQL (на уровне джойнов и оконных функций);
- Был опыт обработки данных с использованием Python (Pandas/Polars);
- Знакомство со Spark и Airflow.
Будет плюсом:
- Опыт работы с Clickhouse;
- Опыт работы с Airflow/Luidgi/Dagster.
Адрес: Россия, Москва, проспект Андропова, 10А
Опубликована 6 дней назад
Похожие вакансии
Обязанности: Участие в проекте построения Платформы данных на технологиях (Greenplum, Clickhouse, S3 + Impala) Разработка и поддержка ETL/ELT-процессов с использованием DBT (Data Build Tool). Написание и оптимизация SQL-трансформаций разной сложности...
- Полный день
- Опыт от 1 года
- Москва
5 дней назад
Обязанности: • Повышение качества данных во внутренних системах • Подготовка данных для BI-аналитики • Ad hoc задачи • Взаимодействие с другими структурными подразделениями по вопросам, связанным с техническим сопровождением проектов • Написание и до...
- Полный день
- Опыт от 1 года
- Москва
4 дня назад
СберАналитика в цифрах: Более 7 лет развиваем продукты для анализа данных 18 продуктов в портфеле 9 патентов Более 1500 клиентов доверяют нашим решениям Команда из 500+ профессионалов Чем предстоит заниматься: Проектирование и разработка аналитически...
- Полный день
- Опыт от 1 года
- Москва
9 дней назад
Мы занимаемся построением и поддержкой надежных data-процессов, которые лежат в основе аналитики и машинного обучения. Вам предстоит работать с полным циклом данных: от их сбора и очистки до организации pipelines и обеспечения их качества. Обязанност...
- Полный день
- Опыт от 1 года
- Москва
4 дня назад
Мы - команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококач...
- Полный день
- Опыт от 1 года
- Москва
7 дней назад