Data Engineer

По договоренности

  • Автозаводская
  • Технопарк
  • Коломенская

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.

Чем предстоит заниматься:

  • Разработка пайплайнов обработки данных;
  • Формирование витрин с метриками;
  • Постановка на регламент алгоритмов расчета метрик функций беспилотного вождения.

Примеры задач на первое время:

  • Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
  • Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.

Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase

Что мы ждем от кандидата:

  • Разработка на языке Python
  • Хорошее знание SQL (на уровне джойнов и оконных функций)
  • Был опыт обработки данных с использованием Python (Pandas/Polars)
  • Знакомство со Spark и Airflow

Будет плюсом:

  • Опыт работы с Clickhouse
  • Опыт работы с Airflow/Luidgi/Dagster

Адрес: Россия, Москва, проспект Андропова, 10А
Показать на большой карте

Поделиться:

Опубликована месяц назад

Похожие вакансии

до 210 000 ₽
Рыночная зарплата
В связи с активным развитием проектов в компании открыта вакансия Data Engineer/Data аналитика. ... Будет большим плюсом: Понимание Data Governance (знакомство с DAMA, подходами к управлению качеством) ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
3 дня назад
Какие знания и навыки нам важны: Опыт работы Data Engineer от 2 лет. ... Будет плюсом: Data Vault 2.0, оптимизация запросов, Data Lake / DWH, репликация/шардинг, знакомство с ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ГКУ ИнфогородГКУ Инфогород
  • Москва
4 дня назад
Мы – команда разработки DATA решений для Программы Лояльности СберСпасибо. ... В роли Data Engineer Вы получите опыт работы с настоящими большими данными, современным технологическим ... Engineer или ETL Developer Отличное знание SQL и современных реляционных/MPP СУБД (на выбор PostgreSQL ...
  • Полный день
  • Опыт от 3 лет
Логотип компании СберСпасибоСберСпасибо
  • Москва
4 дня назад
Проекты: Data Engineer (Инженер данных) с уклоном в разработку инструментов для повышения эффективности ... Обязательно: 2+ года опыта в роли Data Engineer или в проектах, связанных с построением и поддержкой ... Хранение Данных: Понимание различий и применение: Data Warehouses, Data Lakes, NoSQL (знание принципов ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Bell IntegratorBell Integrator
  • Москва
5 дней назад
до 250 000 ₽
Выше средней на 13%
В СВЯЗИ С АКТИВНЫМ РАЗВИТИЕМ ПРОЕКТОВ В КОМПАНИИ ОТКРЫТА ВАКАНСИЯ : Data Engineer. ... тестирование и внедрение ETL/ELT процессов; Работа с большими объемами данных; Создание и поддержка data ... pipelines и хранилищ; Взаимодействие с аналитиками и data scientist’ами; Оптимизация производительности ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ИЦ АЙ-ТЕКОИЦ АЙ-ТЕКО
  • Москва
5 дней назад
Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ. В команде Вам предстоит заниматься разработкой се...
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
2 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.