Middle Data engineer в команду SMT

По договоренности

Москва

Спортивная
Киевская
Парк Победы

Мы строим корпоративную дата-платформу следующего уровня. Это новый сервис с амбициозной задачей: трансформировать наработки компании в единое стандартизированное решение для работы с данными. Отказываемся от легаси, проектируем архитектуру заново, сохраняем лучшее (например, Apache Spark), и постепенно переносим существующие пайплайны на новую платформу.

С нуля — это не «начать с чистого листа», это возможность заложить фундамент, который будет надёжным, масштабируемым и понятным десяткам инженерных команд. Именно сейчас мы переопределяем техстек, архитектурные подходы, процессы. И именно сейчас у тебя есть шанс поучаствовать в запуске платформы, куда будут стекаться все корпоративные данные.

Что предстоит делать:

Разрабатывать с нуля MVP новой дата-платформы и инфраструктуры для ingest/transform;
Мигрировать существующие пайплайны с Hadoop/HDFS на новую архитектуру (S3, Kafka, Spark, ClickHouse);
Работать с большими объёмами данных и высоконагруженными Kafka-топиками;
Строить отказоустойчивые пайплайны обработки и доставки данных;
Участвовать в архитектурных решениях, внедрять best practices хранения, мониторинга и качества данных;
Проектировать витрины данных под продуктовую и управленческую аналитику (OLAP);
Сопровождать миграцию BI-отчётов на новую платформу (например, DataLens, Power BI).

Почему это интересно:

Ты действительно будешь создавать платформу с нуля — не “настроил Airflow и готово”, а архитектура верхнего уровня с безопасностью, мониторингом и многопользовательской нагрузкой;
Прямое влияние на технологический курс всей компании: твои решения будут использовать десятки команд;
Работа с современным стеком: Spark 3+, Kafka, S3, ClickHouse, и BI-инструментами;
Возможность реализовать техрешения, которые трудно было бы внедрить в рамках существующего кода/подходов;
Технический вызов: миграция с Hadoop, масштабируемость, отказоустойчивость, строгие SLA на доставку данных.

Мы будем рады специалисту, который:

Имеет 3+ лет опыта на позиции Data Engineer / Big Data Engineer;
Хорошо понимает, как работает Spark и умеет его готовить;
Работал с ClickHouse и знает, как «выжать» из него максимум;
Знаком с построением дата-архитектуры (DWH, Lake, OLAP, ETL/ELT, Data Goverments);
Умеет проектировать пайплайны под отказоустойчивость;
Хорошо владеет одним из языков программирования;
Знает SQL и может читать логику отчетов без боли.

Плюсом будут:

Опыт построения дата-платформ (SelfService инструменты и процессы);
Имеет опыт работы с высоконагруженной Kafka (десятки/сотни тысяч событий);
Знание инструментов мониторинга и автоматического контроля качества данных (Data Quality, Data contracts);
Опыт построения Data Lineage и работа с Data Catalog;
Инфраструктурный опыт: Docker, Kubernetes, CI/CD.

Как мы работаем:

Не боимся убирать легаси — мы осознанно избавляемся от устаревших решений;
Оцениваем эффективность не по объёму кода, а по бизнес-ценности;
Любим, когда инженер предлагает нестандартные, но обоснованные решения;
Верим, что архитектура важна, если её понимают (human-friendly документация — мастхэв);
Умеем договариваться — и с бизнесом, и между собой.

Что мы предлагаем:

2ГИС — аккредитованная IT-компания;
У нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске;
Само собой, полностью белая зарплата. Дополнительные дни отпуска за стаж работы в компании;
Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента;
Если хочешь делиться своим опытом, мы только за — поможем с выступлениями на конференциях и статьями для Хабра;
Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.

⚡ Откликнуться на hh.ru

Адрес: Россия, Москва, Поклонная улица, 3к4

Показать на большой карте

Опубликована 4 часа назад

Data Engineer

Участие в Data Governance (техническая реализация стандартов). ... (работа с библиотеками Spark/PySpark/pandas/numpy) Глубокое понимание архитектуры Big Data-платформ ( ... включая DWH, Data Lakes), принципов работы ETL/ELT.

Можно удаленно
Полный день
Опыт от 3 лет

Альфа-Банк

Москва

4 часа назад

⚡ Откликнуться на hh.ru

Data Engineer

от 250 000 ₽

Рыночная зарплата

Мы активно внедряем AI и следуем data-driven подходу. ... Сейчас мы расширяем команду и ищем опытного Data Engineer (Middle+ / Senior), который поможет нам развивать ... Принципы моделирования хранилищ данных: Знание подходов Data Vault, Kimball.

Можно удаленно
Полный день
Опыт от 3 лет

AnyClass

Москва

4 часа назад

⚡ Откликнуться на hh.ru

Data Engineer

Обязанности: Проектирование и построение архитектуры дата-платформы «с нуля»: слои данных стратегии обработки исторических изменений, медленно меняющиеся измерения; Разработка отказоустойчивых пайплайнов в Airflow: модульная структура, обработка част...

Можно удаленно
Полный день
Опыт от 3 лет

ГК «МТ-Интеграция»

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Data Engineer

ЧТО МЫ ЖДЕМ ОТ КАНДИДАТА: Опыт работы в роли Data Engineer от 2  лет; Продвинутый уровень владения SQL ...

Можно удаленно
Полный день
Опыт от 3 лет

М.Видео-Эльдорадо

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Data Engineer

260 000 - 340 000 ₽

Выше средней на 15%

Построение прототипов хранилищ данных и разработка витрин данных (Data Marts) для аналитики и отчетности ... Опыт работы в экосистеме Hadoop и навыки Data Engineer: знание компонентов HDFS, YARN, Spark, Kafka, ... Опыт коммерческой разработки с использованием ETL-инструментов: SAS DIS (Data Integration Studio) и/или ...