Data Engineer
По договоренности
- Беляево
- Коньково
- Теплый Стан
В связи с активным расширением мы в поиске senior инженера данных в проект импортозамещения оперативного хранилища данных с применением концепции LakeHouse.
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
- Создание ядра (загрузка, мониторинг и реконсиляция данных) для автоматизации работы оперативного хранилища данных.
Стек: Hadoop, Iceberg, PySpark, Airflow, Hive, Impala, Trino
НАШИ ОЖИДАНИЯ ОТ КАНДИДАТА:
- Понимание SQL и NoSQL баз данных, уверенное владение SQL синтаксисом.
- Хорошее знание и практические навыки в одном из языков программирования (Python, Java, Scala).
- Понимание принципов работы распределенных файловых систем (HDFS, Ozone, Minio), а так же опыт работы с одним из них как с хранилищем NoSQL базы данных.
- Опыт работы с одном из SQL движков (Hive, Impala, Trino), а так же табличными форматами, предпочтительно с Iceberg.
- Практический опыт работы со Spark и понимание принципов его работы.
БУДЕТ ПЛЮСОМ:
- Airflow
ЧТО МЫ ПРЕДЛАГАЕМ:
- Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.);
- Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
- Забота о вашем здоровье: ДМС после испытательного срока, куда входит стоматология;
- Прозрачный доход: оклад (по итогам интервью) + ежеквартальные премии по результатам KPI;
- Гибкий график или полная удаленка (по итогам общения с командой);
- Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Белгород, Самара, Саратов, Новосибирск, Уфа);
- Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д
Адрес: Россия, Москва, Профсоюзная улица, 125А
Опубликована 21 день назад
Похожие вакансии
Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту... несовместимости диалектов, оптимизировать запросы; Разработать скрипты автоматической сверки данных (data ... . строк кода и от 1 ТБ данных; Python/Bash для автоматизации ETL, валидации, оркестрации; Понимание data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Сейчас мы ищем Data Engineer, который станет ключевым участником запуска платформы практически с нуля ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
GlowByte - лидер в сфере разработки Business Intelligence (BI) решений. Компания на рынке c 2004 года. Сегодня нас выбирают лидеры своих отраслей: крупнейшие банки (17 из Топ-20), телеком и сотовые операторы (все компании большой четверки), крупнейши...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
3 дня назад
Нахожусь в поисках AI / Data специалиста в компанию - лидера рынка в сфере доверительного управления, ... Что хотим видеть: Коммерческий опыт от 3+ лет как Data Analyst / Data Analytics Engineer (желательно ... Какие задачи могут быть: Автодокументирование, построение схемы данных, data linage; RAG: поиск отчетов ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Мы ищем Data Engineer в команду, которая отвечает за разработку и оптимизацию ядра хранилища данных и ... ); — Архитектура DWH: Глубокое понимание и практический опыт применения методологий построения DWH (Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
... оркестрация на Airflow); Понимание принципов построения DWH и/или DataLake; Понимание жизненного цикла Data-products ... предпочтительно Kafka), понимание механизмов стриминговой загрузки; Крайне желателен опыт построения Data ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
12 дней назад