Data engineer
до 350 000 ₽
- Петроградская
- Горьковская
- Невский проспект
Что мы предлагаем:
-  Гибридный формат работы с гибким началом рабочего дня; 
-  Обучение на любой онлайн платформе за счет компании; 
-  ДМС после 3 месяцев работы; 
-  3 дополнительных оплачиваемых выходных в год; 
-  Занятия корпоративным английским еженедельно; 
-  Занятия спортом: корпоративный волейбол, футбол, настольный теннис, йога; 
-  Подарки на день рождения, рождение ребенка и свадьбу; 
-  Подарки за стаж работы в компании; 
-  Ежемесячные корпоративные мероприятия; 
-  Скидку 50% на обеды в ресторанах Токио Сити и Бахрома и карта на скидку 30% в ресторанах франшизы; 
-  Скидку 30% на проживание на базе отдыха у Ладожского озера; 
-  Современный офис в пешей доступности от станций метро Чкаловская/Спортивная/Петроградская; 
-  Уникальную возможность развиваться в команде профессионалов; 
-  Участие в значимых проектах и дружелюбную атмосферу и поддержку коллег. 
Ключевые задачи:
Глобальная задача - разработка единой платформы данных для большой ресторанной сети, что включает в себя:
-  Анализ требований от заказчиков(от C-level до аналитиков данных) - помощь в организации управления данных, консультации по управлению данными; 
-  Глубокий анализ множества разнообразных источников данных со сложной внутренней структурой. Выявление аномалий на источниках - поиск компромиссных решений при возникновении проблем на уровне данных на источнике; 
-  Разработка автоматизированных ETL-пайплайнов на базе Airflow и Python(предпочтительно, но не обязательно). Работа с внешними API. Разработка ETL по глобальной и локальным сетям; 
-  Управление хранилищем данных. Участие в разработке единой модели данных и разложении данных по слоям; 
-  Помощь в оптимизации хранения и представления данных на слое витрин; 
-  Участие в разработке gitlab ci/cd пайплайнов, управление контейнерами, возможна разработка собественных сервисов на базе kubernetes pod. 
Мы ждем от тебя:
-  Опыт участия или проектирования разработки единой платформы данных(Проект новый - legacy нет вообще - но важно закладывать фундамент будущей единой платформы данных сразу, а не решать разовые задачи); 
-  Желание и способность вникать во множество разнообразных источников данных и разбираться в их внутреннем устройстве - искать аномалии и несогласованности; 
-  Помогать аналитикам и C-level приобретать навыки по управлению данными в компании. 
Технические требования:
Для ETL:
-  Python; 
-  Airflow; 
-  SQL. 
Для хранения:
-  Postgres; 
-  Навыки работы с распределенными файловыми хранилищами или MPP-системами. 
Общие:
-  Знакомство с облачными технологиями; 
-  Архитектура распределенных вычислительных систем; 
-  Моделирование данных; 
-  BI; 
-  DevOps(gitlab ci/cd, docker, kubernetes); 
-  Bash, git. 
Опубликована 17 дней назад