- Работа в Москве
- IT, интернет, связь, телеком
- IT engineer
- Customer Reliability Engineer
Customer Reliability Engineer
По договоренности
Yandex Cloud — это облачная платформа, предоставляющая полный спектр облачных сервисов для клиентов. Наша задача — помочь бизнесам всех размеров применять облачные технологии для повышения эффективности их деятельности, используя инфраструктуру и уникальные технологии Яндекса.
Мы ищем опытного инженера на позицию Customer Reliability Engineer (CRE). CRE — важная роль в клиентской организации Yandex Cloud. Его основная задача — работа с наиболее важными клиентами и оказание им помощи по вопросам надёжности и отказоустойчивости критичных информационных систем, развёрнутых в Yandex Cloud. CRE должен обладать глубокими технологическими знаниями облачных сервисов и руководствоваться практиками SRE при работе.
Какие задачи вас ждут
Проблем-менеджмент клиентских информационных систем
Вам нужно будет проводить регулярные чекапы (проверки на соответствие рекомендациям отказоустойчивости) клиентских информационных систем в инфраструктуре Yandex Cloud. Также на вас будет организация проведения нагрузочных и хаос-тестов, решение клиентских инцидентов и взаимодействие с командами клиента и Yandex Cloud в War Room.
Взаимодействие с командами клиентов
Вам предстоит разбирать клиентские инциденты с командой клиента, готовить Root Cause Analysis и список Action Items для предотвращения. Также вы будете регулярно взаимодействовать с командами внутри Yandex Cloud (техническая поддержка, архитекторы, разработчики, аккаунт-менеджеры), чтобы решать клиентские проблемы и снимать технические блокеры при использовании сервисов Yandex Cloud. Помимо этого, вам нужно будет выступать на отчётных клиентских мероприятиях в треке «Статистика проблем и повышение надёжности клиентских информационных систем».
Мы ждем, что вы
- Работали в технической поддержке или на позиции SRE
- Решали проблемы в k8s-кластерах в прод-среде, понимаете внутреннее устройство отказоустойчивого кластера k8s
- На практике знакомы с облачными технологиями
- Понимаете стек протоколов модели OSI, основы маршрутизации, умеете диагностировать сетевые проблемы
- Знаете, как работают сервисы в OS Linux, а также основные команды диагностики; в состоянии определить причины снижения производительности сервиса
- Хорошо разбираетесь в устройстве СУБД (PostgreSQL, MySQL, Mongo, ClickHouse, Greenplum)
- Знакомы с методами построения архитектуры прикладных решений
- Стрессоустойчивы и конструктивны в ситуациях критических клиентских эскалаций
- Не боитесь коммуницировать с клиентами и умеете чётко объяснять, что вы им предлагаете
Будет плюсом, если вы
- Участвовали в реализации ИТ-проектов с крупными компаниями в технической роли
- Имеете хорошие коммуникативные навыки
- Умеете приоритизировать задачи по степени влияния на бизнес
- Понимаете современные технологические и бизнес-задачи различных индустрий
Опубликована 12 дней назад