Problem Manager

По договоренности

  • Белорусская
  • Маяковская
  • Тверская

Задачи:
  • Управление процессом Problem Management в соответствии с ITIL/ISO 20000, фокусируясь на предотвращении повторяющихся сбоев в сложной инфраструктуре;
  • Проведение глубокого анализа корневых причин (RCA) инцидентов, связанных с Kubernetes, облачными платформами, СУБД, сетевым оборудованием и микросервисной архитектурой;
  • Разработка и внедрение долгосрочных решений, включая автоматизацию, исправление конфигураций, оптимизацию производительности;
  • Мониторинг эффективности решений и контроль выполнения Known Errors;
  • Тесное взаимодействие с SRE, DevOps, DBA, сетевыми инженерами и разработчиками для устранения системных проблем;
  • Мониторинг инфраструктуры с использованием Prometheus, Grafana, ELK, Zabbix и других инструментов;
  • Участие в постмортемах (Post-Mortem) и выработка превентивных мер для сложных инцидентов;
  • Анализ логов, метрик, трейсов (OpenTelemetry, Jaeger) для выявления скрытых проблем;
  • Подготовка отчетов для руководства с рекомендациями по улучшению отказоустойчивости и производительности систем;
  • Наставничество для младших специалистов и коллег.
Для нас важно:
  • Уверенные знания организации инфраструктуры - Kubernetes (понимание архитектуры, troubleshooting кластеров, проблемы с Pod/Node, сетевые политики, CSI-драйверы);
  • СУБД (PostgreSQL / MySQL / MongoDB – диагностика медленных запросов, блокировок, репликации);
  • Сети (TCP/IP, DNS, HTTP/2, gRPC, BGP, проблемы с задержками, packet loss, firewall/NAT);
  • Микросервисы и message brokers (Kafka, RabbitMQ – задержки, потеря сообщений, балансировка);
  • Навыки работы с инструментами мониторинга и observability (Prometheus/ Grafana/ ELK/ ELK APM/ Zabbix);
  • Умение проводить RCA (5 Почему, Ishikawa, FTA) и работать с DORA-метриками, SLI/SLO;
  • Опыт автоматизации (Python/ Bash/ Ansible/ Terraform) для устранения типовых проблем;
  • Понимание DevOps-практик и SRE (Site Reliability Engineering).

Будет большим плюсом:

  • Экспертиза в ITIL v4\v3, сертификация (ITIL 4 Specialist/Master) будет преимуществом.
Предлагаем:
  • Оформление по ТК РФ, полностью белую заработную плату (оклад + квартальная премия);
  • График 5/2, можно выбрать: с 8:00 до 17:00, с 9:00 до 18:00, с 10:00 до 19:00;
  • Гибридный формат работы;
  • Офис находится недалеко от м.1905 года (ул.Рочдельская 15 стр.35);
  • После 3 месяцев работы базовый пакет ДМС (поликлиника); спустя 9 месяцев работы – расширенный ДМС (стоматология, имуннотерапия, ежегодная диспансеризация, лечение сложных заболеваний, плановая и экстренная помощь);

  • ДМС для родственников;

  • Подписку Добросервис (неограниченное количество консультаций у высококвалифицированных психологов);

  • Платформу дистанционного обучения IngoStudy (возможность проходить курсы для прокачки soft и hard скиллов) + внешние обучения по согласованию с руководителем;

  • Льготные страховые продукты (страхование имущества физ. лиц, автотранспорта (Каско), страхование выезжающих за рубеж, страхование ипотеки, страхование от несчастных случаев и болезней);

  • Скидки на обслуживание и ремонт автомобилей;

  • Корпоративные предложения от сети фитнес-клубов: World Class, World Class Lite и UFC GYM;

  • Активную корпоративную жизнь со спортивными секциями: бег, волейбол, йога и др.;

  • Участие в разных благотворительных и экологических акциях, форумах, марафонах.


Адрес: Россия, Москва, Рочдельская улица, 15с35
Показать на большой карте

Поделиться:

Опубликована 22 дня назад

Похожие вакансии

Oxygen Data Centers and Clouds – крупная быстроразвивающаяся IT компания. ... В связи с расширением мы приглашаем в команду Project Manager для управления проектами облачных решений ... в IT-консалтинге или системном интеграторе).
  • Полный день
  • Опыт от 3 лет
Логотип компании Oxygen Data Centers & CloudsOxygen Data Centers & Clouds
  • Москва
8 дней назад
от 150 000 ₽
... деятельности: Сети передачи данных; Телефония, контакт центры, видеоконференцсвязь; Системы управления IT ... техник продаж, умение их применять на практике; обязательный личный опыт успешных продаж профильных IT ... ИТ оборудования, инфраструктуры, софта и услуг; наличие общего представления о продуктовой линейке IT ...
  • Полный день
  • Опыт от 3 лет
Логотип компании ПрофитПрофит
  • Москва
7 дней назад
В нашу DREAM TEAM для реализации амбициозных планов по развитию требуется Project manager (IT, web-технологии ... ТРЕБОВАНИЯ: Опыт управления web- проектами в IT или FMCG/Retail от 3 лет (веб-разработка), понимание ...
  • Полный день
  • Опыт от 3 лет
Логотип компании Prime SportPrime Sport
  • Москва
9 дней назад
Что нужно делать: Организовывать и координировать внедрение новых решений функционала, включая планирование, сбор требований, распределение ресурсов. Выявлять и устранять препятствия в работе команд или эскалировать их для решения. Управлять кроссфун...
  • Полный день
  • Опыт от 3 лет
Логотип компании T2T2
  • Москва
15 дней назад
BSS - это ведущий разработчик в мире финансовых продуктов и сервисов, онлайн-коммуникаций и пользовательского опыта. Входит в ТОП 20 крупнейших финтех-компаний РФ (Smart Ranking, 2024), имеет более 700 сотрудников в штате и четыре направления деятель...
  • Полный день
  • Опыт от 3 лет
Логотип компании Бэнкс Софт СистемсБэнкс Софт Системс
  • Москва
14 дней назад
250 000 - 300 000 ₽
Выше средней на 52%
Мы ожидаем: Опыт работы в роли Product Owner / Product Manager / Project Manager от 2 лет.
  • Полный день
  • Опыт от 3 лет
Логотип компании Группа компаний МЕДСИГруппа компаний МЕДСИ
  • Москва
13 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.