Главный инженер сопровождения кластеров Elasticsearch и Kafka

По договоренности

  • Киевская
  • Парк Победы
  • Багратионовская

Главный инженер сопровождения кластеров Elasticsearch и Kafka

Департамент больших данных

Управление сопровождения аналитических систем

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:

  • Обеспечение отказоустойчивости, производительности и предсказуемости кластеров Elasticsearch и Kafka, минимизация времени простоя и воздействия инцидентов;
  • Разработка и внедрение стратегии мониторинга, алертинга и логирования для Elasticsearch и Kafka (на уровне кластера, нод, топиков, индексов, потребителей, lag-ов);
  • Определение и настройка ключевых метрик здоровья (KPI) и SLO/SLA для компонентов;
  • Проактивное выявление проблем: рост лагов, деградация производительности, неоптимальные шаблоны индексов, исчерпание ресурсов;
  • Проведение регулярных аудитов существующей архитектуры Elasticsearch (шаблоны индексов, шардирование, репликация, mapping) и Kafka (топики, партиции, репликация, политики очистки, ACL);
  • Планирование и проведение масштабирования (как горизонтального, так и вертикального), обновления версий ПО с нулевым или минимальным downtime;
  • Разработка и поддержка Disaster Recovery (DR) и процедур аварийного восстановления (backup/restore для Elasticsearch, mirroring/replication для Kafka). Регулярное проведение учебных восстановлений;
  • Разработка и документирование runbooks (чек-листов действий) для частых инцидентов (например, отказ ноды, потеря лидера партиции, рост consumer lag, «желтый/красный» статус кластера ES);
  • Координация действий команды во время инцидента, коммуникация с заинтересованными сторонами;
  • Проведение постмортемов (Post-Mortem) по серьёзным инцидентам с выработкой плана по предотвращению повторения;
  • Ведение актуальной архитектурной и эксплуатационной документации.
  • Документирование всех внесенных изменений, процедур, политик.

НАШИ ОЖИДАНИЯ ОТ КАНДИДАТА:

  • Высшее образование;
  • Опыт администрирования Elasticsearch в production;
  • Практический опыт масштабирования кластеров (hot-warm-cold архитектуры), обновлений версий;
  • Настройка мониторинга (cluster health, jvm, indices stats, thread pools);
  • Резервное копирование и восстановление с использованием snapshot/restore API в S3;
  • Опыт администрирования Apache Kafka в production;
  • Понимание внутреннего устройства: брокеры, топики, партиции, реплики, ISR, контроллер, ZooKeeper/KRaft;
  • Настройка и мониторинг критических метрик: lag потребителей, throughput, размер топиков, состояние реплик, under-replicated partitions;
  • Опыт работы с Linux;
  • Знание систем мониторинга: Prometheus, Grafana, Zabbix;
  • Опыт работы с системами сбора логов (ELK stack как минимум для логов самих систем);
  • Знание основ сетей (TCP/IP, firewall, latency, throughput).

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
  • Забота о вашем здоровье: ДМС с первого месяца работы, куда входит стоматология;
  • Прозрачный доход: оклад (по итогам интервью) + ежеквартальные премии по результатам KPI;
  • Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Брянск, Новосибирск и др.);
  • Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (скидки на спортзалы, рестораны, маркетплейсы и т.д.).


Адрес: Россия, Москва, Пресненская набережная, 10с2
Показать на большой карте

Поделиться:

Опубликована 5 дней назад

Похожие вакансии

от 160 000 ₽
Компания "Эко Сервис Инженерные системы" более 22х лет на рынке РФ предоставляет профессиональные услуги по комплексной эксплуатации коммерческой недвижимости. Сейчас мы в поиске опытного кандидата в нашу команду на должность Руководителя проектов по...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании Эко СервисЭко Сервис
  • Москва
4 дня назад
Главный инженер Отдела сопровождения аналитических систем Департамент больших данных ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ: Сопровождение системы «Рекомендательная платформа для клиентов юридических лиц»; Контроль выполнения загрузочных и расчетных регламентных п...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании РСХБ-ИнтехРСХБ-Интех
  • Москва
4 дня назад
Обязанности: Разработка проектной документации по разделу «Проект организации строительства» для линейных объектов, «Проект организации демонтажа»; Выработка проектных решений по способам (открытый / закрытый) и технологии (микротоннелирование, управ...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании 12201220
  • Москва
4 дня назад
Обязанности: Проектирование ВК/НВК; Сбор исходных данных для проектирования; Разработка технических решений; Выполнение расчетов, подбор оборудования; разработка чертежей; Согласование проектных решений со смежными отделами и выдача заданий Требовани...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании ПромэкспертизаПромэкспертиза
  • Москва
месяц назад
О компании и продукте: Мы — продуктовая компания в сфере кибербезопасности. Наша цель - предоставить компаниям и организациям инструмент, который повысит уровень готовности к кибератакам посредством фактического понимания того, какие действия выполня...
  • Можно удаленно
  • Полный день
  • Опыт от 1 года
Логотип компании CtrlHackCtrlHack
  • Москва
7 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.