Главный инженер сопровождения кластеров Elasticsearch и Kafka
По договоренности
- Киевская
- Парк Победы
- Багратионовская
Главный инженер сопровождения кластеров Elasticsearch и Kafka
Департамент больших данных
Управление сопровождения аналитических систем
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
- Обеспечение отказоустойчивости, производительности и предсказуемости кластеров Elasticsearch и Kafka, минимизация времени простоя и воздействия инцидентов;
- Разработка и внедрение стратегии мониторинга, алертинга и логирования для Elasticsearch и Kafka (на уровне кластера, нод, топиков, индексов, потребителей, lag-ов);
- Определение и настройка ключевых метрик здоровья (KPI) и SLO/SLA для компонентов;
- Проактивное выявление проблем: рост лагов, деградация производительности, неоптимальные шаблоны индексов, исчерпание ресурсов;
- Проведение регулярных аудитов существующей архитектуры Elasticsearch (шаблоны индексов, шардирование, репликация, mapping) и Kafka (топики, партиции, репликация, политики очистки, ACL);
- Планирование и проведение масштабирования (как горизонтального, так и вертикального), обновления версий ПО с нулевым или минимальным downtime;
- Разработка и поддержка Disaster Recovery (DR) и процедур аварийного восстановления (backup/restore для Elasticsearch, mirroring/replication для Kafka). Регулярное проведение учебных восстановлений;
- Разработка и документирование runbooks (чек-листов действий) для частых инцидентов (например, отказ ноды, потеря лидера партиции, рост consumer lag, «желтый/красный» статус кластера ES);
- Координация действий команды во время инцидента, коммуникация с заинтересованными сторонами;
- Проведение постмортемов (Post-Mortem) по серьёзным инцидентам с выработкой плана по предотвращению повторения;
- Ведение актуальной архитектурной и эксплуатационной документации.
- Документирование всех внесенных изменений, процедур, политик.
НАШИ ОЖИДАНИЯ ОТ КАНДИДАТА:
- Высшее образование;
- Опыт администрирования Elasticsearch в production;
- Практический опыт масштабирования кластеров (hot-warm-cold архитектуры), обновлений версий;
- Настройка мониторинга (cluster health, jvm, indices stats, thread pools);
- Резервное копирование и восстановление с использованием snapshot/restore API в S3;
- Опыт администрирования Apache Kafka в production;
- Понимание внутреннего устройства: брокеры, топики, партиции, реплики, ISR, контроллер, ZooKeeper/KRaft;
- Настройка и мониторинг критических метрик: lag потребителей, throughput, размер топиков, состояние реплик, under-replicated partitions;
- Опыт работы с Linux;
- Знание систем мониторинга: Prometheus, Grafana, Zabbix;
- Опыт работы с системами сбора логов (ELK stack как минимум для логов самих систем);
- Знание основ сетей (TCP/IP, firewall, latency, throughput).
ЧТО МЫ ПРЕДЛАГАЕМ:
- Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
- Забота о вашем здоровье: ДМС с первого месяца работы, куда входит стоматология;
- Прозрачный доход: оклад (по итогам интервью) + ежеквартальные премии по результатам KPI;
- Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Брянск, Новосибирск и др.);
- Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (скидки на спортзалы, рестораны, маркетплейсы и т.д.).
Адрес: Россия, Москва, Пресненская набережная, 10с2
Опубликована месяц назад
Похожие вакансии
150 000 - 200 000 ₽
Выше средней на 34%
Х4 Падел это: - Быстрорастущая сеть падел‑клубов с планами открытия новых объектов (крытые/открытые корты, раздевалки, зоны отдыха). - Модульный подход к строительству: стандартизация под размеры кортов, освещение и инженерные системы. - Фокус на над...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
8 дней назад
200 000 - 250 000 ₽
Выше средней на 73%
В связи с расширением штата в команду требуется Главный инженер проекта.
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
15 дней назад
150 000 - 200 000 ₽
Выше средней на 34%
Ведение работ на площадке: координация инженеров, прорабов, подрядчиков.
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
20 дней назад
Обязанности: Проектирование ВК/НВК; Сбор исходных данных для проектирования; Разработка технических решений; Выполнение расчетов, подбор оборудования; разработка чертежей; Согласование проектных решений со смежными отделами и выдача заданий Требовани...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
18 дней назад
... Главный инженер Отдела сопровождения аналитических систем Департамент больших данных ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ ...
- Можно удаленно
- Полный день
- Опыт от 1 года
- Москва
месяц назад
Вакансия в подборках
Похожие вакансии
150 000 - 200 000 ₽
200 000 - 250 000 ₽
150 000 - 200 000 ₽