Инженер мониторинга / Observability engineer
По договоренности
Мы стабильная и быстрорастущая финтех-компания, обеспечивающая надежную и безопасную обработку платежей для крупнейших бизнесов в России и СНГ.
Наша миссия – сделать онлайн-платежи безопасными и доступными для всех, обеспечивая защиту от мошенничества и соблюдение строгих нормативных требований. Мы не просто обрабатываем транзакции, мы создаем системы, которые по могают бизнесам расти и развиваться в условиях динамично меняющегося рынка.
В Finframe вы найдет е отличные возможности для карьерного роста, профессионального развития и участия в интересных и сложных проектах.
Чем предстоит заниматься:
-
Развертывание и эксплуатация систем наблюдаемости (метрики, алерты, логи, трейсы).
- Автоматизация деплоя систем наблюдаемости и построение различных service discovery.
- Разработка и внедрение дашбордов, правил алертинга.
- Анализ метрик, логов и трейсов для поиска узких мест и оптимизации производительности.
- Тесное взаимодействие с командами для внедрения best practices наблюдаемости.
- Участие в построении культуры обработки инцидентов.
Мы ожидаем, что вы:
-
Имеете понимание работы сетей и протоколов.
- Владеете навыками использования систем оркестрации (ansible) и понимаете принципы IaC.
- Умеете gitlab ci/cd.
- Фамильярны с docker.
- Глубоко понимаете концепцию Observability (метрики, логи, трейсы).
- Знакомы с PromQL, LogQL, LogsQL не по наслышке.
- Можете делать дашборды grafana самостоятельно.
- Пишете документацию/guidelines/runbooks
- Имеете опыт:
- Эксплуатации ОС linux (желательно, семейство RHEL).
- Работы DevOps/SRE-инженером с фокусом на мониторинг и повышение доступности нагруженных систем, работающих 24/7.
- Развертывания и эксплуатации Prometheus, VictoriaMetrics, Grafana Loki, VictoriaLogs, Grafana Tempo.
- Настройки и управления алертингом (Alertmanager, Telegram-боты).
- Эксплуатации множества различных экспортеров/коллекторов.
- Эксплуатации и понимание работы СУБД (и приложений работающих с СУБД).
- Создания sql запросов для сбора метрик.
Будет плюсом:
-
Опыт разработки, развёртывания и эксплуатации полноценной платформы наблюдаемости для компании.
-
Знание фреймворка SRE (SLI/SLO/SLA, error budgets).
-
Опыт работы с Kubernetes и понимание его метрик.
-
Знание облачных провайдеров и их сервисов для мониторинга.
- Знакомы с различными бэкэндами для хранения данных наблюдаемости (clickhouse, scylladb, minio, итп).
- sentry.
- saltstack.
- statsd graphite clickhouse stack.
- Опыт разработки различных экспортеров/коллекторов для сбора метрик (bash, python).
- OpsGenie.
Что мы предлагаем:
- Официальное трудоустройство в соответствии с ТК РФ в аккредитованную IT-компанию.
- ДМС и страхование от несчастных случаев с первой рабочей недели, оплату больничных за первые 10 дней до 100% от оклада.
- Гибкий формат работы: Удаленная работа, либо гибридный формат работы в самом центре Москвы, в офисе по ул. Мясницкая, 16.
- Современная техника для работы (Macbook, мониторы, и все что вам нужно для комфортной работы.
- Возможность поработать в атмосфере небольшой уютной дружной компании, где все решается быстро, в дружеской обстановке и без бюрократии.
- Ежегодные корпоративы с компенсацией дороги и проживания .
Присоединяйтесь к нашей команде и постройте успешную карьеру в перспективной и востребованной сфере!
Опубликована 2 дня назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва