Инженер по надежности сервисов
По договоренности
Наша компания уже много лет работает над сложными проектами, в том числе крупными B2B, которые состоят из десятков сервисов, генерируют терабайты данных и обрабатывают тысячи событий в секунду. Мы сами создаем и поддерживаем проекты, поэтому для нас важно контролировать их работу в соответствии с нужным уровнем надежности. За это у нас отвечает отдельная команда - Инженеров по надежности сервисов.
Чем предстоит заниматься:
- Плотно взаимодействовать с другими командами - поддержки, разработки, тестирования и системного администрирования;
- Участвовать в жизни проектов на всех этапах: проектирование, разработка, внедрение, эксплуатация;
- Настраивать и дорабатывать системы мониторинга;
- Планировать и проводить испытания работающих систем на надежность и производительность;
- Выполнять работы по настройке и деплою проектов в production-окружение, запускать проекты в кластере Kubernetes;
- Изучать имеющиеся проекты и поддерживать документацию по ним, участвовать в разработке новой документации;
- Изучать новые технологии, применять их на практике;
- Реагировать на проблемы с сервисами, расследовать и участвовать в устранении инцидентов;
- Проводить postmortem-анализ инцидентов, принимать меры против повторения инцидентов;
- Работать с логами, анализировать данные.
Требуется:
- Базовые навыки программирования, разработки скриптов и автоматизации;
- Навыки чтения незнакомого кода, конфигурационных файлов;
- Понимание принципов работы сетей и веб-сервисов;
- Понимание принципов и опыт работы с Kubernetes;
- Опыт работы с Helm, Helm-чартами, Helmfile;
- Опыт поддержки и траблшутинга сервисов и приложений;
- Базовые знания по информационной безопасности;
- Опыт использования реляционных и нереляционных БД, умение составлять SQL-запросы сложнее, чем select+from;
- Навыки работы с проектной документацией;
- Хорошее знание Linux и основных утилит;
- Стабильный канал в Интернет, возможность быть на связи в рабочее время и круглосуточно на время дежурства.
Будет плюсом:
- Опыт работы с Gitlab CI/CD;
- Опыт развертывания и настройки отказоустойчивых и распределенных систем;
- Опыт работы с terraform, ansible;
- Опыт работы с Grafana в настройке графиков и алертов, опыт работы с InfluxDB и Prometheus;
- Знание чего-либо из нашего стека технологий;
- Опыт в программировании и совместной разработке, понимание, что такое качественный код.
Наш стек:
- Erlang, Elixir, Ruby, Python, Kotlin;
- Postgresql, Redis, ClickHouse, Kafka;
- Influxdb, Prometheus, Grafana;
- Nginx, Haproxy, Docker, Kubernetes.
Условия:
- Работа удаленно или в одном из офисов в Москве, Казани, Ульяновске;
- Официальное оформление по ТК РФ;
- Программа ДМС.
Адрес: Россия, Москва, Северный административный округ, улица 8 Марта, 10с2
Опубликована 21 день назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ML Ops / SRE инженер (Highload ML системы) Мы развиваем интеллектуальное ядро сети ресторанов с высоконагруженной ... Ищем опытного инженера для развития нашей ML-платформы в сильном профессиональном коммьюнити. ... делать: Поддержка и оптимизация MLOps-инфраструктуры: CI/CD (GitLab CI, ArgoCD), MLflow, DVC Обеспечение надежности ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
7 дней назад
Ключевые задачи: Анализ поступающих технических заданий на предмет реализуемости; Участие в проектах по внедрению и сопровождению информационных систем заказчиков (базовые сетевые сервисы, почтовые системы, службы каталогов и т.д.); Участие во внутре...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Обязанности: Разработка, развитие и поддержка CI/CD процессов с нуля; Работа с Kubernetes-кластерами и Linux-серверами; Развертывание и настройка Kubernetes, Kafka и сопутствующего ПО; Настройка мониторинга, логирования и балансировки; Автоматизация ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Требования: • Опыт работы DevOps-инженером от 3 лет; • Опыт сопровождения Kubernetes в продуктивных средах ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
от 200 000 ₽
Выше средней на 11%
Мы ищем DevOps/Системного инженера для создания и поддержки отказоустойчивой ИТ-инфраструктуры. ... балансировки и обеспечения отказоустойчивости. · Умение писать скрипты (Bash, Python). · Желание строить надежные ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад