- Работа в Москве
- IT, интернет, связь, телеком
- Site reliability engineer
- Senior Site Reliability Engineer (SRE)
Senior Site Reliability Engineer (SRE)
По договоренности
Команда Ventra Go! приветствует тебя!
Ventra – HR-холдинг, более 20 лет предлагающий инновационные решения в области аутсорсинга бизнес-процессов, HR-консалтинга и гибкой занятости.
-  Ventra Go! – цифровая платформа и мобильное приложение гибкой занятости. 
-  Мы объединяем заказчиков и исполнителей, гарантируя первым быстрое закрытие потребности во временном персонале, а вторым — ежедневные выплаты и возможность решать, где и когда они хотят зарабатывать. 
-  Наши заказчики – лидеры российского и международного бизнеса в сфере E-commerce, ритейла, FMCG, производства, логистики. 
-  На наших проектах занято более 2 000 000 исполнителей! 
-  Ventra Go! входит в ТОП-4 крупнейших HR Tech продуктов РФ и рейтинг растущих компаний Smart 500 (по версии Smart Ranking). 
-  ТОП-30 приложений категории “Бизнес” в App Store & Google Play. 
-  У нас есть множество задач, которые не решил еще ни один сервис в мире! 
Мы в VentraGo строим платформу подработок, где сотни тысяч исполнителей ежедневно находят задания, выходят на смены и получают выплаты. Наша инфраструктура работает под высокой нагрузкой (миллионы событий, тысячи транзакций и real-time обработка данных). Мы ищем Senior SRE инженера, который поможет нам масштабировать сервисы, повысить надежность и внедрить современные практики эксплуатации.
Чем предстоит заниматься:
- Проектировать и развивать инфраструктуру под высокие нагрузки (Kubernetes, Kafka, PostgreSQL, OpenSearch).
- Разрабатывать системы мониторинга, алертинга и логирования (Prometheus, Grafana, OpenTelemetry, Sentry, ELK).
- Участвовать в построении CI/CD процессов (Jenkins).
- Автоматизировать всё и везде: от классических Terraform, Helm, Ansible до самописных интеграций.
- Внедрять SLI, следить за SLO, обеспечивать SLA сервисов.
- Совместно с DevOps и разработкой внедрять практики Observability и Chaos Engineering.
- Участвовать в инцидент-менеджменте (p0/p1), проводить RCA и постмортемы.
- Работать над оптимизацией стоимости инфраструктуры (cost-efficiency).
Мы ожидаем от тебя:
- 4+ лет опыта работы SRE/DevOps/Platform Engineer.
- Глубокие знания Linux, HTTP и TCP, контейнеризации и оркестрации (Docker, Kubernetes).
- Опыт проектирования масштабируемых и отказоустойчивых систем.
- Отличное понимание мониторинга, логирования и трассировки.
- Опыт автоматизации инфраструктуры (Terraform/Helm/Ansible).
- Знания CI/CD практик, умение строить delivery pipelines.
- Участие в инцидент-менеджменте, умение проводить RCA.
- Опыт работы с git
Будет плюсом:
- Опыт работы с ML/данными, Superset/Airflow или умение писать на Kotlin/Java.
Мы предлагаем:
-  Достойную заработную плату и прозрачную систему мотивации. 
-  Официальное оформление по ТК РФ. 
- Удаленный или гибридный формат работы.
-  Социальные программы (ДМС, оплата больничного, программы матпомощи, обучения и др.). 
-  Дополнительные оплачиваемые выходные дни. 
-  Корпоративный доступ к образовательным платформам. 
-  Программу корпоративных привилегий PrimeZone. 
-  Работа в быстроростущем продукте (HRTech/FinTech, marketplace). 
- Масштабные вызовы: миллионы пользователей, высокий трафик, real-time задачи.
- Участие в ключевых архитектурных решениях.
- Открытая культура: постмортемы без blame, сильная инженерная команда.
Мы уверены, что вместе сможем добиться крутых результатов! Если это про тебя — давай знакомиться!
Опубликована 17 дней назад