Главный SRE-инженер
По договоренности
Корпоративная инфраструктура для генеративного AI с поддержкой Large Language Models (LLM). Платформа обеспечивает отказоустойчивость, масштабируемость и высокую скорость инференса моделей. Она включает оптимизацию инференса, квантизацию, управление GPU-ресурсами и автоматизацию развертывания на Kubernetes. На этой платформе разворачиваются все AI-решения Банка, и инженер SRE будет отвечать за надежность, мониторинг и автоматизацию инфраструктуры.
Чем предстоит заниматься:
- Развитие и поддержка системы observability: сбор метрик, логов, алертов, dashboards
- Анализ инцидентов и проведение post-mortem, повышение надежность платформы
- Обеспечениие высокой доступности и отказоустойчивости инфраструктуры
- Автоматизация рутиннных операций и эксплуатационных процессов (Infrastructure as Code)
- Настройка, поддержка Kubernetes-кластеров и сопутствующих сервисов
- Поддержка Linux-серверов и системных ПО платформы
- Взаимодействие с командой DevOps и инженеров инфраструктуры для решения комплексных задач
- Разработка и поддержка скриптов и утилит для автоматизации на Python/Go
- Участие в планировании и внедрении новых сервисов и компонентов платформы
- Содействие улучшению процессов мониторинга, алертинга и документации
Наши пожелания к кандидатам:
- Опыт работы SRE / Platform / Infrastructure Engineer от 5 лет
- Опыт эксплуатации Kubernetes в production
- Опыт работы с Linux-серверами и системным ПО
- Опыт работы с системами мониторинга и логирования (metrics, dashboards, alerts)
- Опыт автоматизации инфраструктуры (Infrastructure as Code, Ansible/Terraform).
- Навыки программирования или автоматизации на Python, знание Go — преимущество
- Опыт анализа инцидентов и проведения post-mortem
- Понимание работы распределённых систем и микросервисной архитектуры
- Высшее техническое образование
Что мы предлагаем:
- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
- Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
- Удалённый формат работы, а также уютный ИТ-хаб в Москве и сезонный коворкинг в Сочи
- Сложные и интересные задачи, современный стек технологий
- Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
- Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
- Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
- Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины
Опубликована день назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX О компании: Мы создаем единую систему цифровой маркировки и прослеживания товаров в России и странах ЕАЭС. Наша система позволяет снизить уровень контрафакта и гарантировать подлинность товаров, производимых в стране или ввозимых в нее. Честный Знак ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
день назад
Открыта вакансия Devops Engineer (1С) в компании ПЕРСПЕКТИВА – российская торговая FMCG (товары повседневного спроса) компания в категории безалкогольные и слабоалкогольные напитки, специализирующаяся на оптово-розничных продажах. Чем предстоит заним...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
день назад
... знакомиться ;) Команда разработки нашего продукта Кибер Инфраструктура растёт, сейчас мы ищем Системного инженера ...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
день назад
от 180 000 ₽
Обязанности: Разработка проектной документации на стадии П и Р, марки КЖ, КМ, КР для жилых и общественных зданий; Выполнение расчётов конструкций; Согласование проектных решений со смежными разделами; Участие в производственных совещаниях и в совещан...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
день назад
О нас DataLouna — киберспортивная аналитика нового поколения. 4 года превращаем сырые данные CS2 и Dota 2 в уникальную статистику, предсказания и беттинг-линии. Мы часть крупного киберспортивного холдинга (Team Spirit и другие проекты), работаем с то...
- Можно удаленно
- Полный день
- Опыт от 5 лет
- Москва
день назад