DevOps-инженер (Группа инфраструктуры и автоматизации платформы обработки данных)
По договоренности
Группа инфраструктуры и автоматизации платформы обработки данных обеспечивает бесперебойную работу и развитие высоконагруженной экосистемы для обработки больших данных и машинного обучения.
Наша зона ответственности охватывает полный жизненный цикл данных: от построения производительных Bare Metal кластеров Kubernetes до внедрения комплексных MLOps-решений для автоматизации обучения и деплоя нейросетевых моделей.
Чем предстоит заниматься:
- Настройка и поддержка CI/CD-пайплайнов с использованием GitLab CI, автоматизация процессов сборки, тестирования и деплоя приложений.
- Управление инфраструктурой на базе Kubernetes: развертывание, масштабирование, оптимизация кластеров, включая настройку сетевых политик и безопасности с помощью Cilium.
- Разработка и поддержка различных продуктов: Internal Developer Platform, Управление космической системой, Платформа математических вычислений, Платформа аналитики данных.
- Внедрение GitOps-подхода с использованием Flux CD для управления конфигурациями.
- Интеграция и настройка Observability-стека: Victoria Metrics, OpenTelemetry, Grafana, Victoria Logs, OpenSearch для мониторинга, сбора метрик, логов и трейсинга.
- Работа с системами управления секретами (HashiCorp Vault) и обеспечение безопасности инфраструктуры.
- Оптимизация инфраструктуры для проектов на Golang, Python, Java, включая поддержку микросервисных архитектур.
- Настройка и управление кластерами Kafka/RMQ.
- Развертывание и эксплуатация инструментов жизненного цикла ML (обучение, трекинг, инференс).
Наш стек:
- Оркестрация: Kubernetes, Cilium, Flux CD.
- CI/CD: GitLab CI, Flux CD.
- Безопасность: HashiCorp Vault, Cilium Network Policies.
- Мониторинг: Victoria Metrics, Grafana, OpenTelemetry, Victoria Logs, OpenSearch.
- Языки: Golang, Python, Java.
- IaC: Terraform, Ansible.
- MLOps: ClearML, Triton Inference Server, Kserve, vLLM.
- BigData: Apache Airflow, Apache Spark.
- Инфраструктура: VMWare + Bare Metal K8s.
Что мы ожидаем:
- Опыт работы от 2 лет в DevOps/SRE или смежных ролях;
- Глубокое понимание Kubernetes (включая сетевые политики через Cilium), управление Helm-чартами, troubleshooting;
- Опыт работы с CI/CD-инструментами;
- Навыки работы с инфраструктурой как код (Terraform, Ansible) и GitOps-подходом (Flux CD/Argo CD);
- Опыт развертывания, конфигурирования и поддержки кластеров Apache Spark и Apache Airflow. Понимание принципов распределенной обработки данных.
- Знание инструментов жизненного цикла ML (Kubeflow, MLflow, ClearML) и опыт проброса GPU-ресурсов в контейнеризированные среды.
- Умение настраивать Observability-стек: Victoria Metrics, Grafana, OpenTelemetry, Victoria Logs;
- Опыт работы с системами управления секретами (HashiCorp Vault);
- Навыки написания скриптов на Bash, Python или Golang;
- Умение работать с Linux;
- Владение английским языком для чтения документации.
Будет плюсом:
- Опыт разработки или поддержки Internal Developer Platform (IDP) — платформ для ускорения процессов разработки;
- Знание Cilium для реализации сетевой безопасности, Service Mesh (на базе eBPF) и балансировки нагрузки;
- Опыт с сервисными мешами (Istio, Linkerd) и API-шлюзами (Traefik, Kong);
- Навыки работы с распределенными системами хранения (S3, MinIO) и базами данных;
- Участие в проектах с микросервисной архитектурой, highload-нагрузками и Big Data;
- Понимание принципов FinOps и оптимизации cloud-расходов.
Мы предлагаем:
- Работу в аккредитованной ИТ-компании;
- Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным;
- Возможность выбора формата работы (офис/гибрид/удаленка);
- Комфортный современный офис в 10 минутах от метро "Мнёвники";
- Оформление в соответствии с ТК РФ;
- Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.
Адрес: Россия, Москва, Западный административный округ, район Филёвский Парк
Опубликована 2 часа назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX ... ; Консультирование продуктовых команд по инфраструктурным вопросам, участие во внедрении стандартов DevOps ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
... ландшафт банка -Реализовывать пилотные проекты бизнеса Наши ожидания от кандидата -Опыт работы на позиции DevOps ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 часа назад
Приглашаем опытного Devops-инженера на банковский проект. ... Важные знания и опыт: опыт в качестве инженера DevOps или смежный опыт администрирования и автоматизации ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
от 200 000 ₽
Рыночная зарплата
Мы ищем инженера, который будет развивать и поддерживать современную инфраструктуру, автоматизировать ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
... предлагать рациональные решения; Готовность к обучению — стремление следить за изменениями, обновлениями DevOps ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
О компании «Флант» — лидер российского рынка DevOps и Kubernetes. ... А ещё консультируем по DevOps-практикам и технологиям. ... Сейчас во «Фланте» работают 500+ человек, большая часть из которых — инженеры.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Вакансия в подборках
Похожие вакансии
от 200 000 ₽