Senior DevOps / Site Reliability Engineer

SRE для облачной платформы: Kubernetes, observability, инциденты, надёжность сервисов уровня 99,95%.

Senior Полная занятость от 1 200 000 ₸ (нетто)

Поддержка и развитие production-инфраструктуры облачного провайдера. Управление Kubernetes-кластерами, observability (Prometheus, Grafana, Loki), реагирование на инциденты, повышение надёжности до уровня 99,95%. Дежурства на пейджере по графику.

Требования

Kubernetes / Docker — production-опыт от 3 лет
Prometheus, Grafana, Loki, Tempo
Terraform, Ansible — IaC-подход
PostgreSQL администрирование на уровне HA
Готовность к дежурствам on-call