Поддержка и развитие production-инфраструктуры облачного провайдера. Управление Kubernetes-кластерами, observability (Prometheus, Grafana, Loki), реагирование на инциденты, повышение надёжности до уровня 99,95%. Дежурства на пейджере по графику.
Требования
- Kubernetes / Docker — production-опыт от 3 лет
- Prometheus, Grafana, Loki, Tempo
- Terraform, Ansible — IaC-подход
- PostgreSQL администрирование на уровне HA
- Готовность к дежурствам on-call