Восстановить потерянный кластер

Наличие регулярно создаваемых резервных копий может помочь оперативно восстановить работу системы:

  • в случае потери кластера управления;
  • в случае потери клиентского кластера (все Master-узлы NotReady);
  • в случае удаления клиентского кластера;
  • в случае потери критических данных клиентского кластера.

Рекомендуем настроить планировщик резервных копий как минимум для:

  1. неймспейсов клиентских кластеров в кластере управления;
  2. инфраструктурных провайдеров в кластере управления;
  3. GroupRoles, ClusterRoles в кластере управления;
  4. клиентских кластеров с полным набором данных, необходимых для обеспечения жизнедеятельности развернутых приложений;

Эти ресурсы могут быть полезны для восстановления контроля над клиентскими кластерами в случае отказа кластера управления, а также для восстановления клиентских кластеров.

Восстановление доступа к клиентским кластерам при потере кластера управления

В случае, если все Master-узлы кластера управления не отвечают и есть резервная копия неймспейсов клиентских кластеров в S3-хранилище, необходимо:

  1. Инсталлировать платформу Штурвал в соответствии с инструкцией, где
    • 1.1 в качестве IP-адреса API-сервера должен быть использован IP-адрес не отвечающего кластера управления;
    • 1.2 количество и характеристики узлов должны соответствовать параметрам не отвечающего кластера управления;
    • 1.3 установить модуль резервного копирования и восстановления.
  2. Настроить доступ к S3 хранилищу с помощью интерфейса резервного копирования и восстановления в кластере управления.
  3. Восстановить резервную копию, содержащую данные неймспейсов клиентских кластеров. Доступ к управлению клиентскими кластерами должен быть восстановлен.

Восстановление при потере клиентского кластера

В случае, если IP-адреса всех мастеров клиентского кластера недоступны, но сохранены данные конфигурации клиентского кластера в кластере управления и есть резервная копия клиентского кластера, рекомендуется:

  1. Создать новый клиентский кластер с характеристиками сломанного кластера, теми же IP-адресами API-сервера и Ingress.
  2. Установить модуль резервного копирования и восстановления (Velero) в режиме auto;
  3. Подключить S3 хранилище, в котором находится резервная копия сломанного кластера.
  4. Восстановить резервную копию клиентского кластера.

Восстановление при удалении клиентского кластера

В случае, если IP-адреса всех мастеров клиентского кластера недоступны, данные конфигурации клиентского кластера утеряны, рекомендуется:

  1. Поднять временный клиентский кластер.
  2. Подключить S3 хранилище, в котором находится резервная копия неймспейсов клиентских кластеров из кластера управления.
  3. Восстановить неймспейс удаленного клиентского кластера из резервной копии кластера управления.
  4. Записать конфигурацию клиентского кластера. После чего тестовый кластер можно удалить.
  5. Дальнейшие шаги соответствуют инструкции “Восстановление при потере клиентского кластера”