понедельник, 5 июля 2010 г.

HA: Как работает “das.maxvmrestartcount”?

В статье "HA Deepdive: Isolation" было написано о появившемся в vSphere 4.0 параметре das.maxvmrestartcount.

Так как же конкретно происходит перезапуск ВМ и какое влияение имеет этот параметр?

При наступлении HA события, т.е. падении хоста с запущенной виртуальной машиной, HA будет пытаться перезапустить машину на одном из хостов в кластере. Если попытка не удалась, то HA увеличивает на единицу счетчик попыток перезапуска. Первая повторная попытка будет произведена через две минуты, вторая - через 4, каждая последующая через 8 минут. И так до тех пор, пока ВМ не включится либо счетчик не превысит значение das.maxvmrestartcount.

Чуть более наглядно. Предположим, что хост рухнул в 11:59:45, тогда попытки перезапуска ВМ состоятся в:
  • 12:00 (после 15 секундного таймаута)
  • 12:02 (+2 минуты)
  • 12:04 (+4 минуты)
  • 12:12 (+8 минут)
  • 12:20 (+8 минут)
  • 12:28 (+8 минут)
Иными словами, при значении das.maxvmrestartcount по умолчанию равном 5, перезапуск ВМ может занять до получаса (разумеется, при неудачных попытках). При увеличении das.maxvmrestartcount каждая последующая попытка будет так же происходить через 8 минут.

За информацию благодарность Duncan Epping.

Комментариев нет:

Отправить комментарий