среда, 7 июля 2010 г.

Улучшения работы HA в vSphere 4.0 update 2

Одна из часто встречающихся проблем в среде с iSCSI/NFS и VMware HA до vSphere 4.0u2 - split brain.

Для начала попробую объяснить, что такое split brain. Предположим, что у нас такая инфраструктура:

  • 4 хоста
  • iSCSI / NFS хранилище
  • Isolation response: leave powered on

В случае полной изоляции одного из хостов, включая сеть хранения данных, происходит следующее:

  1. Хост ESX001 полностью изолирован, включая сеть хранения данных (у нас ведь iSCSI/NFS), но виртуальные машины не выключаются, поскольку ответ на изоляцию "leave powered on".
  2. Через 15 секунд оставшиеся неизолированными хосты начнут перезапускать виртуальные машины.
  3. Поскольку iSCSI/NFS сеть также изолирована от ESX001, блокировки на VMDK файлах истекут по таймауту, и оставшиеся хосты смогут загрузить ВМ.
  4. Когда ESX001 вернется из изоляции, у него все еще останутся в памяти запущенные VMX процессы. И теперь начнется "пинг-понг" с vCenter - ВМ начнут переключаться то на ESX001, то на другие хосты.
В update 2 ESX(i) автоматически определяет, что блокировка VMDK была утеряна и ВМ автоматически выключаются, чтобы избежать "пинг-понга". HA также создаст соответствующий event, который можно будет увидеть в vCenter.

Оригинал: Duncan Epping

Комментариев нет:

Отправить комментарий