среда, 22 июня 2016 г.

Дизайн VDC. Расчет системы хранения

Расчет классической СХД по производительности

Классическая СХД всегда рассчитывается по худшему варианту (worst case scenario), исключая влияние оперативного кэша и оптимизации операций.
В качестве базовых показателей производительности принимаем механическую производительность с диска (IOPSdisk):
- 7.2k – 75 IOPS
- 10k – 125 IOPS
- 15k – 175 IOPS

Далее количество дисков в дисковом пуле рассчитывается по следующей формуле: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. Где:
- TotalIOPS – суммарная требуемая производительность в IOPS с дискового пула
- RW – процентная доля операций чтения
- RAIDpen – RAID penalty для выбранного уровня RAID

Подробнее об устройстве RAID и RAID Penalty рассказывается здесь - Производительность СХД. Часть первая. и Производительность СХД. Часть вторая. и Производительность СХД. Часть третья

Исходя из полученного количества дисков рассчитываются возможные варианты, удовлетворяющие требованиям по емкости хранения, включая варианты с многоуровневым хранением.
Расчет систем с использованием SSD в качестве уровня хранения рассматривается отдельно.

Особенности расчета систем с Flash Cache

Flash Cache – общее название для всех фирменных технологий использования флэш-памяти в качестве кэша второго уровня. При использовании флэш кэша СХД как правило рассчитывается для обеспечения с магнитных дисков установившейся нагрузки, в то время как пиковую обслуживает кэш.
При этом необходимо понимать профиль нагрузки и степень локализации обращений к блокам томов хранения. Флэш кэш – технология для нагрузок с высокой локализацией запросов, и практически неприменима для равномерно нагруженных томов (как например для систем аналитики).

Расчет гибридных систем low-end / mid-range

Гибридные системы нижнего и среднего классов используют многоуровневое хранение с перемещением данных между уровнями по расписанию. При этом размер блока многоуровневого хранения у лучших моделей составляет 256 МБ. Данные особенности не позволяют считать технологию многоуровневого хранения технологией повышения производительности, как ошибочно считается многими. Многоуровневое хранение в системах нижнего и среднего классов – это технология оптимизации стоимости хранения для систем с выраженной неравномерностью нагрузки.

Для многоуровневого хранения рассчитывается прежде всего производительность по верхнему уровню, в то время как нижний уровень хранения считается лишь вносящим недостающую емкость хранения. Для гибридной многоуровневой системы обязательно использование технологии флэш кэша для многоуровневого пула с целью компенсации просадки производительности для внезапно нагревшихся данных с нижнего уровня.

Использование SSD в многоуровневом дисковом пуле

Использование SSD в многоуровневом дисковом пуле имеет вариации, в зависимости от особенностей реализации алгоритмов флэш кэша у данного производителя.
Общая практика политики хранения для дискового пула с SSD уровнем - SSD first.
Read Only Flash Cache. Для флэш кэша только на чтение уровень хранения на SSD появляется при значительной локализации операций записи вне зависимости от кэша.
Read / Write Flash Cache. В случае с флэш кэшем на запись сначала устанавливается максимальный объем кэша, а уровень хранения на SSD появляется лишь при недостаточности размера кэша для обслуживания всей локализованной нагрузки.
Расчет производительности SSD и кэша производится каждый раз исходя из рекомендаций производителя, но всегда для наихудшего варианта.

8 комментариев:

  1. Было бы здорово увидеть варианты использования многоуровневых дисковых пулов.

    ОтветитьУдалить
  2. "- RW – процентная доля операций чтения" - нет ли здесь неточности?

    ОтветитьУдалить
    Ответы
    1. Все точно. Если чтение/запись 80/20, то RW = 0.8

      Удалить
  3. Линк на "Производительность СХД. Часть первая" потерялся.

    ОтветитьУдалить
  4. "Гибридные системы нижнего и среднего классов используют многоуровневое хранение с перемещением данных между уровнями по расписанию" - не обязательно "по расписанию". тот же IBM применяет алгоритм основанный на статистике обращения к данным и перемещает на SSD "горячие блоки".

    "При этом размер блока многоуровневого хранения у лучших моделей составляет 256 МБ"
    у каких лучших моделей? у некоторых моделей и гигабайтными блоками перемещение происходит.

    также вы бы акцентировали внимание на том, что использование SSD в качестве кэша != тиринг

    ОтветитьУдалить
    Ответы
    1. > тот же IBM применяет алгоритм основанный на статистике обращения к данным и перемещает на SSD "горячие блоки".

      Да. Сутки собирает, а потом по расписанию запускается сам процесс перемещения.

      >у каких лучших моделей? у некоторых моделей и гигабайтными блоками перемещение происходит.

      Разве это лучшие? :)

      >также вы бы акцентировали внимание на том, что использование SSD в качестве кэша != тиринг

      В данном случае не было цели писать глубокий текст о разнице между кэшем и тирингом. Но если реально нужно - можно написать отдельно.

      Удалить
    2. > Разве это лучшие? :)
      нет :)
      >Но если реально нужно - можно написать отдельно.
      просто вопрос в том, что если уже затрагивать тему многоуровнего хранения - очень нужно и выступить со стороны кастомера и объяснить ньюфагам что и как. я неоднократно сталкивался с тем, что клиент, потенциальный покупатель СХД, перед пресейлом выглядит как кролик перед удавом. слушает ересь и маркетинговый буллшит и покорно верит :)

      Удалить