Стандартные уровни RAID - Standard RAID levels

В компьютерное хранилище, то стандартные уровни RAID составляют базовый набор RAID ("избыточный массив независимых дисков" или же "Избыточный массив недорогих дисков") конфигурации, в которых используются методы чередование, зеркальное отображение, или же паритет для создания больших надежных хранилищ данных с нескольких универсальных компьютеров жесткие диски (HDD). Наиболее распространенными типами являются RAID 0 (чередование), RAID 1 (зеркальное отображение) и его варианты, RAID 5 (распределенная четность) и RAID 6 (двойная четность). Уровни RAID и связанные с ними форматы данных стандартизированы Промышленная ассоциация сетей хранения данных (SNIA) в стандарте Common RAID Disk Drive Format (DDF).[1] Числовые значения служат только в качестве идентификаторов и не обозначают производительность, надежность, генерацию или какой-либо другой показатель.

Хотя большинство уровней RAID могут обеспечить хорошую защиту и восстановление после аппаратных дефектов или дефектных секторов / ошибок чтения (серьезные ошибки), они не обеспечивают защиты от потери данных из-за катастрофических отказов (пожар, вода) или мягкие ошибки например, ошибка пользователя, неисправность программного обеспечения или заражение вредоносным ПО. Для ценных данных RAID - это только один из строительных блоков более крупной схемы предотвращения потери данных и восстановления - он не может заменить резервный строить планы.

RAID 0

Схема настройки RAID 0

RAID 0 (также известный как набор полосок или же полосатый объем) разделяет ("полосы ") данные равномерно на двух или более дисках, без паритет информация, избыточность или Отказоустойчивость. Поскольку RAID 0 не обеспечивает отказоустойчивости или избыточности, отказ одного диска приведет к отказу всего массива; в результате чередования данных по всем дискам сбой приведет к полной потере данных. Эта конфигурация обычно реализуется с заданной скоростью.[2][3] RAID 0 обычно используется для повышения производительности, хотя его также можно использовать как способ создания большого логического объем из двух или более физических дисков.[4]

Настройка RAID 0 может быть создана с дисками разного размера, но пространство хранения, добавляемое к массиву каждым диском, ограничено размером самого маленького диска. Например, если диск на 120 ГБ чередуется с диском на 320 ГБ, размер массива будет 120 ГБ × 2 = 240 ГБ. Однако некоторые реализации RAID позволяют использовать оставшиеся 200 ГБ для других целей.

На схеме в этом разделе показано, как данные распределяются в AИкс полосы на двух дисках, с A1: A2 в качестве первой полосы, A3: A4 в качестве второй и т. д. После определения размера полосы во время создания массива RAID 0 его необходимо поддерживать постоянно. Поскольку доступ к полосам осуществляется параллельно, п-drive Массив RAID 0 выглядит как один большой диск со скоростью передачи данных п в разы выше скорости однодискового.

Спектакль

Массив RAID 0 из п диски обеспечивают скорость чтения и записи данных до п раз выше, чем скорость отдельных дисков, но без избыточности данных. В результате RAID 0 в основном используется в приложениях, требующих высокой производительности и допускающих более низкую надежность, например, в научные вычисления[5] или же компьютерные игры.[6]

Некоторые тесты настольных приложений показывают, что производительность RAID 0 несколько выше, чем у одного диска.[7][8] В другой статье были рассмотрены эти утверждения и сделан вывод о том, что «чередование не всегда увеличивает производительность (в определенных ситуациях оно фактически будет медленнее, чем настройка без RAID), но в большинстве случаев это приведет к значительному повышению производительности».[9][10] Синтетические тесты показывают различные уровни повышения производительности при использовании нескольких жестких дисков или твердотельных накопителей в конфигурации RAID 0 по сравнению с производительностью одного диска. Однако некоторые синтетические тесты также показывают падение производительности для того же сравнения.[11][12]

RAID 1

Схема настройки RAID 1

RAID 1 состоит из точной копии (или зеркало ) набора данных на двух и более дисках; Классическая зеркальная пара RAID 1 состоит из двух дисков. Эта конфигурация не предлагает четности, чередования или распределения дискового пространства на нескольких дисках, поскольку данные зеркально отражаются на всех дисках, принадлежащих массиву, а размер массива может быть равен размеру самого маленького диска-члена. Этот макет полезен, когда производительность или надежность чтения более важны, чем производительность записи или результирующая емкость хранилища данных.[13][14]

Массив будет продолжать работать, пока работает хотя бы один диск-член.[15]

Спектакль

Любой запрос на чтение может обслуживаться и обрабатываться любым диском в массиве; таким образом, в зависимости от характера нагрузки ввода-вывода, производительность произвольного чтения массива RAID 1 может равняться сумме производительности каждого члена,[а] при этом скорость записи остается на уровне одного диска. Однако, если в массиве RAID 1 используются диски с разной скоростью, общая производительность записи равна скорости самого медленного диска.[14][15]

Синтетические тесты показывают различные уровни повышения производительности при использовании нескольких жестких дисков или твердотельных накопителей в конфигурации RAID 1 по сравнению с производительностью одного диска. Однако некоторые синтетические тесты также показывают падение производительности для того же сравнения.[11][12]

RAID 2

Схема настройки RAID 2

RAID 2, что редко используется на практике, разбивает данные на кусочек (а не блок), и использует Код Хэмминга за исправление ошибки. Диски синхронизируются контроллером для вращения с одинаковой угловой ориентацией (они достигают индекса в одно и то же время[16]), поэтому обычно он не может обслуживать несколько запросов одновременно.[17][18] Однако в зависимости от высокой ставки Код Хэмминга, многие шпиндели будут работать параллельно для одновременной передачи данных, так что возможны "очень высокие скорости передачи данных"[19] как, например, в DataVault где 32 бита данных передавались одновременно.

Поскольку все жесткие диски реализуют внутреннюю коррекцию ошибок, сложность внешнего кода Хэмминга дает небольшое преимущество перед контролем четности, поэтому RAID 2 реализовывался редко; это единственный исходный уровень RAID, который в настоящее время не используется.[17][18]

RAID 3

Схема настройки RAID 3 из шести байтовых блоков и двух паритет Показанные байты представляют собой два блока данных разного цвета.

RAID 3, который редко используется на практике, состоит из байт -уровневая чередование с выделенной паритет диск. Одной из характеристик RAID 3 является то, что он, как правило, не может обслуживать несколько запросов одновременно, что происходит потому, что любой отдельный блок данных по определению будет распределен по всем элементам набора и будет находиться в одном и том же физическом месте на каждом диске. Поэтому любой Ввод / вывод операция требует активности на каждом диске и обычно требует синхронизированных шпинделей.

Это делает его подходящим для приложений, требующих максимальной скорости передачи при длительных последовательных операциях чтения и записи, например несжатое видео редактирование. Приложения, выполняющие небольшие операции чтения и записи из случайных мест на диске, получат худшую производительность из этого уровня.[18]

Требование, чтобы все диски вращались синхронно (в шаг ) добавлены конструктивные особенности, которые не дали существенных преимуществ перед другими уровнями RAID. И RAID 3, и RAID 4 были быстро заменены на RAID 5.[20] RAID 3 обычно реализовывался аппаратно, а проблемы с производительностью решались за счет использования больших дисковых кешей.[18]

RAID 4

Схема 1: Настройка RAID 4 с выделенным паритет диск, каждый цвет которого представляет группу блоков в соответствующем паритет блок (полоса)

RAID 4 состоит из блокировать -уровневая чередование с выделенной паритет диск. Благодаря своей структуре RAID 4 обеспечивает хорошую производительность произвольного чтения, в то время как производительность произвольной записи низка из-за необходимости записи всех данных четности на один диск.[21]

На схеме 1 запрос чтения для блока A1 будет обслуживаться диском 0. Одновременный запрос чтения для блока B1 должен ждать, но запрос чтения для B2 может одновременно обслуживаться диском 1.

RAID 5

Схема настройки RAID 5 с распределенной паритет с каждым цветом, представляющим группу блоков в соответствующем паритет блок (полоса). На этой диаграмме показан левый асимметричный алгоритм

RAID 5 состоит из чередования на уровне блоков с распределенной четностью. В отличие от RAID 4, информация о четности распределяется между дисками. Для работы требуется наличие всех приводов, кроме одного. При выходе из строя одного диска последующие чтения могут быть рассчитаны на основе распределенной четности, так что данные не будут потеряны.[5] Для RAID 5 требуется как минимум три диска.[22]

По сравнению с RAID 4 распределенная четность RAID 5 выравнивает нагрузку на выделенный диск четности среди всех участников RAID. Кроме того, производительность записи увеличивается, поскольку все члены RAID участвуют в обслуживании запросов на запись. Хотя это будет не так эффективно, как чередование (RAID 0), поскольку четность все еще должна быть записана, это больше не является узким местом.[23]

Поскольку расчет четности выполняется на всей полосе, небольшие изменения в работе массива запись усиления[нужна цитата ]: в худшем случае, когда должен быть записан единственный логический сектор, необходимо прочитать исходный сектор и соответствующий сектор четности, исходные данные удаляются из четности, новые данные вычисляются в четности и как новые данные сектор и сектор новой четности записываются.

RAID 6

Схема настройки RAID 6, которая идентична RAID 5, за исключением добавления второго паритет блокировать

RAID 6 расширяет RAID 5, добавляя еще один паритет блокировать; таким образом, он использует блокировать -уровневое чередование с двумя блоками четности, распределенными по всем дискам-членам.[24]

По данным ассоциации Storage Networking Industry Association (SNIA), определение RAID 6: «Любая форма RAID, которая может продолжать выполнять запросы чтения и записи ко всем виртуальным дискам RAID-массива при наличии любых двух одновременных сбоев дисков. Несколько методов, включая вычисления данных двойной проверки (четность и Рид-Соломон ), данные двойной ортогональной проверки на четность и диагональную четность были использованы для реализации RAID уровня 6. "[25]

Спектакль

RAID 6 не снижает производительность операций чтения, но снижает производительность операций записи из-за накладных расходов, связанных с вычислениями четности. Производительность сильно зависит от того, как RAID 6 реализован в архитектуре хранилища производителя - в программном обеспечении, встроенном ПО или с помощью встроенного ПО и специализированных ASIC для интенсивных расчетов на четность. RAID 6 может читать с той же скоростью, что и RAID 5, с тем же количеством физических дисков.[26]

Когда используется диагональная или ортогональная двойная четность, для операций записи необходимо второе вычисление четности. Это вдвое увеличивает накладные расходы ЦП для записи RAID-6 по сравнению с уровнями RAID с одинарной четностью. Когда используется код Рида-Соломона, вычисление второй четности не требуется. Преимущество Reed Solomon заключается в том, что вся информация избыточности может содержаться в пределах заданной полосы.

Упрощенный пример паритета

Предположим, мы хотим распространить наши данные по куски. Наша цель - определить два значения паритета и , известный как синдромы, в результате чего получается система физические диски, устойчивые к потере любых двух из них. Чтобы сгенерировать более одного независимого синдрома, нам нужно будет выполнить наши вычисления четности для блоков данных размером Типичный выбор на практике - размер блока , то есть чередование данных по байтам. Мы будем обозначать представление блока данных по основанию 2 в качестве , где каждый либо 0, либо 1.

Если мы используем небольшое количество кусков , мы можем использовать простое вычисление четности, которое поможет мотивировать использование системы Рида-Соломона в общем случае. Для нашего первого паритета , мы вычисляем простые XOR данных по полосам, как в случае с RAID 5. Это написано

куда обозначает оператор XOR. Второе значение четности аналогично, но с битовым сдвигом каждого блока данных на разную величину. Письмо , мы определяем
В случае отказа одного диска данные могут быть пересчитаны из точно так же, как с RAID 5. Мы покажем, что можем также восстановиться после одновременного отказа двух дисков. Если мы потеряем кусок данных и , мы можем оправиться от а остальные данные, используя тот факт, что . Предположим, что в системе чанки, диск, содержащий чанк провалился. Мы можем вычислить

и восстановить потерянные данные отменив битовый сдвиг. Мы также можем восстановиться после отказа двух дисков с данными, вычислив XOR для и с остальными данными. Если в предыдущем примере chunk были потеряны, мы вычислим

На побитовом уровне это представляет собой систему уравнения в неизвестные, которые однозначно определяют потерянные данные.

Эта система больше не будет работать с большим количеством дисков. . Это потому, что если мы многократно применяем оператор сдвига раз на кусок длины , мы вернемся к тому месту, где начали. Если мы попытаемся применить описанный выше алгоритм к системе, содержащей диски данных, правая часть второго уравнения будет , что аналогично первой системе уравнений. Это даст только половину того количества уравнений, которое необходимо для поиска недостающих значений.

Общая система паритета

Можно поддерживать гораздо большее количество дисков, если более тщательно выбирать функцию четности. Перед нами стоит задача обеспечить, чтобы система уравнений над конечным полем имеет единственное решение, поэтому обратимся к теории полиномиальных уравнений. Рассмотрим Поле Галуа с . Это поле изоморфно полиномиальному полю для подходящего неприводимый многочлен степени над . Представим элементы данных как полиномы в поле Галуа. Позволять соответствуют полосам данных на жестких дисках, закодированных таким образом как элементы поля. Мы будем использовать для обозначения сложения в поле и конкатенации для обозначения умножения. Повторное использование намеренно: это потому, что сложение в конечном поле представляет для оператора XOR, поэтому вычисление суммы двух элементов эквивалентно вычислению XOR над полиномиальными коэффициентами.

А генератор поля - это такой элемент поля, что отличается для каждого неотрицательного . Это означает каждый элемент поля, кроме значения , можно записать как степень У конечного поля гарантированно будет хотя бы один генератор. Выберите один такой генератор , и определим и следующее:

Как и раньше, первая контрольная сумма - это просто XOR каждой полосы, хотя теперь она интерпретируется как полином. Эффект можно рассматривать как действие тщательно подобранного регистр сдвига с линейной обратной связью на блоке данных.[27] В отличие от битового сдвига в упрощенном примере, который можно было применить только раз до начала повторения кодирования, применяя оператор многократно гарантированно производить уникальные обратимые функции, которые позволяют поддерживать до фрагменты данных.

Если один блок данных потерян, ситуация аналогична предыдущей. В случае потери двух блоков данных мы можем вычислить формулы восстановления алгебраически. Предположим, что и потеряны ценности с , затем, используя другие значения , находим постоянные и :

Мы можем решить во втором уравнении и вставьте его в первое, чтобы найти , а потом .

В отличие от п, Расчет Q относительно интенсивно использует процессор, так как требует умножения полиномов в . Это можно смягчить с помощью аппаратной реализации или с помощью FPGA.

Сравнение

В следующей таблице представлен обзор некоторых рекомендаций для стандартных уровней RAID. В каждом случае:

  • Эффективность использования пространства массива выражается в виде числа дисков, п; это выражение обозначает дробное значение от нуля до единицы, представляющее долю суммы емкостей дисков, доступную для использования. Например, если три диска расположены в RAID 3, это дает эффективность использования пространства массива 1 − 1/п = 1 − 1/3 = 2/3 ≈ 67%; таким образом, если каждый диск в этом примере имеет емкость 250 ГБ, то общая емкость массива составляет 750 ГБ, но емкость, которую можно использовать для хранения данных, составляет всего 500 ГБ.
УровеньОписаниеМинимальное количество дисков[b]Эффективность использования пространстваОтказоустойчивостьЧитать производительностьПроизводительность записи
как фактор одного диска
RAID 0Блочный уровень чередование без паритет или же зеркальное отображение21Никтопп
RAID 1Зеркальное отображение без четности или чередования21/пп − 1 отказы дисковп[а][15]1[c][15]
RAID 2Чередование на уровне битов с Код Хэмминга для исправления ошибок31 − 1/п бревно2 (п + 1)Сбой одного диска[d]Зависит отЗависит от
RAID 3Чередование байтов с выделенной четностью31 − 1/пОтказ одного дискап − 1п − 1[e]
RAID 4Чередование на уровне блоков с выделенной четностью31 − 1/пОтказ одного дискап − 1п − 1[e][нужна цитата ]
RAID 5Чередование на уровне блоков с распределенной четностью31 − 1/пСбой одного дискап[e]один сектор: 1/4
полная полоса: п − 1[e][нужна цитата ]
RAID 6Чередование на уровне блоков с двойной распределенной четностью41 − 2/пСбой двух дисковп[e]один сектор: 1/6
полная полоса: п − 2[e][нужна цитата ]

Системные последствия

При измерении производительности ввода-вывода пяти файловых систем с пятью конфигурациями хранилища - одним SSD, RAID 0, RAID 1, RAID 10 и RAID 5 было показано, что F2FS на RAID 0 и RAID 5 с восемью твердотельными накопителями превосходит EXT4 в 5 и 50 раз соответственно. Измерения также показывают, что RAID-контроллер может быть значительным узким местом при построении RAID-системы с высокоскоростными твердотельными накопителями.[28]

Вложенный RAID

Комбинации двух или более стандартных уровней RAID. Они также известны как RAID 0 + 1 или RAID 01, RAID 0 + 3 или RAID 03, RAID 1 + 0 или RAID 10, RAID 5 + 0 или RAID 50, RAID 6 + 0 или RAID 60 и RAID 10 + 0. или RAID 100.

Нестандартные варианты

В дополнение к стандартным и вложенным уровням RAID есть альтернативы: нестандартные уровни RAID, и архитектуры дисков без RAID. Архитектуры дисков без RAID обозначаются аналогичными терминами и акронимами, в частности JBOD («просто куча дисков»), РАЗМЕР / БОЛЬШОЙ, и СЛУЖАНКА («массив бездействующих дисков»).

Примечания

  1. ^ а б Теоретический максимум, на практике всего лишь производительность одного диска
  2. ^ Предполагает невырожденное минимальное количество дисков
  3. ^ Если в массиве RAID 1 используются диски с разной скоростью, общая производительность записи равна скорости самого медленного диска.
  4. ^ RAID 2 может восстанавливаться после отказа одного диска или восстанавливать поврежденные данные или четность, если соответствующие данные и четность поврежденного бита в порядке.
  5. ^ а б c d е ж Предполагается, что оборудование способно выполнять связанные вычисления достаточно быстро

Рекомендации

  1. ^ «Общий формат данных на диске для рейдов (DDF)». SNIA.org. Промышленная ассоциация сетей хранения данных. Получено 2013-04-23.
  2. ^ «Восстановление данных RAID 0». DataRecovery.net. Получено 2015-04-30.
  3. ^ «Понимание RAID». CRU-Inc.com. Получено 2015-04-30.
  4. ^ «Как объединить несколько жестких дисков в один том для получения дешевого хранилища большой емкости». LifeHacker.com. 2013-02-26. Получено 2015-04-30.
  5. ^ а б Чен, Питер; Ли, Эдвард; Гибсон, Гарт; Кац, Рэнди; Паттерсон, Дэвид (1994). «RAID: высокопроизводительное и надежное вторичное хранилище». Опросы ACM Computing. 26 (2): 145–185. CiteSeerX  10.1.1.41.3889. Дои:10.1145/176979.176981. S2CID  207178693.
  6. ^ де Кутер, Себастьян (13 апреля 2015 г.). «Обзор игровых систем хранения в 2015 году: SSD, HDD или RAID 0, что лучше?». GamePlayInside.com. Получено 2015-09-22.
  7. ^ «Хищники Western Digital в RAID-0: два диска лучше, чем один?». AnandTech.com. АнандТех. 1 июля 2004 г.. Получено 2007-11-24.
  8. ^ «Hitachi Deskstar 7K1000: два терабайта RAID Redux». AnandTech.com. АнандТех. 23 апреля 2007 г.. Получено 2007-11-24.
  9. ^ «RAID 0: реклама или благословение?». Tweakers.net. Интернет-сервисы Persgroep. 7 августа 2004 г.. Получено 2008-07-23.
  10. ^ «Действительно ли RAID0 увеличивает производительность диска?». HardwareSecrets.com. 1 ноября 2006 г.
  11. ^ а б Ларабель, Майкл (2014-10-22). «Тестирование жесткого диска Btrfs RAID в Ubuntu Linux 14.10». Фороникс. Получено 2015-09-19.
  12. ^ а б Ларабель, Майкл (2014-10-29). «Btrfs на 4 × Intel SSD в RAID 0/1/5/6/10». Фороникс. Получено 2015-09-19.
  13. ^ "Руководство FreeBSD: 19.3. RAID 1 - Зеркалирование". FreeBSD.org. 2014-03-23. Получено 2014-06-11.
  14. ^ а б «Какой уровень RAID мне подходит? RAID 1 (зеркалирование)». Adaptec.com. Adaptec. Получено 2014-01-02.
  15. ^ а б c d «Выбор наилучшего уровня RAID: массивы RAID 1 (Руководство по установке Sun StorageTek SAS RAID HBA)». Docs.Oracle.com. Корпорация Oracle. 2010-12-23. Получено 2014-01-02.
  16. ^ «RAID 2». Техопедия. Техопедия. Получено 11 декабря 2019.
  17. ^ а б Вадала, Дерек (2003). Управление RAID в Linux. Серия O'Reilly (иллюстрированный ред.). О'Рейли. п. 6. ISBN  9781565927308.
  18. ^ а б c d Маркус, Эван; Стерн, Хэл (2003). Чертежи для обеспечения высокой доступности (2, иллюстрированное изд.). Джон Уайли и сыновья. п. 167. ISBN  9780471430261.
  19. ^ RAIDbook, 4th Издание, Консультативный совет RAID, июнь 1995 г., стр.101.
  20. ^ Мейерс, Майкл; Джерниган, Скотт (2003). Руководство Майка Мейерса A + по управлению и устранению неисправностей ПК (иллюстрированный ред.). McGraw-Hill Professional. п. 321. ISBN  9780072231465.
  21. ^ Натараджан, Рамеш (21 ноября 2011 г.). «RAID 2, RAID 3, RAID 4 и RAID 6, объяснение со схемами». TheGeekStuff.com. Получено 2015-01-02.
  22. ^ "Часто задаваемые вопросы о восстановлении данных RAID 5". VantageTech.com. Vantage Technologies. Получено 2014-07-16.
  23. ^ Корен, Израиль. "Основные организации RAID". ECS.UMass.edu. Массачусетский университет. Получено 2014-11-04.
  24. ^ «Руководство по установке HBA-адаптера Sun StorageTek SAS RAID, приложение F: Выбор наилучшего уровня RAID: массивы RAID 6». Docs.Oracle.com. 2010-12-23. Получено 2015-08-27.
  25. ^ "Словарь R". SNIA.org. Промышленная ассоциация сетей хранения данных. Получено 2007-11-24.
  26. ^ Вера, Рикард Э. (13 мая 2009 г.). «Сравнение типов программного RAID». Цитировать журнал требует | журнал = (помощь)
  27. ^ Анвин, Х. Питер (21 мая 2009 г.). «Математика RAID-6» (PDF). Kernel.org. Организация ядра Linux. Получено 4 ноября, 2009.
  28. ^ Пак, Чанхён; Ли, Сонджин; Вон, Youjip (2014). Анализ эмпирической производительности RAID на основе SSD. Информационные науки и системы. 2014. С. 395–405. Дои:10.1007/978-3-319-09465-6_41. ISBN  978-3-319-09464-9.

дальнейшее чтение

внешняя ссылка