Что такое RAID и его особенности

Жесткие диски (HDD) в составе единой вычислительной системы отличаются невысокими характеристиками производительности и отказоустойчивости по сравнению с другими компонентами и поэтому являются узким местом комплекса. Для увеличения скорости ввода-вывода цифровых данных и надежности при длительном хранении было предложено решение, получившее название «рейд» (RAID). Рейд — это совокупность двух и более HDD, позволяющая достичь требуемого компромисса между пропускной способностью ввода-вывода и надежностью хранения информации.

Рейд
RAID — это технология, которая позволяет объединить несколько устройств.

Что такое рейд и его особенности

Рейд представляет собой логический комплекс или, по другой терминологии, массив, состоящий из нескольких HDD, иногда называемых винчестерами или «винтами». Минимальное количество дисков в рейд-массиве должно быть не менее двух.

Логический массив отличается особой процедурой записи и считывания двоичных данных. В зависимости от принципа работы, к полезной информации могут добавляться служебные данные. После сбоев или возникновения других неисправностей они позволят восстановить полезную информацию без потерь.

История и развитие

Английская аббревиатура RAID по-русски расшифровывается как «избыточный набор отдельных (независимых) дисков»: Redundant Array of Independent Disks. Однако в 1987 г., когда появился термин RAID, его создатели вместо Independent использовали слово Inexpensive («недорогой»), в противовес применяющимся в то время дорогим винчестерам большого объема.

История рейда
Набор RAID был разработан в целях повышения надежности хранения данных.

Однако практические архитектуры надежной дисковой системы с зеркалированием эксплуатировались задолго до возникновения этого термина, еще в 1970-х гг. А в США в 1977 г. была подана заявка на изобретение, впоследствии получившее название RAID-4.

По мере практического применения наборов HDD, в них, наряду с недорогими гаджетами для персональных ЭВМ, стали входить и накопители с высокой стоимостью.

И те и другие представляли собой независимые физические диски, объединенные в логическую структуру, поэтому слово Inexpensive заменили термином Independent.

Основные типы RAID-массивов

Типы рейд-систем различают по критерию их взаимодействия с ОС и центральным процессором, используемыми в компьютере:

  1. Полностью аппаратные.
  2. Программно-аппаратные.

После запуска машины ОС взаимодействует с аппаратным комплектом как с единым HDD. Массив формируются средствами специализированного контроллера с собственным процессором и кэшем, что позволяет достичь наибольшей производительности. Такие решения затратны, поэтому используются главным образом в корпоративных и государственных серверах центров обработки данных.

Типы RAID-массивов
Типы RAID массивов выбираются в зависимости от задачи, которые выполняют сервера.

Программно-аппаратные системы реализуются на материнских платах с поддержкой RAID и работают в паре с центральным процессором, используя также ресурсы оперативной памяти ПК.

Операционная система после запуска видит несколько физических HDD, которые затем программно объединяет в один логический диск посредством соответствующих утилит и драйверов.

Уровни RAID

Базовые уровни накопителей, объединенных в рейд-массив, нумеруются цифрами от 0 до 6:

  1. RAID-0 — это нулевой вариант без избыточности, который восстановление данных не обеспечивает. Он реализуется в тех случаях, когда нужно увеличить скорость ввода-вывода данных. Массив из N-дисков работает со скоростью в N раз больше, чем у отдельного диска.
  2. Рейд-1 содержит «зеркало», т.е. накопитель, дублирующий все пользовательские данные с рабочего диска. Служебная информация не задействована. Комплект из пары дисков обеспечивает однократное дублирование. Двукратное дублирование достигается применением трех накопителей, где зеркальными являются 2 винчестера и т.д.
  3. Второй уровень задействует служебную информацию для коррекции ошибок — код Хэмминга. Система рассчитана минимум на 7 дисков — 4 для полезной информации и 3 для служебных данных. По причине высокой избыточности RAID-2 на практике не применяется.
  4. Массив уровня 3 основан на технологии контроля четности блоков данных и обеспечивает высокую скорость ввода-вывода. Данные разбиваются на байты. Для реализации RAID-3 необходимо минимум 3 диска: 2 для пользовательских данных и 1 для служебных. Система рассчитана на однозадачную работу с большими файлами. Нагрузка на служебный накопитель велика, из-за чего по критерию надежности он становится узким местом комплекса.
  5. Тип 4 аналогичен предыдущему с тем отличием, что информация разбивается не на байты, а на блоки данных, состоящие из нескольких байт.
  6. В системах уровня 5 данные разбиваются на блоки с контролем четности, аналогично массивам 3 и 4. Однако поля четности пишутся на те же диски, что и пользовательские данные. Таким образом, выделенный диск для служебной информации отсутствует и это позволяет реализовать режим параллельной записи. RAID-5 должен содержать минимум 3 винчестера. Оптимальное количество — 4.
  7. Массив уровня 6 является усовершенствованным вариантом предыдущего комплекса. Добавлены дополнительные поля для второго автономного контроля четности. В результате пользовательская информация защищена даже при выходе из строя 2 дисков.
Уровни RAID
Уровень RAID характеризует отношения между компонентами устройства хранения данных.

Разработаны дополнительные виды рейд-массивов, являющиеся комбинацией или усовершенствованием описанных вариантов. Так, объединением системы нулевого и первого уровня получают RAID-10 (1+0). Назначение такого набора состоит в сочетании высокой скорости обмена информацией и отказоустойчивости.

Комбинация 50 имеет большую пропускную способность и скорость восстановления, но требует наличия минимум 6 винтов, а в оптимальном варианте — 8. Массив 51 зеркалирует 2 комплекса рейд-5. RAID-60 сочетает в себе зеркалирование с двойной проверкой четности и рассчитан на 8 накопителей и более. Он устойчив к выходу из строя до 2 элементов дискового комплекса и имеет высокую скорость чтения.

Если в систему внесены усовершенствования, то к названию добавляется буква E (Enhanced): 1E, 5E, 5EE, 6E. Так, дисковые комплексы 1E отличаются высоким быстродействием и зеркалированием информации при работе с нечетным числом винтов, начиная с трех.

Принцип работы RAID-5EE основан на использовании винта, выделенного под перестроение в аварийной ситуации. В исправной системе RAID-5 он работает вхолостую как горячий резерв, а в режиме 5EE включается в работу наравне с другими винтами.

При выходе какого-либо HDD из строя, информация распределяется по оставшимся трем, и они начинают функционировать как штатный комплекс уровня 5 с избыточностью, допускающей выход из строя еще одного элемента. После замены вышедшего из строя винта массив перестраивается и возвращается в режим 5EE.

Сравнение основных систем приведено в таблице 1, где V и N — объем отдельного накопителя и их количество, соответственно.

Параметр / Уровень RAID

0

1

5

6

Минимальное количество дисков в комплекте, N

2

2

3

4

Допустимое количество аварийных дисков

0

1

1

2

Скорость чтения в исправном состоянии

Высокая

Высокая

Высокая

Высокая

Скорость записи в исправном состоянии

Высокая

Средняя

Малая

Малая

Скорость чтения при аварии

Не применимо

Средняя

Малая

Малая

Скорость записи при аварии

Не применимо

Высокая

Малая

Малая

Полезный объем массива

N*V

(N*V)/2

(N-1)*V

(N-2)*V

Варианты реализации RAID-систем

Доступный по цене вариант практической реализации — программно-аппаратный, т.е. основанный на использовании ОС и компьютера с материнской платой с несколькими интерфейсами SATA и поддержкой работы с жесткими накопителями в рейд-режиме. Числом разъемов для подключения винтов и возможностями ОС определится допустимая конфигурация массива, например, рейд-0, 1 или 5. Некоторые версии ОС поддерживают только рейд-0 или 1.

Часть емкости дисков будет занята под запись служебной информации, идентифицируемой приставкой «супер», чтобы отличать стандартные двоичные блоки от вспомогательных суперблоков.

Автономные рейд-контроллеры реализуются как отдельный модуль или плата, вставляемая в разъем расширения ПК, например PCI-E.

Контроллеры содержат:

  • процессор;
  • BIOS,
  • кэш-память;
  • конденсаторную или литиевую батарею, чтобы обеспечить энергонезависимость кэша;
  • внутренние и внешние порты.

Дорогие модели дополнительно обеспечивают горячее резервирование и замену HDD в работающей схеме, а также контролируют стабильность работы массива.

Почему RAID-5 «mustdie»

За период существования рейд-комплексов емкость HDD увеличилась на величины гораздо большие, чем производительность. Поэтому в системах уровня 5 на восстановление требуется много времени, поскольку процедура чтения и анализа данных выполняется для всех накопителей. При использовании терабайтных гаджетов регенерация занимает не менее суток. В это время цифровая информация находится без защиты.

Проблему усугубляет отсутствие механизма проверки данных, обращение к которым происходит крайне редко. На поверхностях пластин накопителей, занятых такими данными, могут появиться неопознанные своевременно сбойные сектора. Они будут найдены при перестроении системы после замены HDD, что приведет к полной потере информации.

Эти соображения свидетельствуют в пользу отказа от RAID-5 и перехода на системы с другими вариантами избыточности и принципом работы, например 1+0 или 6. В решении задачи поможет применение быстрых и отказоустойчивых винтов промышленной категории Enterprise с интерфейсами SATA-3, SCSI или SAS.