Что такое RAID и его особенности
Жесткие диски (HDD) в составе единой вычислительной системы отличаются невысокими характеристиками производительности и отказоустойчивости по сравнению с другими компонентами и поэтому являются узким местом комплекса. Для увеличения скорости ввода-вывода цифровых данных и надежности при длительном хранении было предложено решение, получившее название “рейд” (RAID). Рейд – это совокупность двух и более HDD, позволяющая достичь требуемого компромисса между пропускной способностью ввода-вывода и надежностью хранения информации.

Что такое рейд и его особенности
Рейд представляет собой логический комплекс или, по другой терминологии, массив, состоящий из нескольких HDD, иногда называемых винчестерами или “винтами”. Минимальное количество дисков в рейд-массиве должно быть не менее двух.
История и развитие
Английская аббревиатура RAID по-русски расшифровывается как “избыточный набор отдельных (независимых) дисков”: Redundant Array of Independent Disks. Однако в 1987 г., когда появился термин RAID, его создатели вместо Independent использовали слово Inexpensive (“недорогой”), в противовес применяющимся в то время дорогим винчестерам большого объема.

Однако практические архитектуры надежной дисковой системы с зеркалированием эксплуатировались задолго до возникновения этого термина, еще в 1970-х гг. А в США в 1977 г. была подана заявка на изобретение, впоследствии получившее название RAID-4.
По мере практического применения наборов HDD, в них, наряду с недорогими гаджетами для персональных ЭВМ, стали входить и накопители с высокой стоимостью.
И те и другие представляли собой независимые физические диски, объединенные в логическую структуру, поэтому слово Inexpensive заменили термином Independent.
Основные типы RAID-массивов
Типы рейд-систем различают по критерию их взаимодействия с ОС и центральным процессором, используемыми в компьютере:
- Полностью аппаратные.
- Программно-аппаратные.
После запуска машины ОС взаимодействует с аппаратным комплектом как с единым HDD. Массив формируются средствами специализированного контроллера с собственным процессором и кэшем, что позволяет достичь наибольшей производительности. Такие решения затратны, поэтому используются главным образом в корпоративных и государственных серверах центров обработки данных.

Программно-аппаратные системы реализуются на материнских платах с поддержкой RAID и работают в паре с центральным процессором, используя также ресурсы оперативной памяти ПК.
Операционная система после запуска видит несколько физических HDD, которые затем программно объединяет в один логический диск посредством соответствующих утилит и драйверов.
Уровни RAID
Базовые уровни накопителей, объединенных в рейд-массив, нумеруются цифрами от 0 до 6:
- RAID-0 – это нулевой вариант без избыточности, который восстановление данных не обеспечивает. Он реализуется в тех случаях, когда нужно увеличить скорость ввода-вывода данных. Массив из N-дисков работает со скоростью в N раз больше, чем у отдельного диска.
- Рейд-1 содержит “зеркало”, т.е. накопитель, дублирующий все пользовательские данные с рабочего диска. Служебная информация не задействована. Комплект из пары дисков обеспечивает однократное дублирование. Двукратное дублирование достигается применением трех накопителей, где зеркальными являются 2 винчестера и т.д.
- Второй уровень задействует служебную информацию для коррекции ошибок – код Хэмминга. Система рассчитана минимум на 7 дисков – 4 для полезной информации и 3 для служебных данных. По причине высокой избыточности RAID-2 на практике не применяется.
- Массив уровня 3 основан на технологии контроля четности блоков данных и обеспечивает высокую скорость ввода-вывода. Данные разбиваются на байты. Для реализации RAID-3 необходимо минимум 3 диска: 2 для пользовательских данных и 1 для служебных. Система рассчитана на однозадачную работу с большими файлами. Нагрузка на служебный накопитель велика, из-за чего по критерию надежности он становится узким местом комплекса.
- Тип 4 аналогичен предыдущему с тем отличием, что информация разбивается не на байты, а на блоки данных, состоящие из нескольких байт.
- В системах уровня 5 данные разбиваются на блоки с контролем четности, аналогично массивам 3 и 4. Однако поля четности пишутся на те же диски, что и пользовательские данные. Таким образом, выделенный диск для служебной информации отсутствует и это позволяет реализовать режим параллельной записи. RAID-5 должен содержать минимум 3 винчестера. Оптимальное количество – 4.
- Массив уровня 6 является усовершенствованным вариантом предыдущего комплекса. Добавлены дополнительные поля для второго автономного контроля четности. В результате пользовательская информация защищена даже при выходе из строя 2 дисков.
.jpg)
Разработаны дополнительные виды рейд-массивов, являющиеся комбинацией или усовершенствованием описанных вариантов. Так, объединением системы нулевого и первого уровня получают RAID-10 (1+0). Назначение такого набора состоит в сочетании высокой скорости обмена информацией и отказоустойчивости.
Комбинация 50 имеет большую пропускную способность и скорость восстановления, но требует наличия минимум 6 винтов, а в оптимальном варианте – 8. Массив 51 зеркалирует 2 комплекса рейд-5. RAID-60 сочетает в себе зеркалирование с двойной проверкой четности и рассчитан на 8 накопителей и более. Он устойчив к выходу из строя до 2 элементов дискового комплекса и имеет высокую скорость чтения.
Если в систему внесены усовершенствования, то к названию добавляется буква E (Enhanced): 1E, 5E, 5EE, 6E. Так, дисковые комплексы 1E отличаются высоким быстродействием и зеркалированием информации при работе с нечетным числом винтов, начиная с трех.
Принцип работы RAID-5EE основан на использовании винта, выделенного под перестроение в аварийной ситуации. В исправной системе RAID-5 он работает вхолостую как горячий резерв, а в режиме 5EE включается в работу наравне с другими винтами.
При выходе какого-либо HDD из строя, информация распределяется по оставшимся трем, и они начинают функционировать как штатный комплекс уровня 5 с избыточностью, допускающей выход из строя еще одного элемента. После замены вышедшего из строя винта массив перестраивается и возвращается в режим 5EE.
Сравнение основных систем приведено в таблице 1, где V и N – объем отдельного накопителя и их количество, соответственно.
Параметр / Уровень RAID | 0 | 1 | 5 | 6 |
Минимальное количество дисков в комплекте, N | 2 | 2 | 3 | 4 |
Допустимое количество аварийных дисков | 0 | 1 | 1 | 2 |
Скорость чтения в исправном состоянии | Высокая | Высокая | Высокая | Высокая |
Скорость записи в исправном состоянии | Высокая | Средняя | Малая | Малая |
Скорость чтения при аварии | Не применимо | Средняя | Малая | Малая |
Скорость записи при аварии | Не применимо | Высокая | Малая | Малая |
Полезный объем массива | N*V | (N*V)/2 | (N-1)*V | (N-2)*V |
Варианты реализации RAID-систем
Доступный по цене вариант практической реализации – программно-аппаратный, т.е. основанный на использовании ОС и компьютера с материнской платой с несколькими интерфейсами SATA и поддержкой работы с жесткими накопителями в рейд-режиме. Числом разъемов для подключения винтов и возможностями ОС определится допустимая конфигурация массива, например, рейд-0, 1 или 5. Некоторые версии ОС поддерживают только рейд-0 или 1.
Часть емкости дисков будет занята под запись служебной информации, идентифицируемой приставкой “супер”, чтобы отличать стандартные двоичные блоки от вспомогательных суперблоков.
Автономные рейд-контроллеры реализуются как отдельный модуль или плата, вставляемая в разъем расширения ПК, например PCI-E.
Контроллеры содержат:
- процессор;
- BIOS,
- кэш-память;
- конденсаторную или литиевую батарею, чтобы обеспечить энергонезависимость кэша;
- внутренние и внешние порты.
Дорогие модели дополнительно обеспечивают горячее резервирование и замену HDD в работающей схеме, а также контролируют стабильность работы массива.
Почему RAID-5 «mustdie»
За период существования рейд-комплексов емкость HDD увеличилась на величины гораздо большие, чем производительность. Поэтому в системах уровня 5 на восстановление требуется много времени, поскольку процедура чтения и анализа данных выполняется для всех накопителей. При использовании терабайтных гаджетов регенерация занимает не менее суток. В это время цифровая информация находится без защиты.
Проблему усугубляет отсутствие механизма проверки данных, обращение к которым происходит крайне редко. На поверхностях пластин накопителей, занятых такими данными, могут появиться неопознанные своевременно сбойные сектора. Они будут найдены при перестроении системы после замены HDD, что приведет к полной потере информации.
Эти соображения свидетельствуют в пользу отказа от RAID-5 и перехода на системы с другими вариантами избыточности и принципом работы, например 1+0 или 6. В решении задачи поможет применение быстрых и отказоустойчивых винтов промышленной категории Enterprise с интерфейсами SATA-3, SCSI или SAS.