Технологии виртуализации дисковых массивов#

RAID (англ. Redundant Array of Independent Disks — избыточный массив независимых (самостоятельных) дисков) — технология виртуализации данных для объединения нескольких физических дисковых устройств в логический модуль для повышения отказоустойчивости и (или) производительности.

RAID позволяет сформировать из независимых дисковых накопителей единый логический элемент с целью повышения производительности и отказоустойчивости каждого отдельно взятого компонента в массиве.

Основные характеристики технологии#

Области применения#

RAID – технология, которая дает возможность превратить несколько дисковых накопителей в один объемный и быстрый диск. Она применяется для организации хранилищ данных с функциями автоматического резервного копирования или при настройке системного диска с улучшенной отказоустойчивостью.

RAID-технологии используются в самых разных областях:

  • системное администрирование;

  • резервное копирование данных;

  • получение крупных дисков с высокой скоростью обработки информации;

  • работа с BigData;

  • клиент-серверные модели.

RAID массивы имеют преимущества и недостатки. Быстродействие и надежность могут перекрываться усложнением имеющейся системы и необходимостью приобретения дополнительного оборудования.

Преимущества и недостатки#

Преимущества:

  • Увеличение объема диска. Первоначальное предназначение рассматриваемой технологии – это получение диска большей емкости.

  • Повышение быстродействия системы. Достигается за счет параллельного подключения в массив нескольких физических дисков.

  • Надежность хранения документов и отказоустойчивость. Результат достигается за счет выделения на резервирование отдельного оборудования. Если один из дисков будет поврежден, RAID-массив не потеряет данные.

Недостатки:

К минусам RAID обычно относят стоимость обеспечения соответствующей системы и сложности ее организации. Также необходимо учитывать, что такие массивы могут применяться не всегда.

Условия для применения#

Чтобы воспользоваться RAID массивами, необходимо обеспечить их аппаратную и программную поддержку. В BIOS должны быть специальные настройки. Они имеют вид типа «SATA Configuration: RAID». Если соответствующий параметр отсутствует, базовую систему ввода-вывода придется «перепрошивать».

При отсутствии поддержки RAID программным методом, необходимо подключать дополнительное оборудование. Оно называется RAID-контроллер. На компьютер дополнительно устанавливается соответствующий драйвер. Последние версии Linux поддерживают автоматическую инициализацию драйверов для активации RAID-режима.

Основные определения#

  • Массив. Представляет собой объединение нескольких физических или виртуальных накопителей в один объемный диск. Полученный элемент поддерживает возможность целостной настройки, форматирования и управления.

  • Метод зеркалирования. Способ повышения надежности хранения информации за счет создания копий исходного диска на другом носителе, включенном в массив.

  • Дуплекс. Метод зеркалирования. Он поддерживает вдвое большее количество накопителей для создания копий.

  • Чередование. Это увеличение производительности диска за счет блочной разбивки данных в процессе их первичной записи.

  • Четность. Так называется технология, включающая в себя чередование и зеркалирование.

Типы RAID:#

  • Программный (software). Является самым бюджетным и наиболее распространенным вариантом. Массивы здесь будут создаваться в самой операционной системе за счет применения специальных утилит. Обработка данных осуществляется центральным процессором. Ключевым недостатком технологии служит зависимость от предустановленной системы. Это приводит к сильному снижению быстродействия и безопасности хранения документов.

  • Аппаратный (hardware). Базируется на основе отдельного устройства – RAID-контроллера. Он поддерживает собственный микропроцессор и кэш-память. Нагрузка на микропроцессор минимальна. Данный тип является самым затратным в плане реализации. Он характеризуется высокой скоростью чтения и записи, а также хорошей степенью защиты.

  • Интегрированный аппаратный (fake RAID или RAID-on-Chip). Представляет собой сочетание программного и аппаратного типов. Реализуется дополнительными микрочипами, которые вставляются в материнскую плату и работают вместе с центральным процессором оборудования. Такая технология быстрее программной, но она уступает в плане надежности хранения информации на диске.

Классификация RAID по уровням#

Основные отличия между конфигурациями или уровнями RAID заключаются в методах формирования и размещения данных, а также в алгоритмах распределения информации на носителях. Базовые типы RAID-массивов — RAID 0 и RAID 1. Остальные уровни считаются их производными, сочетающими в себе достоинства той или иной базовой модели.

RAID 0#

asda

Технология виртуализации RAID 0 называется striping («чередование»). Для ее реализации применяется от 2 до 4 накопителей, которые совместно выполняют процедуру «чтения/записи».

При записи информация разделяется на блоки, которые одновременно сохраняются на накопители. П ервый блок — на один, второй — на другой жесткий диск и так далее. Производительность массива возрастает прямо пропорционально количеству накопителей в системе. То есть, 4 диска будут работать в 2 раза быстрее, чем два.

Однако, такая конфигурация RAID-массива чревата потерей данных, что уменьшает безопасность хранения информации. Это объясняется структурой каждого файла. Последний состоит из определенной последовательности блоков (байт), поскольку каждый из них записывается на разные диски и происходит «нарушение» его целостности. Если один накопитель выходит из строя, то блок «теряется». При этом получается «битый» файл, который практически невозможно восстановить.

Достоинства

  • Дисковый RAID-массив уровня 0 обеспечивает ощутимый прирост скорости, который прямо пропорционально зависит от кратности количества накопителей.

  • Использование всего дискового объема, т. е. при установке четырех дисков по 2 ТБ общий объем RAID-массива будет равен 2*4=8 ТБ.

Недостатки

  • Нарушение отказоустойчивости. Иногда возможен отказ в операциях чтения или записи.

  • При выходе из строя одного накопителя информация полностью теряется.

Использование

Применяется в приложениях для скоростного обмена информацией, в хранилищах временных файлов. Также RAID 0 нужен для систем, использующих некритичные по важности массивы данных.

RAID 1#

asda

Технология RAID 1 называется мirroring («зеркалирование»). Она подразумевает использование от 2 до 4 накопителей. Однако при этом теряется половина объема дисков, поскольку это пространство используется резервированием данных.

Если RAID-система состоит из 2 жестких дисков, то при выходе одного из них информация не потеряется полностью, поскольку один накопитель является точной копией другого.

Достоинства

  • Надежность хранения информации.

  • Простота реализации.

  • Высокая производительность при выполнении операции чтения.

  • Минимальная комплектация составляет всего 2 жестких диска.

Недостатки

  • Низкая производительность.

  • Емкость RAID-массива делится на 2, что обусловлено резервированием информации.

  • Замена неисправного накопителя требует полное отключение системы.

Использование

Уровень RAID 1 необходимо применять для увеличения надежности хранения информации на серверах.

RAID 5#

asda

Технология RAID 5 («чередование с чётностью») считается наиболее распространенной и безопасной. Для подобной конфигурации необходимо минимум 3 диска, а максимальное допустимое количество — 16.

При записи информации происходит разделение на блоки данных, но с одним условием — на один из дисков, называемый блок «чётность данных» (Parity Drive, PD), происходит запись информации для восстановления. Этот подход позволяет спасти данные при повреждении одного из накопителей.

RAID 5 может реализовываться программным методом при помощи специальных утилит, но рекомендуется аппаратный способ.

Достоинства

  • Увеличена скорость чтения за счет одновременной обработки данных с нескольких независимых потоков от дисков массива.

  • Информация не «потеряется» при повреждении одного накопителя.

  • При замене неисправного диска происходит автоматическое восстановление информации.

Недостатки

  • Иногда происходят отказы дисков.

  • Если объем поврежденного накопителя 4 ТБ и более, при замене его на идентичный диск, восстановление может занять более одного дня.

  • Если диск «чётности» вышел из строя при выполнении процедуры восстановления, то информация будет окончательно утеряна.

  • Минимальное количество накопителей — 3.

Использование

  • файловые сервера;

  • сервера общего хранения;

  • сервера резервного копирования;

  • работа с потоковой информацией;

  • разнообразные среды, требующие хорошей производительности.

Чем больше накопителей в массиве, тем больше окажется объем системы. Скорость чтения у RAID 5 высокая. Нагрузка на все диски raid массива распределяется равномерно.

Если один диск выходит из строя, надежность системы значительно сокращается. Массив переходит в критическое состояние. Его восстановление – длительный процесс, вызывающий снижение производительности и увеличивающий нагрузку на накопители. Связано это с продолжительным и интенсивным чтением.

Rebuild увеличивает шансы выхода из строя еще одного или нескольких дисков в массиве. Это влечет за собой потерю данных. При восстановлении информации могут возникать не выявленные ранее ошибки.

Работая с RAID 5, необходимо проводить анализ состояния накопителей (S.M.A.R.T.), а также пользоваться технологиями Hot Spare (горячий резерв). В массив будет автоматически подхватываться заранее зарезервированный диск вместо вышедшего из строя.

Комбинированные уровни#

К комбинированным уровням относят сочетания «базовых» массивов. Они являются более совершенными.

RAID 01 и RAID10#

Эти массивы сочетают в себе уровни 0 и 1. RAID 01 – зеркалирование двух виртуализаций чередования. Данный уровень называется «зеркалом страйпов».

asda

RAID 10 – чередование двух зеркальных «хранилищ».

asda

Полезный объем массива – 50 % от суммарного объема всех используемых дисков.

RAID 01 и RAID10 обладают одинаковой производительностью. У 10 райда надежность выше, чем у 01. Результат достигается за счет того, что в RAID10 возможен отказ по одному диску в каждом «зеркале» без потери исходных данных. Из-за этого RAID 01 не используется.

RAID 10 включает в себя не менее 4-х дисков. Этот уровень заимствовал у 0 уровня скорость и у 1 – отказоустойчивость. Организация массива окажется дорогостоящей. RAID массив 10 идеально подходит для хранения критически важных данных в приложениях с активным вводом-выводом.

Перед выбором соответствующей конфигурации RAID-массива, специалисты рекомендуют сохранить информацию на отдельный носитель. При создании или удалении RAID-системы данные на дисках уничтожаются.

Программное обеспечение#

Mdadm#

Для операционных систем на основе Linux рекомендуется использовать штатную утилиту «mdadm», которую необходимо предварительно установить.

Основные возможности

  • Создание и сброс RAID-массивов.

  • Монтирование файловых систем.

  • Сохранение топологии массива.

  • Удаление отдельных элементов из RAID.