Существует три основных способа организации систем хранения данных (СХД) в корпоративных ИТ-системах и в системах облачных провайдеров:

Блочные системы хранения данных

Блочные системы называются так потому, что хранимые в них данные разбиваются на блоки одинакового размера. Блок данных – это не файл, не законченный объект, а просто некие данные в куске фиксированного размера (по-английски – chunk). Файл данных может быть размещен в конечном числе блоков, и если последний из этих блоков остается незаполненным, то он все равно будет иметь тот же фиксированный размер, что и заполненные блоки. Сервер получает доступ к этим блокам через сеть хранения данных SAN (storage attached network).

Блочная СХД может быть использована любой операционной системой как дисковый том этой системы. Каждому серверу может быть предоставлен практически неограниченный размер диска. Пользователь видит этот диск в интерфейсе операционной системы сервера. ОС сервера может подключаться к блокам данных через высокоскоростные интерфейсы FC (Fiber Channel) или iSCSI. Поэтому основное достоинство блочных систем – высокое быстродействие.

Операционная система сервера может быть как физической (хост), так и виртуальной (виртуальная машина). Следует отметить, что физическим серверам нужны дополнительные контроллеры для того, чтобы получать доступ к исходным блокам.

Размер блоков определяется производителем оборудования. Однако архитектор, разрабатывающий дизайн корпоративной ИТ-системы, может определять размер блока данных в зависимости от требований конфигурации и сценария применения. Размер блока может зависеть и от типа физических дисков в системах хранения (жесткие диски HDD или флеш-накопители SSD), а также от типа самих данных клиентов. Правильный выбор размера диска во многих случаях помогает оптимизировать параметры работы корпоративной ИТ-системы в целом.

Операционная система сервера присваивает каждому блоку данных простой идентификатор расположения (location ID), по которому его можно быстро найти в SAN, именно поэтому блочная СХД имеет высокое быстродействие.

Заметим, что, например, в объектных системах хранения в качестве такого идентификатора используются метаданные (тип файла, название файла, дата и пр). Понятно, что при таком механизме время поиска объекта в системе увеличивается, хотя объектные системы хранения имеют много преимуществ для других ситуаций.

Когда нужны блочные системы

Обычно блочные системы хранения выбирают, когда при проектировании ИТ-системы критичными являются такие параметры, как скорость ввода-вывода данных IOPS (input output operations per second), а также задержка (latency) доступа к данным через SAN. Например, это могут быть серверы баз данных или бизнес-критичных приложений, требующих высокого быстродействия и высокой надежности.

В таких базах данных, как Oracle или SAP Hana, используются именно блочные системы. Виртуальные машины VMware также по умолчанию используют блочное хранение, поскольку при этом можно построить быстродействующую и многофункциональную виртуальную инфраструктуру. Блочное хранение может быть также использовано практически во всех архитектурах ЦОД, будь то единичный сервер или же высоконадежные кластерные серверные решения.

Блочные системы хранения в настоящий момент являются безусловным лидером по доле в корпоративном хранении данных как в малых предприятиях, так и в ИТ-системах крупных корпораций.

Наиболее употребительные области применения блочных СХД:

Блочное хранение в облаке

Блочное хранение данных – очень популярная услуга облачных провайдеров. Она дает возможность использовать такое полезное качество, как эластичность. То есть пользователю нет необходимости закупать оборудование для СХД с «запасом на будущее». Он может заказать у провайдера емкость хранения в соответствии с текущими потребностями и потом быстро «дозаказать» ее при необходимости. В большинстве случаев этот процесс может занять несколько минут. При этом данные будут хорошо защищены высокой доступностью услуги облачного хранения и технологией репликации в облаке. Кроме того, шифрование, которое обеспечивает облачный провайдер, не позволит другим серверам, использующим ту же облачную СХД, получить доступ к чужим данных. Таким образом, когда нужно быстро и недорого расширить имеющееся блочное хранилище, использование услуги блочной СХД в облаке может быть оптимальным вариантом.

Если говорить не о публичном, а о частном облаке ИТ-системы или дата-центра (центров) крупной организации, то и здесь можно использовать сходные механизмы блочного хранения. При этом вместо разных заказчиков, данные которых нужно разделять в облаке, будут выступать подразделения (отделы, сервисы, филиалы) этой организации. И здесь использование блочного хранения чаще всего будет предпочтительным вариантом, поскольку эта технология обеспечивает высокую скорость бизнес-процессов организации, а также достаточную гибкость перераспределения ресурсов в масштабах организации.

Достоинства и недостатки блочной СХД

В современных ЦОДах блочное хранение очень распространено вследствие следующих достоинств:

  1. Производительность: быстродействие блочной CХД. Для приложений, требующих высоких скоростей ввода-вывода (IOPS), таких как серверы баз данных, блочная СХД является оптимальным выбором. Производительность вкупе с низкой задержкой доступа является главным преимуществом блочной СХД.
  2. Гибкость: тома с блоками данных можно быстро переносить, расширять и добавлять по мере роста организации, без какого-либо влияния на быстродействие. Кроме того, блочную СХД можно легко переносить с одного сервера на другой путем простого редактирования маршрута назначения.
  3. Легкость модификации файлов: в блочной СХД при изменении файла необходимо изменять только те блоки, которые затронуты этими изменениями. В файловой и объектной СХД для этого необходимо перезаписывать весь файл или объект.
  4. Загружаемость операционной системы: ОС может загружаться непосредственно из блочной СХД через SAN. Для этого нужно, чтобы BIOS сервера (физического или виртуального) могла работать с SAN.
  5. Работа с разрешениями: легкость управления доступом к данным.

Недостатки у блочной СХД тоже есть. К ним можно отнести следующее:

  1. Привязка к серверу: блочная СХД жестко привязана к одному серверу в каждый момент времени и не может в этот момент разрешать доступ от другого сервера в ИТ-системе. Конечно, есть некоторые программные решения, которые могут устранить данный недостаток, но это требует повышения нагрузки (overhead) на файловую систему.
  2. Ограниченность метаданных: объем метаданных (определяющих, что именно хранится) гораздо меньше, чем в файловой или объектной СХД. Это может повлиять на производительность работы некоторых приложений, критичных к использованию метаданных.
  3. Стоимость: она в блочных СХД достаточно высока. Хотя для заказчиков сервисов облачная услуга блочного хранения весьма доступна по стоимости, однако для облачных провайдеров и для корпоративных ИТ-систем это очень затратно, поскольку системы SAN довольно дороги и часто требуют наличия высококвалифицированного персонала для их обслуживания. Кроме того, со стороны заказчиков облачных услуг всегда необходима оплата объема блочного СХД, даже если используется не весь объем.

Итоги сравнения блочных СХД с файловыми и объектными можно свести в следующую таблицу:


Блочные

Файловые

Объектные

Интерфейс

Операционная система

Пользователь

Программа через API

Относительная стоимость

Высокая

Высокая

Невысокая

Быстродействие

Очень высокое

Высокое

Среднее

Ареал применения

Часть ИТ-системы, охват FC/iSCSI

Вся ИТ-система, LAN

Интернет

Сценарии

ОС, базы данных

Общий пользовательский контент, веб-контент

Медиафайлы, сети доставки контента

Масштабируемость

Ограничена ареалом применения

Довольно высокая

Практически неограниченная

***

Все ведущие мировые производители предлагают своим заказчикам широкие линейки блочных систем хранения, которые очень условно можно разделить на 4 группы:


HPE

Dell Technologies

Fujitsu

IBM

Начальные

HPE MSA 1050

Dell EMC ME4

Fujitsu Eternus dx60

IBM Storwize v5010E

Для малого бизнеса

HPE MSA 2050 / 2052

HPE Nimble

Dell EMC ME4

Dell EMC Unity XT 380

Fujitsu Eternus dx100

IBM Storwize v5030E

Средние

HPE 3Par

Dell EMC SC

Dell EMC Unity XT 480

Fujitsu Eternus dx200

IBM Storwize v5100

Высокопроизводительные

HPE Primera

Dell EMC PowerMax

Dell EMC Unity XT 680 / 880

Fujitsu Eternus dx600

IBM Storwize v7000

В следующих публикациях мы подробнее остановимся на этих моделях и попробуем выделить интересные особенности каждой.

Алексей Шалагинов, ИТ-эксперт ITELON