Одна из самых больших болей современного бизнеса звучит так: где хранить данные? Объемы быстро растут, потому покупка СХД, ориентируясь на текущие потребности или только на стоимость, может стать не лучшим решением. Рассказываем, на что стоит опираться при проектировании системы хранения данных, чтобы не жалеть о сделанном выборе через пару месяцев.

Большинство организаций уже столкнулись с необходимостью покупки СХД, так как возможности хранения данных на сервере имеют предел – рано или поздно его емкость исчерпается, а возможность устанавливать дополнительные накопители ограничена. Но дисковое хранилище выигрывает у штатных инструментов хранения не только в этом: оно более надежное, отказоустойчивое и у него выше скорость доступа к данным.

Устройство СХД

Система хранения данных представляет собой программно-аппаратный комплекс, в который кроме массива накопителей входит контроллер, кеш-память, блок питания и корпус, а для управления работой используется специальное ПО.

Накопители в системе хранения данных

Накопители в системе хранения данных

В зависимости от типа способа хранения выделяют три категории СХД: блочные, файловые и объектные.

Файловое хранилище

Данные хранятся в виде файлов, рассортированных по папкам. Для идентификации местонахождения каждого файла используются метаданные. Файловое хранилище легко масштабируется и совместимо со многими приложениями без каких-либо промежуточных программных решений.

Идеальные нагрузки: большие репозитории контента, среды разработки, аналитика больших данных, хранилища мультимедийных файлов.

Блочное хранилище

Данные разбиты на отдельные блоки, которые хранятся независимо друг от друга. У каждого блока есть уникальный идентификатор для упорядочивания данных и быстрого поиска нужных блоков разными путями. Это позволяет блочным хранилищам обогнать файловые по скорости доступа к данным.

Идеальные нагрузки: высокопроизводительные вычисления, системы управления базами данных, среды виртуализации.

Объектное хранилище

Данные хранятся в виде объектов, у каждого объекта есть свой идентификатор и набор связанных метаданных.

Идеальные нагрузки: хранение больших объемов неструктурированных данных в системах с использованием искусственного интеллекта, машинного обучения, разработки облачных приложений.

Не существует идеального варианта хранилища для каждого конкретного типа нагрузки — есть те, которые справляются с задачами лучше или хуже. Поэтому производители СХД в своих системах комбинируют разные подходы к хранению. Чаще всего встречаются системы, где используются одновременно файловые и блочные способы хранения данных.

Что нужно знать до выбора СХД

Перед тем как купить СХД, ответьте на несколько вопросов.

Какого типа данные будут храниться на СХД?

От этого зависит скорость и сложность их обработки. Для работы с неструктурированными большими данными потребуется одна СХД, а с объемными медиаданными — другая, более производительная и, соответственно, более дорогая.

Какие требования к производительности?

Проектировать систему хранения для нового и уже существующего сервиса — это разные задачи. В первом случае учитывается предполагаемая нагрузка, во втором — текущая, которая известна и может быть спрогнозирована на ближайший период. При этом никто не запрещает воспользоваться готовым кейсом конкурента, специальным онлайн-конфигуратором в сети или обратиться за помощью к вендору, у которого был похожий опыт внедрения. Он же поможет купить сервер под ваши задачи.

Насколько критична скорость записи и считывания данных?

На рынке накопителей развернулась борьба, где традиционные HDD регулярно уступают SSD-дискам. Есть мнение, что первые морально устарели, у них масса недостатков и в разы меньшая производительность, чем у твердотельных накопителей. Однако при работе с крупными блоками данных оба вида дисков ведут себя примерно одинаково. Единственным ограничением для полномасштабного перехода на SSD до сих пор является их более высокая стоимость, но и здесь есть хорошая новость: цена на быстрые SSD-накопители постоянно снижается и, по оценке экспертов, к 2026 году окончательно сравняется с HDD.

Несмотря на оптимистичные прогнозы и явное превосходство над HDD, у твердотельных накопителей есть недостатки вроде ограниченного количества циклов записи. В связи с этим их лучше использовать в СХД с хорошо продуманной дедупликацией и компрессией, даже если вы не планируете экономить место в хранилище любой ценой.

Кроме типа накопителя на скорость доступа к данным влияет протокол доступа. В твердотельных накопителях массово используются NVMe-контроллеры. Для сравнения: HDD часто подключаются через SATA, управляемые более медленными AHCI-контроллерами. В названии NVMe первая часть (NVM) расшифровывается как «энергонезависимая память». Благодаря своей уникальной реализации накопители SSD NVMe отличаются более низкими задержками и более эффективно используют возможности передачи данных, что очень важно при работе в системах с многоядерными процессорами.

Преимущества от использования SSD NVMe видны не при любых нагрузках — самым явным будет прирост скорости доступа при обработке видеоконтента. Однако если организация может себе позволить их покупку, отказываться от этой возможности точно не стоит.

Основные критерии выбора СХД

Давайте посмотрим на ключевые параметры, которые наиболее критичны для выбора оптимальной СХД.

Сетевой доступ

В начале 2000-х еще существовало четкое разделение между двумя популярными архитектурными решениями, но сегодня разница между ними размыта, так как производители все чаще выпускают гибридные решения.

NAS (Network Attached Storage) представляет собой файловый сервер, подключенный к локальной сети. Для доступа к дисковым накопителям используются протоколы NFC и CIFC (для Linux и Windows-систем соответственно). Это оптимальное решение для хранилищ файлового типа, к которым требуется организовать параллельный одновременный доступ большого количества пользователей.

SAN (Storage Area Network) адаптирован под работу с хранилищами блочного типа, в которых одновременно используются дисковые и ленточные массивы, оптические приводы. Доступ к данным осуществляется по протоколам ISCSI и Fibre Channel.

Отличие NAS от SAN

Различия между NAS и SAN

Отказоустойчивость

Организации следует определиться с приемлемым для себя уровнем отказоустойчивости. Оценить этот показатель можно по двум параметрам: RPO и RTO.

RPO (recovery point objective) — время между моментом наступления аварийной ситуации и созданием последней актуальной резервной копии данных. Чем больше этот промежуток, тем выше вероятность потерять большой массив данных.

RTO (recovery time objective) — время, которое отводится на восстановление доступа к системе хранения данных. Этот параметр учитывается при оценке стоимости простоя СХД.

Объем данных

Здесь относительно простой подсчет: необходимо учесть текущие объемы данных, предусмотреть их рост в течение ближайшего периода планирования, а также заложить возможность масштабирования емкости СХД. При выборе типа накопителя следует ориентироваться не только на его полезную емкость, но также на тип и протокол доступа к данным, о чем мы писали выше.

Вы можете выбрать СХД самостоятельно, воспользовавшись конфигуратором на сайте ITELON, или обратиться за помощью к нашим специалистам: опишите особенности IT-структуры, задачи и требования, которые вы выдвигаете к системе хранения данных.