Системы хранения данных (СХД) традиционно подразделяются на два класса доступности: операторский и корпоративный. К более высокому классу относится операторская СХД, которая еще называется «пять девяток» (five nines). Такая система доступна и выполняет свои функции на протяжении 99,999 % рабочего времени.

Для СХД корпоративного класса нормальным показателем доступности ранее считались 99,99 % – четыре девятки». На первый взгляд разница небольшая, но в действительности эти недостающие десять тысячных процента могут повлиять на обработку данных – причем в самое неподходящее время. Например, в момент проведения банком транзакции или при потоковой передаче информации при проведении дорогостоящего научного опыта, который подготавливался много лет.

Эти проблемы обычно решались с помощью многократного резервирования модулей СХД, что требовало значительных затрат. К одному требуемому объему СХД компании дополнительно нужно было приобретать три единицы оборудования, а то и больше. При этом использовались сложные алгоритмы увеличения надежности.

В 2014 году ситуация с доступностью СХД сильно изменилась – фирма Nimble (которая в 2017 году влилась в Hewlett Packard Enterprise) объявила о революционном достижении – доступность систем превысила 99,999%. А уже через два года было сообщено о достижении показателя в 99,999928%. На практике это означает, что простой системы за год составляет меньше 28 секунд.

Стоит отметить, что и операторские СХД, вроде недавно анонсированной HPE XP8, также значительно улучшились – для них производитель предусмотрел уже целых 14 «девяток» после запятой, что гарантирует работу без простоев в течение нескольких лет. Тренд на повышение надежности корпоративных СХД очевиден.

Скептически настроенные пользователи и эксперты могут посчитать, что такие показатели достигнуты на «стендовых испытаниях» и что в действительности процент доступности будет намного меньше. Однако эти характеристики получены не в лабораторных условиях и не с помощью теоретических расчетов, а в результате реально проведенных измерений. Кроме того, они подтверждаются опытом многолетней эксплуатации техники на стороне заказчиков и их отзывами.

Измерения выполнялись с участием всего парка эксплуатируемого оборудования СХД. Исследования проводились с учетом всех моделей и версий операционных систем. Что показательно, высокую степень доступности продемонстрировали не только новейшие системы и версии ОС, а все – включая те, что работали уже свыше шести лет.

Такие характеристики уже являются стандартом для всех решений HPE без всяких условий, ограничений или дополнительных платежей. О том, как инженеры компании добились таких результатов, читайте далее.

Как эти результаты достигались

Компания Nimble начала совершенствование СХД с главного – проектирования архитектуры платформы. В системе с двумя контроллерами исключена так называемая «единая точка отказа» (single point of failure), то есть точка, при отказе которой работа всей системы будет нарушена. Резервирование предусмотрено как для аппаратной, так и программной архитектуры, которая поддерживает не меньше чем трехуровневый контроль четности RAID, а также комплексный мониторинг целостности информации.

При разработке многоуровневых систем учесть все аспекты проектирования невозможно. По этой причине всегда присутствует фактор непредсказуемости, влияние которого на работу системы Nimble максимально нивелируется с помощью использования платформы прогнозной аналитики. С ее помощью исследуется работа развернутого оборудования и собирается статистика. На базе полученных данных оптимизируются процедуры поддержки.

При возникновении отказов и простоев устройств происходит их автоматическое выявление и разнесение по категориям, а информация о событии сохраняется в архиве. Доступность всех развернутых машин отслеживается с учетом версий выпуска программного обеспечения, моделей техники и прочего. Полученная информация изучается с использованием алгоритмов искусственного интеллекта, выявляются причины, повлекшие за собой сбои. Все это позволяет устранить отказ раньше, чем про него узнает заказчик, или даже предупредить появление такого сбоя.

Учитываются полностью все ошибки и сбои, включая те, возникновение которых связано со сторонними поставщиками. То же касается неисправностей, вызванных действием непредвиденных факторов, таких как прекращение подачи электроэнергии или отключение заказчиком массива для переноса его в другое место.

Прогнозная аналитика от системы InfoSight

Спектр ИТ-приложений, инфраструктур, и конфигураций достаточно разнообразен, поэтому проблемы доступа к системе также могут лежать в разных плоскостях. Использование локальных средств для улучшения их доступности и надежности может не давать необходимого эффекта.

Для того, чтобы устранить эти давно назревшие проблемы, фирма Nimble разработала уникальные инструменты аналитики. Уже на уровне разработки диагностические сенсоры встраиваются во все модули программного кода. С помощью этих сенсоров в режиме реального времени предоставляется информация для работы аналитической платформы InfoSight. В каждую СХД HPE входят тысячи сенсоров, с помощью которых проводится сбор и обработка миллионов единиц информации для прогнозной аналитики.

Рукопожатие

InfoSight – точный инструмент для предотвращения отказов в системе

InfoSight применяет способы обработки и анализа информации для определения, прогнозирования и предупреждения возникновения проблем на всех уровнях инфраструктуры. При обнаружении проблем в парке машин создаются сигнатуры состояний. InfoSight сравнивает эти сигнатуры для всех эксплуатируемых систем. В случае выявления заданной сигнатуры InfoSight с помощью алгоритма машинного обучения изучает вероятность появления сбоя еще до его возникновения и заранее предупреждает его, даже если неисправность находится вне пределов СХД, например, в серверах.

По этой причине заказчик может не видеть никаких предупреждений, так как при таком подходе нормализуются рабочие циклы всего парка техники. Непрерывный анализ информации, поступающей со всей базы оборудования, позволяет предупредить возникновение большей части отказов.

Даже в случае возникновения проблемы за пределами СХД, InfoSight может решать до 54 % таких вопросов. За счет этого доступность СХД превысила показатель в 99,9999 %.

Основной принцип функционирования InfoSight: если проблема выявлена, ни один из клиентов не должен больше столкнуться с этой неполадкой при дальнейшей работе системы, даже если ее первопричина находится вне пределов СХД.

Как работает InfoSight

Принцип работы InfoSight

Алгоритм работы InfoSight

Алгоритм работы InfoSight включает в себя такие аспекты:

  • анализ информации. Непрерывное исследование многих миллионов датчиков в системах свыше 10000 заказчиков;
  • генерация обращения. InfoSight прогнозирует возможные неисправности или генерируется обращение. 90 % обращений генерируются в автоматическом режиме, а 86 % обращений автоматически разрешаются прежде, чем клиент узнает о неполадке;
  • изучение причин. Для решения серьезных проблем выделяется сотрудник, который занимается инженерно-техническими работами. Он применяет платформу InfoSight для того, чтобы ускорить диагностирование основных причин проблемы, включая те, что находятся вне пределов СХД. Формируется сигнатура с обозначением некоторых параметров, в которые входит операционная система, уровень производительности, конфигурации внешних поставщиков и профили приложений и рабочих задач;
  • решение проблемы. Специалист разрабатывает схему устранения неполадки, проверяет результат и закрывает запрос на обслуживание;
  • предупреждение возникновения сбоев на остальной установленной технике. InfoSight сверяет поступившую сигнатуру со схемой по выявлению, прогнозированию и автоматическому предупреждению появления сбоев в остальных системах.

В результате количество заявок в службу поддержки HPE напрямую от клиентов ежегодно сокращается на 19,3 %. Такой показатель стал реальным несмотря на то, что за период использования InfoSight число клиентов Nimble увеличилось более чем в 10 раз.

Количество обращений в поддержку Nimble от заказчиков

Снижение количества обращений в поддержку непосредственного от заказчиков

Что еще важного

С помощью системы прогнозной аналитики InfoSight заказчики могут сосредоточиться на задачах бизнеса, а не на решении ИТ-проблем. Такая клиентоориентированность СХД HPE Nimble – не единственное ее достоинство.

Ее преимущества также заключаются в следующем:

  • повышенная эффективная емкость относительно единицы сырой емкости. Это оказалось возможным благодаря уменьшению накладных затрат на RAID и ОС, а также подстраивающимся под вид информации схемам сжатия и дедупликации с режимами включения и выключения. Даже при одинаковых коэффициентах сжатия и дедупликации Nimble демонстрирует эффективную емкость выше, чем у решений конкурентов. Определенные коэффициенты дедупликации и сжатия гарантированы производителем по условиям программы HPE Store More. При этом эффективная емкость не зависит от нагрузки на систему; СХД конкурентов выключают дедупликацию при росте нагрузки. Даже при выходе из строя по несколько дисков в каждой RAID-группе (до трех штук) доступность системы сохранится.
  • дедупликация в онлайн режиме даже на гибридных массивах. Это дает стоимость хранения данных, соразмерную с Entry-level решениями при поддержке всех Mid-range функций;
  • вспомогательный сервис HPE Timeless Storage. Сервис приобретается за отдельную плату в пределах нескольких процентов от цены массива. Он гарантирует бесплатную замену контроллера на новый узел через три года, а потом еще раз по прошествии трех лет с гарантированным ростом производительности на 25 % при каждом обновлении. В действительности использование контроллера нового поколения позволяет увеличить производительность в зависимости от модели на 40–220 %;
  • SLA (интеллектуальная система обеспечения) по производительности (IOPS и/или Мб/сек) и доступности по типам приложений, или, по выбору администратора – в диапазоне отдельных компонентов хранения (томов, папок);
  • предсказуемая производительность СХД Nimble, которая определяется параметрами контроллеров и почти не зависит от вида или числа накопителей. В системах конкурентов применение более 40–50 SSD на массив ведет к работе контроллеров в режиме полной производительности. Последующее увеличение числа накопителей снижает эффективность работы. Кроме того, показатели производительности и емкости Nimble можно увеличить при замене контроллеров без перерыва в работе массива за счет оснащения полками расширения и соединением до четырех СХД в единый кластер;
  • интегрированные схемы защиты информации (снэпшоты, репликация), используемые в массивах Nimble, позволили улучшить показатели RTO и RPO. С помощью HPE RMC (Recovery Manager Central) – технологии прямого бэкапа – можно разворачивать полноформатное резервирование и плавное восстановление данных на дисковые библиотеки HPE StoreOnce. И все это – без применения вспомогательных инструментов; в решениях конкурентов таких возможностей нет;
  • InfoSight позволяет анализировать производительность СХД за прошедший год. В СХД конкурентов получить информацию можно только за несколько минувших часов;
  • модуль взаимодействия со средой виртуализации VMware – Nimble VM Vision – дает возможность исследовать состояние виртуального оборудования относительно его производительности, а также эффективности хранения информации и ее размещения. С помощью модуля можно собирать информацию о состоянии виртуальной среды, что сильно увеличивает точность анализа и прогноза InfoSight. Обычно подобные сервисы предоставляются за отдельную плату; в Nimble он доступен по умолчанию.

Где все это уже применяется

ADAPEI de la Meuse

Французская медицинская ассоциация для родителей и детей с особенностями развития – остановила свой выбор на HPE Nimble Storage, поскольку это уменьшило время задержки при обработке баз данных в 100 раз, а также позволило проактивно обслуживать СХД с помощью HPE InfoSight. К ассоциации относятся 23 объекта в регионе, специалисты которых не знают друг о друге. Есть общая потребность в регулярном обмене информацией между ними. Было решено создать единое пространство с помощью одной ИТ-системы и распределенного центра обработки информации в главном офисе.

В СХД накапливается все больше конфиденциальной информации, которую согласно требованиям GDPR необходимо защищать от несанкционированного доступа. В ИТ-инфраструктуре обрабатывается до 800 платежных документов в месяц и обеспечивается работа нескольких офисных программ. Возможности старой системы не превышали 400 операций ввода-вывода данных в секунду, в то время как флеш-массив HPE Nimble AF 1000 All-Flash Array позволил совершать до 35 тыс. операций за секунду. Это целиком обеспечило запросы ADAPEI de la Meuse.

iLand

Глобальным поставщиком облачных услуг iLand используются флеш-массивы HPE Nimble Storage с применением прогнозной аналитики, которые интегрированы с Veeam Availability Suite. Они позволяют достичь высокой производительности, безопасности и гарантировать защиту информации, а также ее восстановление после ошибок. Эти опции предоставляются в качестве облачной услуги «катастрофоустойчивость как сервис» (DRaas).

Даррен Куинн, разработчик облачных решений фирмы iLand, отметил: «В Nimble нас привлекли возможности шифрования данных. Кроме того, нам нужно было хранение данных на флеш-накопителях для более высокой производительности при экономии средств. Система хранения данных HPE Nimble Storage для этой цели подошла идеально».

Rohde Schwarz

Немецкое предприятие Rohde Schwarz, которое создает широкий спектр корпоративной техники связи, ИТ и безопасности, применяет СХД HPE 3PAR для ключевых для бизнеса приложений и информационных баз. Компания выбрала HPE Nimble для увеличения производительности системы, конфиденциальности информации по стандартам GDPR и для повышения эффективности управления.

Как отметил Йоханнес Вайдахер, ИТ-специалист Rohde Schwarz, «масштаб и скорость роста объема данных заставили искать способы улучшения управления и защиты данных. Параметры HPE Nimble даже превзошли потребности концерна по этим параметрам и обеспечили для него значительное сокращение времени вывода готовых продуктов на рынок».

Сколько все это стоит

При чтении такого рода статей искушенный читатель непременно задается вопросом: все прекрасно, но скорее всего, очень недешево. Предприятия, обладающие неограниченными ресурсами для инвестиций в ИТ-инфраструктуру, могут позволить себе практически любое оборудование – но на практике ИТ-бюджеты всегда ограничены.

Если сравнить показатели Nimble с распространенной СХД HPE MSA, то становится понятным: при равных условиях бизнес получит сравнимые по стоимости систем. Звучит как фантастика, но так и есть.

Результаты сравнения конфигураций доступны заказчикам по запросу.

Хотя стоимость MSA на первый взгляд ниже, но в СХД Nimble есть функции дедупликации и сжатия информации, которые отсутствуют в MSA. Поэтому при равной полезной емкости для MSA необходимо намного больше «сырого» объема. В ряде конфигураций этот фактор делает стоимость различающихся систем сравнимой.

Если прибавить к этому еще опосредованную экономию – сокращение расхода времени ИТ-сотрудников на обработку заявок в техподдержку, рост эффективности бизнес-процессов компании за счет высокой доступности системы. При расчете показателя TVO (Total Value of Ownership) может обнаружиться дополнительный рост эффективности для компании в целом.

ИТ-подразделение как драйвер экономии и повышения доходов бизнеса – это явление, которое пока еще на многих предприятиях России воспринимается как что-то из разряда экзотики. Тем не менее, наблюдается рост числа заказчиков, которые полным ходом трансформируют свои ИТ-службы так, чтобы они выступали уже не как сопровождающая и обслуживающая функция, а как ключевое конкурентное преимущество. И инструментом для этой трансформации может послужить применение высокодоступной и относительно недорогой СХД Nimble.