Любой ИТ-администратор знает, как бывает сложно отследить проблемы, влияющие на производительность ИТ-системы и работающих на ней приложений. В большинстве случаев эта работа выливается в сопоставление сотен метрик с различных уровней и элементов ИТ-инфраструктуры и стека программ, что может занимать часы и дни рабочего и нерабочего времени, прежде чем удается выследить источник проблемы.

Несколько лет назад в аналитической системе HPE InfoSight была введена комплексная аналитика для VMware совместно с СХД от НРЕ, чтобы облегчить анализ и поиск неисправностей, вызванных сложными взаимодействиями между уровнями виртуализации и хранения данных. Интеграция с VMware уже помогла многим пользователям решить проблемы с производительностью виртуальных машин.

Теперь в InfoSight есть и новая возможность комплексной аналитики, которая появилась с поддержкой среды виртуализации Hyper-V от Microsoft. Кроме того, компания HPE усовершенствовала интеллектуальный рекомендательный «движок» для постоянного мониторинга массивов СХД Nimble. Сейчас добавляются средства визуализации и рекомендаций для прошедшего дня и прошедшей недели для пулов СХД.

Комплексная аналитика для Hyper-V

Многие клиенты отмечают, что поиски проблем с производительностью в виртуализованной инфраструктуре похожи на мультик «Ежик в тумане», когда почти невозможно выявить соотношения между виртуальными машинами и СХД.

Комплексная аналитика предоставляет полную видимость топологии, где можно проследить взаимоотношения от кластеров и хостов Hyper-V до виртуальных машин VM и кластеризованных общих томов CSV, а также физических томов в массивах СХД, и наоборот.

Кроме того, созданы алгоритмы на базе глубокого машинного обучения для отслеживания следующих проблем:

  • Распознавание «шумных соседей» («Noisy neighbor»). Поскольку виртуальные машины часто соревнуются за ресурсы виртуальной среды, важно анализировать использование общих ресурсов внутри кластера виртуализации. Анализ борьбы виртуальных машин между собой (VM-contention) дает возможность распознавать противоречия между общими ресурсами ввода-вывода, процессоров и памяти.
Тенденции использования общих ресурсов

Тенденции использования общих ресурсов

  • Поиск «иголки в стоге сена». В средах на сотни и тысячи виртуальных машин часто бывает непонятно, где искать проблему. В аналитической системе InfoSight есть инструмент VM I/O Contention Treemap, который представляет «вид сверху» на ИТ-инфраструктуру, чтобы было легче найти проблемную виртуальную машину. На рисунке ниже показана карта Contention Treemap с виртуальной машиной, задержка (latency) которой выходит за допустимые пределы.
Инструмент VM I/O Contention Treemap

Инструмент VM I/O Contention Treemap

  • Управление емкостью. Планирование и администрирование емкости СХД для виртуальных машин – это довольно трудоемкая задача. Отображение тенденций роста емкости виртуальных машин дает возможность управлять емкостью.
Отображение тенденций роста ёмкости виртуальных машин

Отображение тенденций роста ёмкости виртуальных машин

Рекомендательный движок интеллектуальной аналитики

Этот рекомендательный движок (AI Recommendations Engine) для облегчения поиска проблем в производительности СХД был представлен около двух лет назад. Он использует машинное обучение на базе собранных данных от всей базы СХД компании HPE, установленной во всем мире. На этой основе он может идентифицировать потенциальную причину проблемы (root cause) и предложить возможные действия для ее устранения.

Как работает движок на базе машинного обучения, можно посмотреть здесь.

Недавно компания HPE расширила возможности AI Recommendations Engine. Теперь в нем есть вкладка «Рекомендуемые задачи». AI Recommendation Engine может мониторить пулы СХД в режиме 24/7 и вырабатывать рекомендуемые действия (Recommended Actions) на панели оператора.

Экран InfoSight с рекомендуемыми действиями (Recommended Actions)

Экран InfoSight с рекомендуемыми действиями (Recommended Actions)