Общие принципы и технологии облачной инфраструктуры

Содержание:

Что такое облачное хранение данных

Внешние системы хранения данных за свою историю сильно изменились. Гибкие магнитные диски, DVD-диски, внешние жесткие диски, USB-накопители – все эти технологии быстро совершенствовались и менялись вместе с аппаратной базой компьютеров.

Наступило время цифровизации и виртуализации. Это означает, что от оборудования происходит переход к функциям. Когда мы используем услугу каршеринга, это означает, что вместо собственной «аппаратной» машины мы, фактически, используем ее функцию – «ехать». При этом, конечно, мы садимся в реальную машину с брендом компании каршеринга на кузове, но после использования мы отправляем ее обратно в «облако» каршеринга, и не заботимся о том, кто будет использовать ее дальше. Преимущества каршеринга перед обладанием собственных «колес» очевидны. Не нужно платить за парковку, за бензин, запчасти, мойку и ТО – мы платим только за время использования услуги. Недостатки тоже есть: возможно, поблизости нет свободной машины, больше времени нужно на ее поиск и аренду, отсутствие стопки любимых музыкальных дисков, которые мы привыкли возить в бардачке (собственно, это не такая уж большая проблема – музыку мы тоже все больше берем «из облака»).

Точно также облачное хранилище – это виртуализация вашей собственной системы хранения. В облаке ваши данные также хранятся на каком-то оборудовании. Но вам неинтересно, на каком именно («ехать, а не шашечки»): вы просто отправляете данные в «облако». Причем даже интерфейс облачной системы хранения может быть очень похож на обычный файловый менеджер на вашем компьютере.

На фото – интерфейс облачного хранилища Google

Пример интерфейса облачного хранилища Google

Как работает облачное хранилище

Вне зависимости от типа системы облачной системы хранения: внутренней (частной, private) или внешней (public, публичной) – принцип их работы следующий. Провайдер облачных услуг, или просто «облака» (частного или публичного), предоставляет свои ИТ-инфраструктуру, которая обеспечивает надежное и безопасное управление нужными серверами для хранения данных.

Публичное облако – это виртуализированная система хранения, услуги которой предоставляет внешний провайдер. В его дата-центре хранятся данные многих клиентов, на условиях «многоарендности» (multi-tenancy), без взаимного влияния друг на друга. За счет оптимального и централизованного использования ресурсов удается достичь ценовой эффективности.

Частное облако: виртуализированная система хранения, организуемая в масштабах предприятия. В ней имеется выделенный дата-центр (ЦОД), в виртуализированной инфраструктуре которого хранятся данные и работают приложения предприятия. В этом случае роль провайдера облачных услуг чаще всего выполняет ИТ-служба предприятия.

Серверы частного или публичного облака работают не как независимые системы внутри структуры облачного хранилища, а как единая группа серверов. Для этой цели дисковое пространство вместе с другими компонентами сервера (например, CPU или оперативной памятью) виртуализируется с использованием гипервизоров. Поверх гипервизора будут работать уже не физические серверы, CPU и накопители данных, а виртуальные серверы. А в них – виртуальные машины VM (Virtual Machine), которые с точки зрения функционала аналогичны физическим устройствам. Но они обладают замечательным свойством: могут адаптироваться под конкретные требования, могут быстро мигрировать между физическими серверами и даже дата-центрами.

При этом между реальным оборудованием и виртуальными функциями хранения (Virtual Storage) возникает некий уровень абстрагирования, на котором работает монитор виртуальных машин VMM (Virtual Machine Monitor), который еще называют гипервизором (Hypervisor).

На фото – назначение гипервизора

Что делает гипервизор

Гипервизоры бывают двух типов:

  1. Программное обеспечение для виртуализации «кладется» непосредственно на физическое серверное оборудование и не требует для своей работы предварительно установленной на нем операционной системы. Это, например, популярный гипервизор vSphere от компании VMware.
  2. ПО виртуализации требует полнофункциональной операционной системы, установленной на физический сервер. Примером такой системы может быть VM VirtualBox от компании Oracle.

В обоих случаях виртуализация обеспечивает гибкость функций, легкость масштабирования и простоту изменений.

Если сравнивать с тем же каршерингом: если нам нужно просто попасть из точки А в точку Б, то мы заказываем скромный седанчик. Если нам важно произвести впечатление, то можно заказать, например, автомобиль бизнес- или представительского класса. А если нужно вывезти на дачу мебель, можно заказать каршеринг-микроавтобус. И все это можно получить на едином аккаунте у провайдера услуг каршеринга, который быстро предоставляет нам именно ту «функцию-автомобиль» такого класса, который нам нужен.

Структура облачных систем хранения

Для доступа к виртуальному хранилищу в облаке обычно требуется соответствующее программное обеспечение. Услуги публичного облака обычно содержат не только веб-приложение, которым можно пользоваться через обычный браузер, но также драйверы доступа от различных устройств. С их помощью можно залогиниться и получить доступ к своему диску в облаке. Сохраненные там файлы можно извлечь через различные устройства (компьютер, планшет, смартфон и пр.), поддержка которых обеспечивается облачным провайдером.

Для частного облачного хранилища обычно требуется соединение с сервером VPN через соответствующую корпоративную сеть (Интранет), либо с помощью услуги виртуальной частной сети VPN (Virtual Private Network) через публичный Интернет. В последнее время появилась возможность использования для этой цели технологии SD-WAN (программно-конфигурируемой глобальной сети), но пока эта технология еще не достигла стадии зрелости.

Облачные провайдеры, в своей внутренней инфраструктуре хранения, кроме обычного файлового хранилища (File Storage), могут использовать альтернативные виды форматов: блочное хранилище (Block Storage) и объектное хранилище (Object Storage).

Вне зависимости от используемого формата хранения данных (File/ Block/ Object Storage) облачные провайдеры могут использовать в физическом оборудовании либо жесткие диски HDD, либо твердотельные диски SSD. Последние характеризуются более высокой скоростью записи и считывания данных внутри инфраструктуры облачного провайдера (заметим, что могут быть задержки в сети доступа). Но они пока более дорогие, чем классические HDD.

Благодаря виртуализации можно одновременно использовать оба типа дисков. Например, т. н. «горячие» данные – то есть те, к которым чаще обращаются, можно размещать на SSD. Как только обращения к каким-то данным становятся реже, их можно перевести в разряд «холодных» и перенести в HDD, поглубже в систему.

В этом и состоит одно из преимуществ облачного хранения: если то же самое делать внутри собственной системы хранения предприятия, нужно строить соответствующую архитектуру, применять соответствующие программные менеджеры, занимающиеся сортировкой данных и размещением их либо в SSD, либо в HDD. Эффективно это можно сделать только в масштабах крупного предприятия. Для небольших компаний это не всегда выгодно, из-за чего возможен нерациональный расход ресурсов и неэффективное хранение данных.

Преимущества облачного хранилища

Есть много причин, по которым целесообразно организовывать хранение данных во внешнем облаке.

Прежде всего, это экономия средств на приобретение и обслуживание собственного серверного оборудования для хранения. Существует расхожее мнение, что облачные услуги ничуть не дешевле – или даже дороже, чем собственные системы хранения (on-premise).

Чтобы сравнить стоимость обоих вариантов, не следует проводить расчеты «в лоб», ориентируясь только на стоимость «железа» и услуг облачного провайдера. Необходимо провести тщательный анализ совокупной стоимости владения или стоимости жизненного цикла, ТСО (Total Cost of Ownership).

ТСО – это общая величина целевых затрат с момента начала владения до завершения владения, а также полного объема затрат, связанных с владением.

На фото – последствия аварии в собственном ЦОД

Трудности эксплуатации и аварии – преобладающая часть «непрямых расходов» ТСО (фото: habr.com)

Однако при выборе облачного хранения вся ответственность за нижележащую инфраструктуру лежит на облачном провайдере – это важно учитывать при оценке стоимости его услуг.

Преимуществом облачного хранения является и то, что оригинал и резервная копия данных (резервирование надо делать обязательно) будут находиться в разных географических местах. Это защищает данные в случае различных непредвиденных ситуаций, которые обычно происходят в самый неподходящий момент: взлом системы, пожар, отказ оборудования.

Другие преимущества облачного хранения:

Гибкость. Это возможность потреблять ровно такой объем хранилища, который нужен в данный момент. Если нужно больше, провайдер предоставляет больше – и плата растет. Если нужно меньше, провайдер предоставляет меньше, а плата снижается. В собственной же системе необходимо всегда иметь максимальную емкость на случай всплесков трафика. В обычном режиме избыточная емкость простаивает. Если емкость, что называется, «под завязку», это отрицательно сказывается на быстродействии. В облаке этих проблем нет.

Масштабирование. Виртуализация хранилища позволяет выбирать требуемый объем хранилища по контракту. В любое время можно увеличить либо уменьшить объем хранилища без закупок оборудования, его установки и наладки.

Доступность: облачное хранилище доступно в любое время и с любого устройства (при наличии нормального Интернета). Поэтому получать данные можно «на ходу», там, где они нужны в тот или иной момент.

Недостатки облачного хранилища

Облачное хранилище во многих случаях может стать хорошей альтернативой традиционным решениям по хранению в корпоративной системе (on-premise). Однако, во многих случаях резервирование файлов в облаке имеет некоторые минусы.

Прежде всего, это зависимость от Интернет-соединения. Если оно нарушается, файлы в облаке становятся недоступными. Важным фактором остается доступная полоса пропускания: даже при самом быстродействующем хранилище доступ к данным будет медленным из-за низкой скорости соединения. Особенно это касается мобильных сетей.

Кроме того, есть и другие недостатки.

Зависимость от провайдера. Если у провайдера происходят какие-то проблемы, или он волюнтаристски меняет условия контракта, заказчик может поменять провайдера, но это процесс не одномоментный.

Безопасность. Пересылка данных за файерволл корпоративной сети – это всегда риск. Не все провайдеры предоставляют услугу шифрования хранимых данных. Несмотря на то, что хорошие провайдеры всегда стараются обеспечить высший уровень безопасности своих систем, инфраструктура провайдера – желанная цель для атак хакеров.

Защита данных. Как данные будут защищены в инфраструктуре провайдера – основной вопрос, который необходимо выяснить при заключении контракта на облачное хранение данных. Это, однако, «палка о двух концах», похожая на вечный спор о том, где лучше хранить деньги – в банке или дома в сейфе. И там, и там их могут украсть. Однако не подлежит сомнению, что, в целом, банк может обеспечить более высокую степень защиты средств своих вкладчиков. Однако, в отличие от денежной аналогии, компрометация информации, хранящейся у провайдера – это невосполнимый ущерб для клиента облачной услуги: при похищении денег клиента банк, в принципе, способен компенсировать этот ущерб.

Компромисс – гибридное облако

При выборе между частным и публичным облаком, всегда нужно делать тщательный анализ TCO. Затраты оборудование, лицензии на ПО, на оплату труда ИТ-специалистов и пр. – это т. н. «прямые» или «бюджетные» расходы.

Однако есть и «неявные», скрытые затраты: на содержание собственной ИТ-инфраструктуры, затраты и потери, связанные с ее ненадежной работой и пр. Такие затраты называются «непрямыми» (indirect). При тщательном анализе TCO можно обнаружить, что «непрямые» расходы превышают «прямые» – иногда в несколько раз!

Прямые и скрытые затраты

Прямые и скрытые затраты

Результаты глубокого анализа задач бизнеса, требований к инфраструктуре (доступность, производительность, безопасность) позволяют просчитать ТСО и найти баланс между частным и публичным облаком. Универсального рецепта нет, в некоторых случаях лучшим решением может стать гибридное облако хранения данных.

Гибридное облако, как это видно из самого названия, объединяет в себе плюсы публичного облака (Public Cloud) и частного облака (Private Cloud).

Заметим, что частное облако – это термин, по поводу которого в среде ИТ-специалистов идут незатихающие споры: есть ли такое понятие – частное облако? Или это просто хранилище данных в корпоративной системе.

Будем считать, что если при хранении данных в корпоративной системе (on-premise) используются технологии виртуализации, то такое решение можно с полным правом называть частным облаком. Если же это просто NAS на базе RAID, то это не облако, а корпоративное файловое хранилище.

Проблемы возникают, если емкости частного облака вдруг перестает хватать. Тогда можно перемещать часть данных и приложений в публичное облако, которое будет работать как резерв и средство катастрофоустойчивости.

Многие предприятия при использовании частного облака перемещают некоторые функции в публичное облако, например, используют услугу корпоративной облачной почты, услуг облачного видеонаблюдения и пр. Однако для хранения конфиденциальных и бизнес-критичных данных при этом используется частное облако.

Таким образом, решение гибридного облака сочетает в себе преимущества как частного, так и публичного облака, и может обеспечить такие преимущества, как:

  • более высокую степень управляемости;
  • хорошую «кастомизируемость», то есть возможность сконфигурировать оптимальное решение;
  • экономическую эффективность.

Современные гиперконвергентные системы, например, HPE Simplivity, Dell EMC VxRail, Cisco Hyperflex изначально содержат в себе сервисы, позволяющие разворачивать гибридные облака для решения корпоративных задач. Более подробно об этом расскажем в следующих статьях.