Что такое облачное хранение данных
Облачная СХД позволяет хранить данные и файлы вне пределов корпоративной сети предприятия с доступом к ним либо через публичный интернет, либо через виртуальную частную сеть VPN. Ответственность за безопасность данных в этом случае будет лежать на стороннем поставщике услуг облачного хранения, который предоставляет для этого инфраструктуру, управляет ей и обеспечивает заказчику доступ к данным в требуемое время и с требуемым качеством.
Облачные СХД представляют собой выгодную по стоимости и возможностям альтернативу хранению данных в собственной корпоративной СХД. Как хорошо известно любому IT-директору, емкость собственных СХД имеет свойство заканчиваться в самый неподходящий момент, хотя, казалось бы, система была построена с большим запасом. Расширение системы часто представляет собой непростую задачу – это затратно и требует времени, как минимум нескольких дней. А дополнительная емкость нужна прямо сейчас.
В этом случае облачные СХД могут быть настоящей палочкой-выручалочкой. Облачное хранилище обладает «эластичностью», т. е. вам не нужно закладывать в систему емкость с запасом. В облачной СХД ее можно масштабировать по мере необходимости – и очень быстро. При этом оплата емкости всегда происходит по мере использования, а не по предварительной оценке того, сколько вам, как предполагается, будет нужно емкости.
Если все просуммировать, как говорят, «по гамбургскому счету», то по стоимости получается примерно то же, как если бы пришлось разворачивать хранилище в корпоративной сети (on-premise), а вот по быстроте и простоте получается значительный выигрыш. Конечно, любой проект требует всесторонней оценки. Вполне может получиться так, что облачное хранилище, на первый взгляд, покажется очень дорогим, но в любом случае требуется все всестороннее оценить, и из множества предложений на рынке выбрать самое оптимальное. В любом случае, вы получаете выигрыш еще и в том, что можете создавать хранилище не «на вырост», а из расчета текущих потребностей. А в случае экстренных ситуаций можете быстро «дозаказать» емкость в облаке.
Вариантом хранения в публичном облаке является т. н. гибридное облако, когда по мере необходимости данные из частного облака резервируются в публичном облаке.

Архитектура облачной СХД от провайдеров публичного облака
Что обычно хранят в публичном облаке и почему это выгодно
В первую очередь публичное облако подходит для хранения больших массивов неструктурированных данных, которые нет смысла хранить в собственном хранилище. По прогнозу Gartner, к 2024 году предприятия утроят объем хранения неструктурированного контента в виде файлового или объектного хранения по сравнению с 2019 годом. Кроме того, к 2024 году примерно 40 % предприятий будут использовать гибридную архитектуру облачного хранения данных, по сравнению с 10 % в 2019 году.
Хранить неструктурированные данные в публичном облаке выгоднее по многим причинам, – в первую очередь потому, что вся ответственность за оптимизацию хранения, управления данными и экономию ресурсов будет лежать на облачном провайдере.
Кроме того, облачное хранилище также выгодно с точки зрения экономии электроэнергии и пространства серверных комнат, поскольку так все эти вопросы находятся в ведении облачного провайдера. Централизованное хранение данных значительно уменьшает энергопотребление в масштабах города, региона и страны, по данным некоторых аналитиков – до 70 % [1].
Предприятия могут выбирать между собственным (on-premise), облачным (off-premise) или комбинированном вариантом исходя из соображений экономии начальных капитальных затрат, необходимости в использовании решения катастрофоустойчивости, а также принимая во внимание политику хранения персональных данных и регулятивные документы.
Особенно выгодным для крупных предприятий, у которых есть необходимость надежного хранения критичных данных, выглядит облачное решение катастрофоустойчивости. Если реализовывать его собственными средствами, без использования облачных решений, то часто это выливается в необходимость строительства дополнительного дата-центра (а в надежных системах – еще и третьего, удаленного), который должен не только работать в режиме дублирования операций основного дата-центра, но и располагаться на значительном удалении от него – на расстоянии не менее 50–100 км. Несложно понять, что это в несколько раз повышает начальные капитальные затраты, поскольку, кроме строительства дублирующего дата-центра, нужно еще строить (или арендовать) высокоскоростную линию передачи данных для их связи между собой.
Создание же «логического» дата-центра силами стороннего облачного провайдера на базе решения распределенного программно-конфигурируемого дата-центра SDDC (Software-defined data center) дает возможность получить все преимущества решения катастрофоустойчивости без необходимости строительства дублирующего дата-центра.
Пользователи публичных облачных СХД получают преимущество немедленного доступа к широкому диапазону ресурсов и приложений, которые предоставляет облачный провайдер от других поставщиков через открытые интерфейсы приложений Open API.
Облачные СХД могут быть использованы для хранения и быстрого обратного копирования образов виртуальных машин из облака в корпоративное облако предприятия-пользователя облачной СХД. В публичном облаке можно хранить библиотеку образов виртуальных машин, чтобы не конфигурировать их каждый раз, а при необходимости просто извлекать их из облака и запускать в корпоративной системе предприятия.
Кроме того, облачная СХД может быть использована для перемещения образов виртуальных машин между аккаунтами пользователей или между разными дата-центрами.
Для организаций с большим количеством распределенных офисов или торговых точек облачное хранилище может работать как центральный файловый сервер, который может быть сконфигурирован даже так, что на рабочих станциях офисов он будет виден в виде местного диска.
Крупнейшие провайдеры услуг публичного облака
Amazon Web Services (AWS)
- Услуга Amazon S3 (Simple Storage Service) за более чем 10-летнюю историю предоставления услуги приобрело широкую популярность.
- Amazon EBS (Elastic Block Storage) – это хорошее решение для блочного хранения информации баз данных, с приложениями аналитики и другими услугами, пользующимися большим спросом.
- Amazon Glacier представляет собой недорогую облачную СХД для долговременного архивного хранения данных, а также данных, доступ к котором требуется нечасто и без требований низкой задержки доступа.
Microsoft Azure
- Услуга Blob – облачная объектная CХД для неструктурированных данных, в которой можно выбрать один из трех уровней хранения в зависимости от частоты обращения к данным.
- Премиум: данные, для которых важна высокая производительность, лучше хранить на этом уровне.
- Горячий уровень для часто используемых данных.
- Холодный уровень для редко используемых данных.
- Услуга Files – облачная файловая СХД, с поддержкой протокола SMB (Server Message Block).
- Услуга Disk Storage, предназначенная для интенсивных по обмену данными рабочих нагрузок с использованием опций облачной СХД на базе SSD или HDD.
- Услуга Azure Archive – услуга архивного хранения редко используемых данных и долговременных архивов.
Google Cloud
Google предлагает подобные опции для четырех классов хранения (Standard, Nearline, Coldline, Archive) в соответствии с требованиями заказчика с вариантами Multi-regional и Regional.
Класс |
Мин. срок хранения |
Доступность |
Standard |
Нет |
99,99% для Multi-regional 99,99% для Regional |
Nearline |
30 дней |
99,95% для Multi-regional 99,90% для Regional |
Coldline |
90 дней |
99,95% для Multi-regional 99,90% для Regional |
Archive |
365 дней |
99,95% для Multi-regional 99,90% для Regional |
IBM Cloud
IBM предоставляет решения как объектного, так и блочного хранения. В последнем случае это реализация на базе специальных накопителей SSD с высокой надежностью хранения. Для файловой облачной СХД используется сетевая ОС NFS (Network File System), которая также работает на накопителях SSD. Для пользователей доступна опция хранения (CDN, content delivery network), предназначенная в основном для медиафайлов.
Основные сценарии применения облачных СХД
Сценарии применения хранения данных в публичном облаке можно разделить на следующие категории.
- Услуги файловой синхронизации и совместного доступа, которые позволяют пользователям загружать файлы, изображения и видео для «расшаривания» другим пользователям. Услуги могут быть ориентированными как на индивидуальных пользователей (например, Google Docs), так и на корпоративный рынок, например, Dropbox.
- Защитное резервирование (backup) и катастрофоустойчивость DR (Disaster Recovery). Рекомендуется держать как минимум одну копию каждого файла в резервном хранилище backup, что удобно делать в публичном облаке. По данным исследования аналитической компании Interop ITX, 37 % респондентов используют облачную архитектуру для резервного копирования; схожий результат (33 %) приведен в исследовании State of Software-Defined Storage, Hyper-converged and Cloud Storage компании DataCore за 2017 год. В исследовании компании Cloudian 64 % респондентов ответили, что они либо используют облачный backup, либо планируют его использовать.
- Архивирование. Крупнейшие поставщики облачных сервисов предлагают недорогое решение для архивного хранения данных. Организации используют режим «гибридного облака», когда часто используемые данные хранятся в корпоративной СХД, а редко используемые – отправляются в архивный облачный сервис.
- Application-Specific Storage. СХД для специфических приложений. Например, 53 % организаций хранят в облаке файлы для своего веб-сайта, 48 % используют облако для разработки и тестирования (PaaS), а также для технических приложений (43 %), согласно исследованию компании Cloudian за 2017 год. DataCore указывает, что корпоративные приложения хранят в облаке 33 % опрошенных ими предприятий, аналитику данных в облаке используют 22 % предприятий.
- СХД общего назначения. К этой категории относятся в основном услуги IaaS, которые пока не столь популярны, как вышеперечисленные. Interop ITX сообщает, что только 29 % опрошенных используют услуги публичного облака для этой цели, и только 11 % по данным компании DataCore используют публичное облако в качестве основного хранилища.
[1] Gupta, P (20 October 2013). "The usage and adoption of cloud computing by small and medium businesses". International Journal of Information Management. 33 (5): 861–874