Технологический обзор

Почему нужно защищать данные

Оставлять данные незащищенными, т. е. не делать резервных копий – значит подвергать свой бизнес существенному риску. Исследование организации Disaster Recovery Preparedness Council показывает, что 20 % компаний, у которых случались потери данных от отключения электропитания серверов, понесли потери от 50 тыс. до 5 млн долларов. А 70 % стартапов и небольших компаний были вынуждены прекратить бизнес после масштабных аварий, связанных с потерей данных.

Поэтому ясно, что любая организация, работающая с данными, должна обязательно предусматривать процессы резервного копирования или резервирования данных (backup) и восстановления данных (recovery). Есть еще отдельный вид восстановления – disaster recovery, DR, т. е. восстановления при стихийных бедствиях и катастрофах природного характера, который также называют «катастрофоустойчивость».

Виды резервирования данных

Резервирование данных может быть в виде файлов и в виде образов.

  • Резервирование файлов (files): определяются целевые данные и файлы, подлежащие резервному копированию тем или иным методом, политикой и регламентом.
  • Резервирование образов (image): предусматривает полное резервное копирование образа диска вместе с операционной системой, служебными файлами и данными.

Образы (image) иногда называются «снэпшотами» (от английского snapshot – моментальный снимок), но между этими понятиями есть некоторая разница.

Планы резервирования

Как резервирование файлов, так и резервирование образов может выполняться по трем основным планам: полное, дифференциальное и инкрементное резервное копирование.

  • Полное резервное копирование: при этом все данные, подлежащие защите, копируются с определенным периодом согласно той или иной политике. Восстановление данных при этом происходит путем полного обратного копирования на исходное место резервной полной копии данных. Тут все просто, но у подхода есть свои минусы: необходимость в большом объеме пространства для хранения резервных данных, а также долгое время как самого резервного копирования, так и восстановления резервной копии.
  • Дифференциальное резервное копирование, при котором периодически резервируются только различия, которые появились между текущей версией данных и последним полным резервным копированием. Восстановление после дифференциального резервирования требует как полной копии всех данных, так и разностного копирования. Такое копирование происходит быстрое, но также требует много места на резервном накопителе.
  • Инкрементное резервное копирование, при котором копируются только различия, которые появились между текущей версией данных и последним дифференциальным, инкрементным или полным резервным копированием. Преимуществом такого плана резервирования является скорость и невысокие требования к объему резервного носителя. Недостатком является то, что при восстановлении данных требуются все данные с последнего полного копирования и данные каждого инкрементного копирования между полным копированием и восстановлением до точки RPO (recovery-point objective).

Политики резервирования

Существуют три основных политики резервирования для всем видов и планов: 3-2-1, GFS и TOH.

3-2-1 предусматривает, что нужно всегда иметь три резервных копии данных на двух типах носителей (например, диск и лента, диск и облако и пр.), причем одна копия должна храниться в отдельном местоположении (например, в другом здании). При использовании облачного варианта в требовании «2» можно обеспечить как другой тип носителя, так и другое местоположение.

GFS (Grandfather, Father, Son) – «Дед-отец-сын». В таком режиме данные резервируются и сохраняются «в трех поколениях»: раз в месяц («дед»), затем каждую неделю («отец») и каждый день («сын»). В конце недели «сын» становится «отцом», а раз в месяц «отец» становится «дедом». Такая политика очень эффективна и надежна, однако при этом нужно все больше пространства для сохранения резервных копий. Поэтому иногда требуется проводить чистку сохраненного объема данных.

TOH (Tower of Hanoi) – «Ханойская башня». Название метода происходит от одной из популярных головоломок XIX века. В игре есть три стержня, на один из которых нанизаны восемь колец, причем кольца отличаются размером и лежат меньшее на большем. Задача состоит в том, чтобы перенести пирамиду из восьми колец за наименьшее число ходов на другой стержень. Диски большего размера нельзя размещать на дисках меньшего размера.

Схема перемещения дисков в Ханойской башне

Схема перемещения дисков в Ханойской башне

Многие думают, что это означает физическое перемещение дисков из стойки в стойку, но на самом деле нет. Такой план резервирования применяется при ограниченном объеме пространства для резервирования, а также при использовании разных типов носителей для резервных копий. В этом случае, «башни» — это разные носители: диски, ленты, облако. Если использовать только один тип носителей, например, дисков, то при отказе системного ПО и дискового привода теряются все данные. Поэтому, чтобы не держать все яйца в одной корзине, используется метод ТОН. Однако он не очень часто используется на практике вследствие сложности алгоритма.

Решения резервирования

Bare-metal. Cистема резервного копирования ставится непосредственно на «голое железо», а не поверх операционной системы. Поэтому резервирование файлов, в отличие от резервирования образов дисков (вместе с ОС), на Bare-metal не работает: нет метаданных системы и загрузочных меток (bootstrapping). Основное преимущество резервирования образов в том, что оно предоставляет не только возможность восстанавливать файлы на работающей операционной системе, но и возможность полного восстановления на «голом железе», даже когда резервирование делается не на системе, идентичной той, на которой обрабатывались резервируемые данные (приложения, данные и ОС). Резервирование файлов может восстанавливать файлы только в работающей операционной системе, но резервирование образов может восстанавливать файлы как в работающей ОС, так и восстанавливать любые данные на «голое железо». Кроме того, ПО резервирования Bare-metal может преобразовывать физический образ в виртуальный образ, который может быть экспортирован в любую обычную систему виртуализации. При выборе системы резервирования на голом железе возможность выполнения этих функций в конкретном вендорском решении нужно обязательно проверить.

Single-pass. Резервирование Single-pass («один проход») означает, что требуется только одна операция (pass), чтобы захватить и сохранить данные, и только одна операция – чтобы их восстановить. Резервирование Single-pass работает быстрее, чем многопроходные варианты (multi-pass backups) и, следовательно, оно позволяет производить резервирование чаще и за более короткий промежуток времени BW (backup window). Однако при наличии программ резервирования для разного контента (файловое резервирование, резервирование образов и резервирование приложений), даже если они все поддерживают резервирование Single-pass, необходимо будет производить три операции (прохода) резервирования.

Непрерывная защита данных CDP (Continuous data protection), также известное как continuous backup или real-time backup, представляет собой создание резервной копии автоматически при каждом изменении данных. При этом становится возможным восстановление данных при любых авариях в любой момент времени, при этом доступна актуальная копия данных, а не те, что были несколько минут или часов назад. Однако это метод довольно затратный и используется только в исключительных случаях.

Удаленная репликация данных (Remote Replication) поддерживает две или более копий данных на двух или более сайтах для предотвращения потери информации в случае аварий.

Существует два типа удаленной репликации: синхронная и асинхронная, они отличатся порядком операций, что ясно из рисунка ниже.

Удаленная репликация данных

Удаленная репликация данных

Выбор ПО и среды резервирования (Backup Media)

Чтобы выбрать носитель (среду) для резервирования, сначала нужно определить, какая емкость для этого понадобится (хотя бы примерно). Это зависит, прежде всего, от того, сколько копий нужно хранить, за какой период времени (это часто определено в регулировании для той или иной прикладной области), а также от скорости роста объема данных на предприятии, где создается система резервирования данных. Приблизительно можно сказать, что нужно умножить текущий объем данных в 3–5 раз. Однако нужно следить за скоростью роста данных, чтобы вовремя внести коррективы.

После того, как получен требуемый объем системы хранения для резервирования, необходимо выбрать среду (носитель данных) этой системы. Основных типов сред резервирования – три: дисковые СХД, ленточные библиотеки и облако. У каждого из них есть достоинства и недостатки.

Диски: быстро работают, но они относительно дорогие, хотя в последнее время наблюдается постоянное снижение цен на твердотельные диски SSD.

Ленты: обладают большими объемами, также довольно быстрые, но сложные в нахождении нужных данных и в управлении. Кроме того, ленты гораздо менее надежны, чем диски, потому что их легко повредить при обслуживании и перемещении.

Кассеты с лентой для ленточного накопителя

Кассеты с лентой для ленточного накопителя

Однако цена ленточных накопителей является достаточно сильным аргументом в пользу их выбора.

Облако. Облако (Cloud) великолепно подходит как резервная система для удаленных офисов компаний и небольших серверов. Для такого сценария, особенно в случае выбора политики резервирования «3-2-1», облако – оптимальный выбор. Недостатком облака являются задержки и зависимость от облачного провайдера, а также надежность канала доступа к нему. Кроме того, немаловажным фактором является безопасность – очень часто предприятия просто боятся выпускать конфиденциальные данные за пределы корпоративного файрволла.

ПО:

У многих производителей серверного оборудования и систем хранения есть стратегическое партнерство с вышеперечисленными производителями программного обеспечения, что позволяет приобретать программные продукты через канал аппаратного вендора.

Железо:

Диски:

Ленты:

  • Ленточные библиотеки HPE MSL2048
  • Ленточные библиотеки IBM TS3400
  • Ленточные библиотеки Fujitsu Enternus LT
  • Ленточные библиотеки Quantum Scalar
  • Ленточные библиотеки Dell LT

Восстановление данных

Snapshot – это «моментальный снимок» содержимого диска, полностью пригодная к использованию копия определенного набора данных на диске на момент съема этой копии. Такая копия используется для частичного восстановления состояния системы на момент копирования. При этом непрерывность работы системы совершенно не затрагивается, и быстродействие не ухудшается.

В технологиях восстановления данных используются три основополагающих понятия:

  • BW (Backup Window) – «окно резервирования», время, необходимое для системы резевирования для того, чтобы скопировать принятый объем данных рабочей системы.
  • RPO (Recovery Point Objective) – «Целевая точка восстановления», максимальный период времени и соответствующий объем данных, который допустимо потерять для пользователя СХД.
  • RTO (Recovery Time Objective) – «допустимое время недоступности», максимальное время, в течение которого СХД может быть недоступной до момента восстановления без критического воздействия на основной бизнес.
BW, RPO и RTO

BW, RPO и RTO

Катастрофоустойчивость

Катастрофоустойчивость (DR, Disaster Recovery) – это восстановление данных при стихийных бедствиях. Это довольно важная составляющая серьезных промышленных СХД, хотя и достаточно затратная. Но эти затраты необходимо нести, чтобы не потерять в одночасье то, что «нажито непосильным трудом». Технологии защиты данных (Snapshot, Remote Replication, CDP) хороши до тех пор, пока в населенном пункте, где расположена СХД, не произошло какое-либо стихийное бедствие: цунами, наводнение, землетрясение или что еще похуже. Удаленная репликация данных в политике «3-2-1» подразумевает, что реплицирующая СХД находится в том же населенном пункте, что и основная система, или, как минимум, поблизости. Что, например, при цунами не спасает.

Технология Disaster Recovery предполагает, что центр резервирования, используемый для восстановления данных при стихийных бедствиях, располагается на значительном удалении от места основного ЦОД и взаимодействует с ним по высокоскоростной сети передачи данных, наложенной на транспортную сеть, чаще всего оптическую.

Катастрофоустойчивое резервирование

Катастрофоустойчивое резервирование