Бэкапы: как они создаются и где их хранить
При нынешнем многообразии информации любому пользователю или компании приходится ранжировать ее по важности содержимого. Потерю важной информации можно предотвратить с помощью резервных копий, или «бэкапов». Даже если все компоненты ваших серверов дублированы, а данные размещены в RAID-массиве с избыточностью, нет гарантий от логических ошибок и пресловутого человеческого фактора.
Целью бэкапа является реализация возможности быстро и недорого сохранить – а при необходимости как можно быстрее и безошибочно восстановить – рабочую информацию (документы, программы, файлы настроек и т. д.).
Очевидно, что процесс резервирования и/или восстановления данных займет какое-то время. Выбор допустимого времени приводит к разным методикам исполнения бэкапов.
Полный бэкап (Full backup) предназначен для тотального копирования всех данных системы или всех файлов соответствующей области применения. Обычно полный бэкап выполняется в то время, когда сам процесс копирования не влияет на исполнение бизнес-процессов в компании: например, ночью в выходной день. Интенсивность изменения информации в системах компании диктует целесообразную периодичность создания бэкапов. Полные бэкапы могут выполняться еженедельно, ежемесячно, ежеквартально и/или ежегодно. Для сокращения объема копируемых данных используют алгоритмы сжатия, а также сочетание механизма полного бэкапа с его другими видами: дифференциальным или инкрементным. Создание полной резервной копии представляет собой простой и надежный способ для последующего быстрого восстановления данных с «нулевой точки отката».
Дифференциальный бэкап (Differential backup) представляет собой резервное копирование только тех файлов, которые были изменены с момента последнего полного бэкапа. Таким образом, если полный бэкап выполняется по воскресеньям, а затем в следующие дни выполняется дифференциальный бэкап, то в субботу носитель с копиями будет содержать все данные, которые появились и были изменены в течение всей недели. Соответственно, размер такого бэкапа ежедневно увеличивается. Дифференциальное копирование часто путают с инкрементным. Разница между дифференциальным и инкрементным копированием в том, что при дифференциальном бэкапе отсчет изменений идет от полной резервной копии, а не от предыдущего частичного бэкапа.
Инкрементный бэкап (Incremental backup) создается посредством копирования только тех файлов, которые были изменены с момента последнего выполнения любого (полного или инкрементного) резервного копирования. Все последующие инкрементные копии содержат только те файлы, которые были изменены с момента предыдущего инкрементного бэкапа, и такое копирование занимает меньше времени из-за малого объема данных сокращенного количества измененных файлов. Однако процесс восстановления данных занимает больше времени, так как необходимо восстановить данные последней полной резервной копии, а также данные всех последующих инкрементных резервных копирований. Общеизвестно, что инкрементные бэкапы менее надежны, чем полные, так как, если повреждена одна копия в цепочке, следующие копии уже нельзя использовать. Следует также отметить, что в инкрементном бэкапе, в отличие от дифференциального, изменившиеся или новые файлы не замещают старые, а добавляются на носитель независимо друг от друга.
Очевидно, что система наименования носителей резервных копий должна однозначно отражать тип хранимого бэкапа.
Свойства инкрементного и дифференциального бэкапов не позволяют применять их в системах с большим количеством транзакций, т. е. когда происходят тысячи или миллионы изменений в секунду. Инкрементный и дифференциальный бэкапы предназначены для резервного копирования справочников и относительно статичной информации.
Некоторые современные программы резервирования могут «на лету» регулировать степень сжатия копируемой информации, сохраняя полезное пространство носителя или исключать алгоритм сжатия данных, увеличивая скорость создания копии.
Еще один технологический нюанс. Инкрементный или дифференциальный бэкап, созданный после дефрагментации диска, может иметь значительно больший объем, чем обычно, потому что в процессе дефрагментации изменяется местоположение файлов на диске и резервная копия отражает эти изменения. После дефрагментации жесткого (не твердотельного) диска рекомендуется заново создавать полную резервную копию. В отличие от обычных жестких дисков твердотельные диски в дефрагментации не нуждаются, она им противопоказана.
В таблице приведены преимущества каждого из типов резервного копирования. В действительности эти параметры зависят от множества факторов, таких как объем, скорость и характер изменения данных, физические характеристики устройств копирования, установленные параметры резервного копирования и восстановления.
Сравнительные характеристики типов резервного копирования
Параметр | Полный бэкап | Дифференциальный бэкап | Инкрементный бэкап |
---|---|---|---|
Объем данных носителя | Максимум | Середина | Минимум |
Время создания | Максимум | Середина | Минимум |
Время восстановления | Минимум | Середина | Максимум |
При выполнении бэкапов обязательно нужно учитывать особенности операционных систем. Например, возможно «разрушение» названий некоторых файлов типа .htaccess или .access.php, ведь для Windows такие файлы дикость. Файлы с расширением, но без названия, из архива распакуются спокойно, а вот править и перемещать их получится только при использовании ОС типа Linux. В других случаях может быть превышена длина пути к файлу (вместе с названием файла), ведь в Windows она ограничена 254 символами.
RTO и RPO. Скорость восстановления и время простоя
При разработке механизмов резервирования/восстановления данных обычно принимают во внимание два ключевых параметра – RTO и RPO.
RTO (Recovery Time Objective) – время, за которое необходимо восстановить данные или ИТ-систему из резервной копии. Возможно, полное время восстановления будет включать в себя а)время восстановления полной копии и соответствующей дифференциальной копии или б) время восстановления полной копии и ряда соответствующих инкрементных копий. Если доступность системы или данных восстановлена за время меньшее, чем время RTO, то результат есть свидетельство своевременного выполнения бизнес-требования. Оценка – «хорошо». Если время восстановления системы/данных больше, чем RTO, то требования не выполнены, оценка – «неудовлетворительно».
RPO (Recovery Point Objective) – интервал времени между точкой сбоя и моментом создания последней резервной копии. Если компания может позволить себе потерять данные за день, то резервное копирование должно выполняться ежедневно. Если бизнес компании допускает потерю данных лишь за час, то бэкап необходимо выполнять ежечасно.
В идеальном варианте, если параметры RTO и RPO свести к нулю, то ИТ-система будет восстанавливаться в момент сбоя без потерь сохраненных данных и работоспособности. К таким показателям стремятся при проектировании систем с большим количеством транзакций в единицу времени. Уменьшение значений RTO и RPO напрямую влияет на рост стоимости технологического решения в экспоненциальной пропорции.
Носители: ленты, компакт-диски, жесткие диски, SSD-диски, облака
Потребность в определенном виде бэкапа, а также стремление к уменьшению времени RTO и RPO, прямо влияют на выбор носителей для создания/восстановления резервных копий данных.
Лидером по надежности, снижению стоимости эксплуатации и срокам долговременного хранения резервных копий больших объемов информации является магнитная лента, старейший компьютерный носитель данных. Недостатки магнитной ленты: низкая скорость доступа к произвольным данным и высокая стоимость накопителей. Наилучшим образом подходит для ежемесячных, ежеквартальных и годовых бэкапов.
Альтернативой ленточным библиотекам могут служить Blu-ray-библиотеки, работающие с CD- и DVD-носителями. Стоимость хранения данных на компакт-дисках (Blu-ray) выше, чем на лентах, и емкость носителя уступает емкости магнитной ленты. При этом Blu-ray устройства превосходят ленточные накопители по скорости записи и извлечения данных. Компакт-диски с защищенной от царапин (scratch) поверхностью подходят для хранения дистрибутивов и «срезов» различного ПО.
В качестве носителей для быстрого и надежного создания бэкапов можно использовать жесткие диски, внешние по отношению к резервируемой системе. При относительно большой емкости и небольшой удельной стоимости хранения информации жесткие диски чувствительны к механическим воздействиям, температурным перегревам и снижению производительности из-за дефрагментации данных. Использование жестких дисков предпочтительно для уникальных, одноразовых бэкапов или для создания копий с необходимостью перемещения данных для последующего «быстрого» восстановления, что стало возможным после появления USB-интерфейса.
На смену традиционным жестким дискам сейчас приходят твердотельные накопители (SSD) с функциями жестких дисков, но без механических движущихся элементов, на энергонезависимой флэш-памяти. Преимущества твердотельных дисков – высокая скорость записи/доступа, низкая чувствительность к механическим воздействиям, отсутствие эффекта «дефрагментации данных», низкое энергопотребление. Недостатки: из рассматриваемых носителей самая высокая стоимость хранения информации, ограниченное число циклов перезаписи информации (сотни тысяч циклов). SSD-диски можно применять для краткосрочных бэкапов с высокой скоростью создания/восстановления данных.
Современные нестандартные бэкапы могут существовать в виде файлов без физических носителей. Развитие сетевых коммуникаций позволяет создавать и/или хранить бэкапы в сетевых интернет-хранилищах – облаках. Преимущества очевидны: носители не нужны, скорость сравнима со скоростью жестких дисков, а доступ к резервной копии возможен в любом месте при наличии доступа в интернет. Вопрос лишь в стоимости хранения информации.
Ротация и место хранения носителей
Если у компании достаточно большое количество носителей, стандартно используемых для бэкапа, это позволяет выбрать наиболее приемлемую схему смены рабочего набора носителей, называемую ротацией. Выбор подходящей схемы ротации носителей является в резервном копировании одним из наиболее важных вопросов.
Основной принцип выбора способа и места хранения носителей должен строго соответствовать заданным параметрам RTO и RPO, так как время восстановления информации может включать в себя время доставки резервного носителя к соответствующему устройству. Необходимо также предусмотреть дублирующую возможность резервного копирования/восстановления через сеть с использованием удаленного рабочего места.
Простая схема ротации подразумевает, что отдельный носитель выделяется для определенного дня недели, т. е. каждый носитель, кроме одного, представляет собой ежедневный дифференциальный бэкап. Выделенный носитель используется в конце недели для полного бэкапа. При такой ротации часть носителей хранится в библиотеке или в металлическом сейфе вне серверного помещения. Полные недельные бэкапы, а также полные месячные бэкапы рекомендуется передавать на хранение в подразделение компании, находящееся в другом здании. Эта бюджетная мера страхует резервные копии от форс-мажорных обстоятельств (пожар, подтопление, кража, ремонт помещений здания и т.п.). Носители с ежеквартальными или годовыми полными бэкапами, если позволяет бюджет, отдаются на стороннее хранение по договору со специализированной фирмой.
Более сложная иерархическая структура бэкапов имеет сленговое название «дед, отец, сын». Отличие от простой схемы ротации состоит в том, что на каждую неделю в месяце выделен свой набор носителей, а полные бэкапы за последнюю неделю месяца и за месяц выполняются строго на разные носители. В этой схеме количество носителей увеличивается, соответственно пересматриваются места для хранения носителей. В любом случае не используемые в процессе копирования носители должны находиться вне серверного помещения со строгим контролем доступа. Обычно это металлический шкаф, с опечатываемыми створками либо с ключом в опечатываемом пенале.
Схемы ротации типа «Ханойская башня» и «10 наборов» используются нечасто и находят применение только при большом количестве носителей в сложных системах резервного копирования крупных компаний.
Все места хранения резервных копий должны учитывать специфику носителя. Ленты не должны подвергаться воздействию магнитных полей, поэтому их желательно держать вдали от бытовых и силовых электрических приборов. Компакт-диски очень чувствительны к царапинам и прямому воздействию солнечных лучей. Обычные жесткие диски зависимы от механических воздействий и стабильного, надежного электропитания.
Помните, что недостаточно своевременно и правильно делать бэкапы, нужно также быть уверенным, что они не «битые»! Гарантия такой уверенности – периодическая проверка читаемости носителей и восстановление данных, согласно технологии, в тестовую среду.