CDP – резервное копирование без «окон»
Технология, разработанная для решения проблемы «окна резервного копирования», состоит в копировании данных компьютерной системы при каждом их изменении, что позволяет быстро восстановить данные не только после аварий оборудования или удаления важных файлов, но и после кибератак. Но решения CDP помимо высокой стоимости могут существенно увеличивать нагрузку на локальную сеть.
Непрерывная защита данных (Continuous Data Protection, CDP), которую иногда также называют непрерывным резервным копированием (continuous backup) или копированием в реальном времени – это технология, обеспечивающая резервное копирование данных компьютерной системы при каждом их изменении. CDP ведет журнал всех изменений оригиналов данных, с помощью которого можно сделать откат на любое время, т.е. восстановить оригиналы в том состоянии, в каком они были в любой момент в прошлом.
Проблема окна резервного копирования
Технология CDP была разработана для решения проблемы так называемого окна резервного копирования. Дело в том, что в классической схеме резервного копирования для записи резервных копий данных на ленту нужно остановить приложения, использующие эти данные, поэтому обычно резервное копирование раньше выполнялось в нерабочее время, ночью. Период времени, когда приложения останавливают для резервного копирования их данных, называется окном резервного копирования.
Проблема заключается в том, что по мере роста объемов данных приложений во многих компаниях системам резервного копирования перестало хватать длительности окна, чтобы скопировать на ленту все данные, которым нужно обеспечить защиту. Применение более сложных схем резервного копирования, когда полная копия данных создается только раз в неделю – в выходные два дня, а в рабочие дни во время окна резервного копирования в ночную смену записываются резервные копии только измененных данных (так называемые инкрементальные или дифференциальные реальные копии), а также появление дисковых систем резервного копирования, которые работают намного быстрее ленточных библиотек, не смогло полностью решить проблему , потому что рост данных постоянно ускоряется, а во многих организациях используются приложения, непрерывно работающие круглые сутки, например, системы электронной коммерции. Кроме того, если происходит авария, то все данные, созданные после последнего окна резервного копирования будут потеряны, а при ежедневном резервном копировании это означает, что компания может потерять результаты своей работы за последние сутки.
CDP позволяет быстро восстановить данные не только после аварий оборудования (например, выхода из строя отдельного диска или всего сервера) и случайного или умышленного удаления важных файлов, но и после кибератак, например, потери если данные будут зашифрованы программами-вымогателями. Кроме того, решения CDP, позволяющие при необходимости провести откат, очень полезны для организаций со строгими корпоративными правилами защиты данных.
Настоящий CDP и «почти» CDP
Существует два типа решений CDP. Решения с настоящим CDP (True CDP) создают резервные копии данных при каждом их изменении. Такие системы позволяют свести к нулю целевую точку восстановления» (Recovery Point Object, RPO), определяющую, данные за какой период теоретически могут быть потеряны, если произойдет авария. Иными словами, они полностью устраняют риск потери данных при авариях.
Решения »почти» CDP (Near CDP) выполняют резервное копирование по расписанию, как и при классической схеме резервного копирования, однако намного чаще. Обычно периодичность резервного копирования у Near CDP не более 15 мин, поэтому у этих решений RPO составляет несколько минут.
Как работает CDP
Сначала решение CDP создает полную резервную копию данных, которые надо защитить, а затем копирует любые изменения оригиналов данных («дельту»). Иногда такой алгоритм работы CDP называют вечным инкрементальным резервным копированием (incremental forever backup). На самом деле CDP периодически из этих инкрементальных копий формирует («синтезирует») новую полную резервную копию. Это делается для того, чтобы цепочка инкрементальных копий не была слишком длинной, и чтобы снизить риск того, что из-за ошибки одной из многочисленных инкрементальных копий нельзя будет восстановить данные.
Решения True CDP фиксируют каждую операцию записи данных в своем журнале, по которому в случае необходимости можно будет восстановить данные по их состоянию перед аварией или на какой-то момент в прошлом. Например, у системы CDP компании Zerto в журнале сохраняются изменения за последние 30 дней.
Чаще всего система CDP (сервер с соответствующим ПО) устанавливается в той же локальной сети, где установлены серверы приложений, данные которых требуется защитить. Если нужно обеспечить защиту данных и от крупных аварий или катастроф, при которых выйдет из строя или будет нарушена нормальная работа всей ИТ-инфраструктуры компании (например, наводнения или длительного обесточивания), то в схему CDP добавляется репликация резервных копий на удаленную площадку. При этом неизбежны задержки при копировании данных на большие расстояния, поэтому такое копирование выполняется периодически, а не непрерывно.
Чем отличается CDP от «мгновенных снимков» данных
Технология «мгновенных снимков» данных, или снапшотов, как следует из ее названия, позволяет сфотографировать данные в том состоянии, в котором они были в определенный момент времени, и при необходимости восстановить данные по этому мгновенному снимку. Снапшоты данных обычно генерируются несколько раз в день, поэтому RPO при использовании этого метода защиты составляет несколько часов, в то время как при использовании Near CDP этот показатель измеряется минутами, а «настоящий» CDP сокращает его до нуля. Таким образом, при использовании «мгновенных снимков» риски потери данных намного больше, чем при CDP.
Плюсы и минусы CDP
Технология непрерывной защиты данных по сравнению с классическим периодическим резервным копированием по расписанию и «мгновенными снимками» имеет много преимуществ:
- уменьшается риск потери данных;
- нет окна резервного копирования, поэтому не нужно останавливать приложения, чтобы сделать резервные копии;
- журналирование всех операций записи и копирования данных позволит сделать откат данных по состоянию на любой момент в прошлом;
- по журналу операций, который ведет CDP, можно отслеживать все транзакции данных для выполнения требований регулирующих органов и расследования инцидентов безопасности;
- возможно восстановление после крупных аварий и катастроф, если в схему CDP добавлена репликация резервных копий на удаленную площадку;
- возможно сохранение разных версий файлов, а не только последней;
- во многих решениях CDP реализована функция мгновенного восстановления виртуальных машин на резервном физическом сервере.
Наряду с преимуществами CDP имеет и свои недостатки. Во-первых, для внедрения CDP в качестве аппаратной платформы необходим мощный сервер с быстрыми дисками, что требует более высоких затрат по сравнению с обычной дисковой или ленточной библиотекой резервного копирования, поэтому такие решения выходят за пределы бюджета на ИТ небольших компаний.
Во-вторых, если на основной системе интенсивно выполняются операции записи или копирования данных, то трафик CDP может существенно увеличить нагрузку на локальную сеть. Кроме того, выполняемое CDP резервное копирование в реальном времени создает дополнительную нагрузку на основные системы и поэтому может замедлять производительность бизнес-приложений.
Кроме того, сервер, на котором работает ПО CDP, может стать единой точкой отказа (single point of failure), поскольку при его сбое, например, при выходе из строя вентилятора, контроллера дисковой подсистемы или сетевой карты, защита важных для бизнеса данных больше не будет работать. Кроме того, если алгоритм работы CDP окажется неправильно настроен, то по полной резервной копии и «дельтам» нельзя будет восстановить оригинал.
Где стоит использовать CDP
Системы CDP способны обеспечить защиту корпоративных данных любого типа, но чаще всего их используют для защиты:
- системных файлов (например, ОС и конфигураций серверов);
- ПО, которым постоянно пользуются сотрудники предприятия, и файлов приложений;
- данных или информации, которые создаются и используются приложениями;
- служебной информации, например, журналов серверов и платформ, и различных метрик работы компьютерных систем;
- баз данных.
В то же время из-за высокой стоимости решений CDP их не имеет смысл использовать для защиты данных, имеющих короткий жизненный цикл (это, например, данные интернета вещей) или не представляющих особой ценности для бизнеса (например, данные для тренировки алгоритмов машинного обучения).
Более экономичные решения Near CDP стоит применять для защиты тех данных, которые периодически изменяются, и их потеря в небольших объемах не нанесет серьезного ущерба бизнесу.