Почему важно знать время восстановления после отказа?
Предсказать будущую катастрофу практически невозможно, но, к счастью, подготовиться к ней и принять решение о последствиях для организации становится все проще. Для этого необходимо ответственно подойти к определению таких элементов, как RTO и RPO. Это два очень разных элемента, которые следует тщательно учитывать при разработке плана обеспечения непрерывности бизнеса:
- Целевое время восстановления (RTO) — это целевое время между сбоем и моментом, когда операции возобновляются. RTO представляют собой количество времени, в течение которого приложение может быть недоступно и не нанести значительного ущерба бизнесу, а также время, необходимое системе для перехода от потери к восстановлению. Этот процесс восстановления включает в себя шаги, которые ИТ-специалисты должны предпринять, чтобы вернуть приложение и его данные в состояние до аварии. Для приложений с высоким приоритетом rto disaster recovery можно безопасно выразить в секундах, если при внедрении данного решения была выложена крупная сумма.
- Целевая точка восстановления (RPO) — это максимально допустимый период времени, в течение которого данные могут быть восстановлены, что может означать или не означать потерю данных. Это возраст файлов или данных в резервном хранилище, необходимый для возобновления нормальной работы в случае сбоя компьютерной системы или сети.
Обе метрики измеряют время и жизненно важны для эффективного аварийного восстановления. И то, и другое требует всестороннего планирования и упреждающего подхода к безопасности, но между RTO и RPO есть несколько заслуживающих внимания различий:
- Время восстановления после отказа концентрируется на восстановлении приложений и инфраструктуры, а RPO — исключительно на частоте резервного копирования и допустимых потерях данных.
- RTO учитывает все аспекты бизнес-структуры и всего процесса аварийного восстановления. RPO оценивает только критичность данных и стоимость репликации.
- RTO — более сложный процесс из двух, поскольку он включает в себя больше движущихся частей и переменных (горячие и холодные сайты, отказоустойчивость, выездные группы реагирования и т. д.).
- RPO в значительной степени зависит от автоматизации резервного копирования и восстановления данных, в то время как RTO включает больше ручных задач и более практичный подход к восстановлению.
- RPO легче рассчитать, поскольку метрика охватывает только один аспект процесса восстановления — данные.
- Низкие RPO намного дешевле, чем низкие RTO из-за значительной разницы в масштабах.
Разобраться во всем этом не имея специальных знаний практически невозможно. По этой причине лучше всего обратиться в IT-Solutions.