Восстановление в реальном времени - Real-time recovery
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
В информационные технологии, восстановление в реальном времени (RTR) - это возможность восстановить кусок ИТ-инфраструктура например, сервер от сбоя инфраструктуры или ошибки, вызванной человеком, в сроки, которые имеют минимальное влияние на бизнес-операции. При восстановлении в реальном времени основное внимание уделяется наиболее подходящей технологии восстановления, что сокращает Целевое время восстановления (RTO) в минуты, Цели точки восстановления (RPO) с точностью до 15 минут назад и минимизация целей тестового восстановления (TRO), то есть возможность тестировать и подтверждать правильность резервного копирования, не влияя на производственные системы.[нужна цитата ]
Восстановление в реальном времени - новый сегмент рынка в резервный, восстановление и аварийное восстановление рынок, который решает проблемы, с которыми компании исторически сталкивались в отношении защиты и, что более важно, восстановления своих данных.
Определение
Решение для восстановления в реальном времени должно содержать (как минимум) следующие атрибуты: Возможность восстановить сервер за несколько минут до такого же, совершенно другого или виртуального окружения с точностью до 5 минут назад и не требовать использования каких-либо дополнительных агентов. , варианты или модули для этого. Он должен иметь возможность восстанавливать файлы за секунды (в конце концов, единственная причина, по которой любые резервные копии - это возможность восстановления). Он должен выполнять резервное копирование на уровне секторов каждые 5 минут и иметь возможность самостоятельно восстанавливать нарушенную инкрементную цепочку резервных копий, если часть набора образов будет повреждена или удалена. Он должен обеспечивать улучшенную восстанавливаемость файлов данных и баз данных.
Классификация потери данных
Потерю данных можно разделить на три большие категории:
- Отказ оборудования сервера. Предотвратить отказ сервера очень сложно, но можно принять меры, чтобы избежать полного отказа сервера из-за использования резервных источников питания и наборов дисков RAID.
- Человеческая ошибка - эти бедствия являются основными причинами неудач. Человеческая ошибка и вмешательство могут быть преднамеренными или непреднамеренными, что может привести к серьезным сбоям, таким как потеря целых систем или файлов данных. Эта категория потери данных включает случайное стирание, забастовку, саботаж, кражу со взломом, вирус, вторжение и т. Д.
- Стихийные бедствия / террористические акты - хотя и нечасто, компании должны взвесить свой риск стихийных бедствий или террористических актов. Какую потерю данных готов или может терпеть бизнес.
Платформы для серверов данных
Серверы данных могут быть либо физическими хостами, либо запускаться как гостевые серверы в рамках платформы виртуализации, либо их комбинацией. В среде заказчика очень часто используются виртуальные и физические серверы. Здесь необходимо уделить внимание деталям подхода к защите данных на этих серверах через регулярные промежутки времени. Есть явные преимущества в выборе виртуальной или физической независимой технологии. Это ограничит количество технологий, которым организациям придется пройти обучение, освоить, приобрести, развернуть, управлять и поддерживать. В идеальном мире, если вы можете упростить управление несколькими продуктами для защиты вашей физической и виртуальной инфраструктуры, вы пожнете плоды. Технология, которая устанавливается на уровне операционной системы, обеспечивает согласованность в физической или виртуальной среде и устраняет ограничения совместимости API или структуры дискового тома (например, Raw Mapped Devices, VMFS).
Стратегии
Перед тем, как выбрать стратегию или решение восстановления в реальном времени, планировщик аварийного восстановления обратится к плану обеспечения непрерывности бизнеса своей организации для получения ключевых показателей целевой точки восстановления (RPO) и цель времени восстановления для различных бизнес-процессов (например, для расчета заработной платы, создания заказа, электронной почты и т. д.). Затем показатели, указанные для бизнес-процессов, должны быть сопоставлены с базовыми ИТ-системами и инфраструктурой, которые поддерживают эти процессы.
После того как целевое время восстановления и целевые показатели точки восстановления будут сопоставлены с ИТ-инфраструктурой, планировщик аварийного восстановления может определить наиболее подходящую стратегию восстановления для каждой системы. Бизнес в конечном итоге устанавливает ИТ-бюджет, и поэтому показатели RTO и RPO должны соответствовать доступному бюджету. Хотя идеальным вариантом является нулевая потеря данных и нулевая потеря времени, стоимость, связанная с таким уровнем защиты, исторически делала решения с высокой доступностью непрактичными и недоступными по цене. Стоимость решения для восстановления в реальном времени намного меньше, чем у предыдущих систем резервного копирования на магнитной ленте.