Die Mean Time to Clean Recovery ersetzt RPOs und RTOs als Kennzahl für Cyberresilienz
Statement von Marc Molyneux, Field CTO, Commvault
24 oder 5 – diese Zahlen drücken das Dilemma traditioneller Backup- und Disaster-Recovery-Ansätze aus: Die Geschäftsführung geht davon aus, dass Systeme und Daten spätestens nach fünf Tagen wieder online sind. Im Schnitt dauert es aber laut einer GigaOM-Commvault-Umfrage 24 Tage. Dieser Diskrepanz fällt nicht nur das Vertrauen in die Fähigkeiten der IT-Teams zum Opfer, sondern auch die Umsätze oder sogar das ganze Unternehmen.
Am World Backup Day kann es also nicht mehr nur um schnelle Backups auf Knopfdruck mit einem überschaubaren Restore-Aufwand gehen. Backup und Disaster Recovery bleiben weiter essenziell wichtig, sie sind aber nur der allerletzte Schritt einer komplex orchestrierten Choreografie, um die Unternehmens-IT auch während einer Cyberattacke funktionsfähig zu halten.
Den Hauptgrund, dass eine Standard-Recovery heute nicht mehr ausreicht, liefern die Cyberkriminellen: Backup-Systeme sind für sie ein begehrtes Ziel. Denn die Angreifer wissen, dass Ransomware wirkungslos bleibt, solange Unternehmen auf diese Rückversicherung zugreifen können. Aktuelle Expertenanalysen deuten darauf hin, dass Hacker durchschnittlich über 200 Tage in Opfernetzwerken bleiben, um Dutzende von Systemen und damit auch Backup-Datensätze zu manipulieren.
Wer Backup-Datensätze nur mechanisch wiederherstellt, um die verlangten RTO- und RPO-Werte einzuhalten, stellt auch Backdoors, implementierte Malware-Codes und Fake Accounts der Hacker mitsamt ihrer hohen Zugriffsrechte wieder her. IT-Teams starten danach erneut ganz von vorne und müssen entscheiden, wie weit sie in der Zeit zurückgehen, um ein sauberes Backup zu finden. All das unter hohem Zeitdruck.
Den World Cyber Resilience Day ausrufen
Cyberangriffe mit einer solchen Verweildauer erfordern neue Qualitätskriterien für eine cyberresiliente Recovery. Die Verantwortlichen für IT-Sicherheit und IT-Infrastruktur müssen pauschale RTO- und RPO-Diskussionen hinter sich lassen und den Gesamtprozess Cyberresilienz betrachten. Neue Maßstäbe entscheiden über die Qualität der Recovery. Aussagekräftig ist nun die notwendige Zeit bis zur vollständigen, funktionsfähigen und sauberen Wiederherstellung von Daten: die Mean Time to Clean Recovery (MTCR). Im Wesentlichen bemisst die MTCR die durchschnittliche Dauer, um kritische Geschäftsanwendungen und die jeweiligen Systeme, Infrastrukturen und zugehörigen sauberen, validierten Daten nach einem Angriff wiederherzustellen.
Eile mit Weile
Zahlreiche Faktoren senken die MTCR. Voraussetzung sind Air-Gap-Backups, die die Sicherungen isoliert, remote und für Hacker unsichtbar vorhalten. Im Ernstfall müssen dann SecOps und IT Ops Daten in einem digitalen, bei Bedarf neu geschaffenen Cleanroom nach Angriffsartefakten durchsuchen und anschließend zunächst in einer isolierten Umgebung wieder einspielen. Dieser Umweg kostet Zeit und Ressourcen. Aber Nachhaltigkeit in der Wiederherstellung ist nur auf diesem Wege zu realisieren. IT Sicherheits- und Infrastrukturteams müssen während der laufenden Attacke eng zusammenarbeiten, um die Integrität der Daten zu untersuchen, bevor man Backups wieder einspielt.
Wer diesem Ansatz folgt, wird die Weite seiner im Ernstfall bestehenden Verfügbarkeits- und Resilienzlücke zutreffend vermessen und mit dem C-Level realistische Szenarien besprechen können. Er wird die Argumente finden, um die vorhandene Backup-Struktur mit Blick auf eine echte Cyber-Resilienz-Umgebung zu modernisieren.

