In diesem Artikel erklärt Ihnen Katharina Karner, Senior Systems Consultant bei Axians, wofür die beiden Metriken RPO und RTO stehen, worin sie sich unterscheiden und wie sie in der Praxis sinnvoll eingesetzt werden. Ziel ist es, Klarheit zu schaffen – und konkrete Orientierung für die Umsetzung zu geben.
Wenn es um Hochverfügbarkeit in der IT geht, spielen zwei Kennzahlen eine zentrale Rolle: RPO und RTO. Sie helfen Unternehmen dabei, Risiken zu bewerten, Wiederherstellungsstrategien zu planen und ihre IT-Systeme widerstandsfähiger zu machen. I
RPO
Recovery Point Objective (RPO) ist nicht nur im Bereich der Hochverfügbarkeit ein zentraler Begriff, sondern auch in der Datensicherung. Er beschreibt den maximal tolerablen Zeitraum, in dem Datenverlust auftreten kann, bevor er signifikante Auswirkungen auf das Unternehmen hat. Einfach ausgedrückt: RPO gibt an, wie viel Datenverlust ein Unternehmen im Falle eines Ausfalls oder einer Störung akzeptieren kann.
Berechnung und Anwendung
Die Berechnung des RPO hängt von verschiedenen Faktoren ab: Die Art der Daten, die Geschäftskritikalität und die Häufigkeit der Datensicherungen oder HA-Lösung. Ein kürzeres RPO bedeutet, dass häufiger Backups durchgeführt werden müssen oder gegebenenfalls eine HA-Lösung eingesetzt werden muss. Ein längeres RPO ist kostengünstiger, bedeutet jedoch, dass mehr Daten verloren gehen können.
Ein Beispiel aus der Praxis
Ein Transportdienstleister für Lebensmittel führt täglich eine Sicherung durch. Im Worst-Case-Szenario kann es zu einem Ausfall des Systems kurz vor der nächsten Tagessicherung und damit dem Verlust der Daten eines ganzen Arbeitstages kommen. Das wiederum bedeutet, dass Lieferungen an Kunden aufgrund von fehlenden Lieferpapieren nicht durchgeführt werden können. Die Summe aus Warenverlust und Pönalen, die sich aus dem Bruch diverser Vertragsklauseln ergeben, ist beträchtlich. Die folglich logische Konsequenz ist der Einsatz einer Hochverfügbarkeitslösung.
In jedem Fall sollte überlegt werden, welche Daten im Katastrophenfall verloren gehen – und wie diese Daten wiederhergestellt werden können. Ist manuelles Nacharbeiten möglich? Sind Aufzeichnungen auf anderen Ebenen vorhanden und können die Daten in einem entsprechenden Zeitraum wiederhergestellt werden?
Technologische Umsetzung
Um ein bestimmtes RPO zu erreichen, können verschiedene Technologien und Strategien eingesetzt werden:
Synchrones und Asynchrones Journaling: Beim synchronen Journaling werden Daten in Echtzeit auf ein Backup-System geschrieben, was zu einem RPO von nahezu null führt. Beim asynchronen Journaling wird nicht auf die Rückmeldung vom fernen Server gewartet, was zumindest zu einem RPO ungleich null führt. HA-Softwarelösungen setzen üblicherweise auf asynchrones Journaling.
Snapshots und Replikation: Snapshots sind Momentaufnahmen des Datenbestands zu einem bestimmten Zeitpunkt. Durch regelmäßige Snapshots kann ein Unternehmen sicherstellen, dass es immer auf eine relativ aktuelle Version der Daten zugreifen kann. Hier bestimmt der Abstand der Snapshots die RPO. Die Replikation von Daten auf ein entferntes System per Hochverfügbarkeit führt zu einer niedrigen RPO.
Regelmäßige Tests: Es ist wichtig, regelmäßig Tests der Backup- und Wiederherstellungsprozesse durchzuführen, um sicherzustellen, dass die festgelegten RPOs tatsächlich erreicht werden können. Das hilft dabei, Schwachstellen zu identifizieren und Prozesse kontinuierlich zu verbessern.
Fazit
Der Recovery Point Objective (RPO) ist ein entscheidender Faktor für die Datensicherung und Notfallwiederherstellung. Er hilft Unternehmen, die maximale Menge an Datenverlust zu bestimmen, die sie im Falle eines Ausfalls tolerieren können. Durch die Implementierung geeigneter Technologien und Strategien können Unternehmen sicherstellen, dass sie ihre RPO-Ziele erreichen und somit ihre Geschäftskontinuität gewährleisten.
RTO
Recovery Time Objective (RTO) ist der zweite wichtige Begriff im Bereich der IT-Notfallwiederherstellung. Er beschreibt die maximale Zeitspanne, die ein System, eine Anwendung oder ein Prozess nach einem Ausfall benötigen darf, um wieder betriebsbereit zu sein – ohne, dass es zu erheblichen Schäden für das Unternehmen kommt.
RTO hilft Unternehmen, jene Zeit zu bestimmen, die sie benötigen, um nach einem Vorfall wieder normal zu arbeiten. Ein kürzeres RTO bedeutet, dass Systeme schneller wiederhergestellt werden müssen, was oft höhere Kosten und komplexere Wiederherstellungsprozesse mit sich bringt.
Die Festlegung eines geeigneten RTO ist entscheidend für die Entwicklung einer effektiven Desaster-Recovery-Strategie und erfordert eine sorgfältige Analyse der Geschäftsanforderungen und der Risikobereitschaft. Hier empfehle ich nicht nur den Blick auf die IT-Landschaft zu legen, sondern auch die Kommunikationswege innerhalb des Unternehmens zu beleuchten. Welche Abteilungen oder ferne Standorte arbeiten außerhalb der Dienstzeiten der IT-Abteilung? Sind hier Regelwerke vorhanden, sodass eine Bereitschaft erreicht werden kann?
Nach Analyse der RPO- und RTO-Zeiten ist ein ausführliches Gespräch mit Ihrem IT-Dienstleister sinnvoll, um die für Sie optimale Strategie auszuarbeiten.
Quelle: AxiansWeitere Informationen zu Axians finden Sie hier.
Quelle: Axians
