Cloud Disaster Recovery – Sicher durch den Sturm

Datum: 14.05.2020

Disaster Recovery in der CloudDisaster Recovery ist ein überlebenswichtiger Bestandteil der Business-Continuity-Strategie. Lange Zeit war DR mit hohen Kosten verbunden, doch die Digitalisierung hat auch hier neue Möglichkeiten eröffnet. Disaster-Recovery-as-a-Service liefert innovative Antworten darauf, wie Umsatzeinbußen effektiv minimiert werden können.

Wie es zum Crash kommen kann

Ein Crash der IT-Infrastruktur kann das gesamte Unternehmen gefährden. IT-Verantwortliche und Management sollten sich deshalb eher früher als später mit Datensicherung und Disaster Recovery auseinandersetzen. Es kann jedem Unternehmen passieren. Und nur wer sich auf den Fall der Fälle vorbereitet, kann den entstehenden Schaden minimieren.

Bei „Disaster“ denkt man als Erstes an Erdbeben oder Sturmfluten. Oder an Tornados, die laut Deutschem Wetterdienst in Folge des Klimawandels künftig stärker ausfallen sollen. Aber schon unaufmerksame oder frustrierte Mitarbeiter können viel Schaden anrichten. Ein Kurzschluss im Serverraum durch eindringende Feuchtigkeit, ein Feuer im Rechenzentrum, ein Stromausfall oder der Ausfall der Kühlung kann unter widrigen Umständen schwere Konsequenzen haben.

Angriffe über das Internet nehmen zu: Über den Mail-Eingang können sich Viren im Netzwerk ausbreiten. Phishing-Attacken verschaffen Hackern Zutritt. Ransomware verschlüsselt geschäftskritische Daten, die man nur nach Zahlung eines Lösegelds entschlüsseln kann. Diese Gefahren sind auch der Grund, warum Failover-Anwendungen, die Hochverfügbarkeit sicherstellen sollen, nicht ausreichen. Der automatisierte Backup- und Wiederherstellungsprozess stellt zwar den letzten Stand wieder her, aber eben inklusive Viren und Ransomware, die schon Wochen vorher das System befallen haben.

Je länger der Ausfall anhält, desto höher sind die Umsatzeinbußen und die Kosten summieren sich. Ist die Website nicht erreichbar, wechseln potenzielle Kunden zur Konkurrenz. Gehen Daten verloren, wird das Unternehmen mitunter Monate zurückgeworfen. Der mögliche Reputationsverlust bei Kompromittierung von Kundendaten ist enorm, womöglich von Dauer. Nicht eingehaltene Verträge haben Schadensersatzzahlungen zur Folge.

Disaster Recovery im Einsatz

Wie sichert man sich am besten gegen die Folgen eines Crashs ab? Zu allererst stellt man den IST-Zustand fest. Wenn man weiß, welche Geräte, Anwendungen, virtuelle Maschinen, Datenbanken und Cloud-Dienste genutzt werden, folgen Risikoabschätzung und Priorisierung. Auf der Basis bestimmt man die Häufigkeit der Sicherung und die Reihenfolge der Wiederherstellung. Für den Ernstfall wird der Disaster-Recovery-Plan vorbereitet und durchgetestet.

Ist-Zustand feststellen

Bei der Feststellung des IST-Zustands wird die Unternehmens-IT mit all ihren Abhängigkeiten erfasst. Wer nicht weiß, an welchem Ort sich welche Daten befinden, kann sie nicht sichern. Auch Shadow IT der Fachabteilungen kann von Admins schwerlich gesichert werden. Die Feststellung des IST-Zustands bietet die Chance, auch andere Probleme anzugehen und die IT-Infrastruktur zu konsolidieren.

Sicherung und Wiederherstellung planen

Vor der Durchführung der Sicherung stellt sich die Frage, welches System, in welchem Turnus gesichert werden soll. Der KPI Recovery Point Objective (RPO) bestimmt den zeitlichen Abstand der Datensicherungen. Er zeigt auf, welcher Datenverlust im Fall von Crash und Recovery akzeptabel ist. Dafür werden die Kosten des Verlusts mit den Kosten der Datensicherung in Bezug gesetzt. Über den RPO-Wert weiß man, wie viel Zeit zwischen zwei Sicherungen vergehen darf, und wieviele Daten man bei der Wiederherstellung maximal verlieren würde.

Wieviel ein Systemausfall kostet, lässt sich mit Hilfe des KPI Recovery Time Objective (RTO) bestimmen. RTO zeigt die Kosten auf, die ein Systemausfall in einer bestimmten Zeit verursacht. Mit Hilfe dieses Key Performance Indicators kann man die Reihenfolge der Wiederherstellung festlegen. Je mehr Kosten der Ausfall verursachen würde, desto höher die Priorität bei der Wiederherstellung. Entsprechend können auch die Datenträger für die Sicherung bestimmt werden. Mit manchen lassen sich Daten schneller wiederherstellen als mit anderen.

Je kürzer der Sicherungsturnus und die Wiederherstellungsdauer ausfallen, desto aufwändiger ist die Disaster-Recovery-Lösung und desto mehr Kosten fallen an. Die Cloud bildet hier eine Ausnahme. Obwohl sie die RTO bis hin zur Dauer eines Klicks auf „Wiederherstellen“ reduzieren kann, kostet sie weniger als on-premises Lösungen.

Disaster Recovery-Plan testen

Disaster Recovery im EinsatzDer Disaster Recovery Plan soll nach dem Ernstfall die schnellstmögliche Wiederherstellung ermöglichen. Wichtig ist, dass der Disaster Recovery Plan auch funktioniert. Dafür muss er getestet werden:

  • Funktionieren die Abläufe?
  • Sind die Fachabteilungen eingebunden?
  • Auch dann, wenn manche Beteiligte krank sind?
  • Braucht es Zertifizierungen von Herstellern, z.B. SAP?
  • Inwieweit ist die DSGVO berücksichtigt?
  • Wird die eingesetzte Hypervisor-Technologie von der DR-Lösung unterstützt?
  • Kann alles, was gesichert wurde, auch wiederhergestellt werden?
  • Gibt es Wege, den Prozess zu beschleunigen?

Disaster Recovery as a Service

DRaaS vs. DR on-premises

On-premises ist auch deshalb so kostspielig, weil ein großer Teil der IT-Infrastruktur doppelt vorgehalten werden muss. Oder sogar dreifach, wenn man testen will, ob das Disaster Recovery wirklich funktioniert, ohne dabei das Produktivsystem zu gefährden. Diese Überkapazitäten lassen sich durch skalierbare Cloud-Lösungen vermeiden.

Oft werden auch mehrere über das Unternehmen verteilte Backup-Systeme eingesetzt. Das verursacht höhere Wartungskosten und führt zu Unsicherheit, ob wirklich alle geschäftskritischen Daten und Anwendungen abgedeckt sind.

Gegenüber der Strategie DR on-premises zu realisieren bietet Disaster Recovery in der Cloud viele Vorteile:

  • Der ganzheitliche Ansatz führt dazu, dass alle relevanten Daten und Anwendungen einbezogen werden.
  • Die Investitionen sind sehr niedrig und Betriebskosten fallen über die Laufzeit verteilt an.
  • Die Wiederherstellung der gesicherten Daten und Anwendungen kann per Knopfdruck in Self-Service-Tools erfolgen.
  • Die Produktivinstanz ist von der DR-Infrastruktur sicher getrennt.
  • Nur die tatsächlich verwendeten Cloud-Ressourcen werden in Rechnung gestellt.
  • Das Testing ist kostengünstig, da Ressourcen schnell hochskaliert und direkt wieder freigegeben werden können, sobald sie nicht mehr gebraucht werden.
  • Durch häufiges Testing wird die Wahrscheinlichkeit eines erfolgreichen und vollständigen Recovery-Prozesses erhöht.
  • Für den Anfang kann man DRaaS auch nur als zusätzlichen Standort für geschäftskritische Daten und Anwendungen nutzen, als ersten Schritt in die Cloud.

DRaaS-Angebote

Es gibt verschiedene Angebote für Disaster Recovery in der Cloud:

  • Beim DR Self Service ist man völlig unabhängig vom Anbieter. Man muss aber auch alle Aufgaben selbst übernehmen, d.h. entsprechendes Personal beschäftigen.
  • Bei Assisted DR gibt der Serviceanbieter Hilfestellung beim Betrieb. Es findet eine Aufgabenteilung statt, die im SLA festgehalten wird.
  • Managed DR nimmt dem Unternehmen am meisten Arbeit ab. Der Service-Provider kümmert sich um den kompletten Betrieb. Das Disaster Recovery wird outgesourct.

DRaaS-Strategien in der Cloud

Zusammenfassend gilt es zwischen drei grundsätzlichen DR-Strategien in der Cloud zu unterscheiden.

  • Der full-managed Ansatz mit einem vertrauensvollen Partner
  • Der assist Ansatz mit einem flexiblen und im Störfall gut erreichbaren Partner
  • Der self-service Ansatz mit einem beliebigen Cloud Anbieter

Unabhängig von der Wahl des entsprechenden Ansatzes ist es dringend angeraten, die Infrastruktur des Anbieters auf Herz und Nieren zu überprüfen und nach Möglichkeit mit dem auserwählten Anbieter auch einmal den Disaster-Recovery Fall gemeinsam zu diskutieren.

Mögliche Fragestellungen könnten auf die Art und Weise der Datenspeicherung abzielen um beispielsweise zu gewährleisten, dass in einem Fehlerfall die benötigten Daten auch zu 100% zur Verfügung stehen und benutzbar sind. Genauso wichtig sind regelmäßige Probedurchläufe, um zu gewährleisten, dass der vorbereitete DR-Workload startet und bspw. die benötigten IT-Services ohne Verzögerung bereitstehen.

Lade dir jetzt kostenlos unser ePaper „Krise ohne Stillstand – Business Continuity & Cloud Computing“ herunter und erfahre mehr darüber, wie du auch in Krisenzeiten sicher durch den Sturm kommst!

Zurück zur Übersicht