Business Continuity
Onesurance gewährleistet die Kontinuität kritischer Versicherungsdienste durch redundante Infrastruktur, dokumentierte DR-Verfahren und regelmäßige Tests. Unser Business-Continuity-Programm ist DORA-konform und auf die Anforderungen der Versicherungsbranche abgestimmt.
Business Continuity auf einen Blick
- 95% Uptime SLA — Garantierte Verfügbarkeit innerhalb des Service Window
- Taegliche Backups — Vollständige tägliche Backups mit 30 Tagen Aufbewahrung
- Multi-AZ-Redundanz — Azure Multi-Zone-Deployment für hohe Verfügbarkeit
- DORA-konform — Erfüllt die Anforderungen des Digital Operational Resilience Act
Kontinuitätsstrategie
Onesurance verfolgt eine mehrschichtige Business-Continuity-Strategie, die darauf ausgelegt ist, die Auswirkungen von Störungen zu minimieren und eine schnelle Wiederaufnahme der Dienste zu gewährleisten.
High Availability
Unsere Infrastruktur läuft auf Azure Multi-Zone innerhalb der West-Europe Region. Das bedeutet, dass unsere Dienste über mehrere physisch getrennte Rechenzentren (Availability Zones) verteilt sind. Wenn eine Zone ausfällt, übernehmen die übrigen Zonen automatisch ohne Unterbrechung des Dienstes.
Backup-Strategie
- Taegliche Vollbackups — Jeden Tag wird ein vollständiges Backup aller kritischen Systeme und Daten erstellt
- 30 Tage Aufbewahrung — Backups werden mindestens 30 Tage für Point-in-Time-Recovery aufbewahrt
- Transaction-Log-Backups — Alle 10 Minuten werden Transaction Logs gesichert für minimalen Datenverlust
Disaster-Recovery-Verfahren
Alle DR-Verfahren sind vollständig dokumentiert und jährlich getestet. Der DR-Plan umfasst Szenarien für Datenverlust, Dienstausfall und Sicherheitsvorfälle.
GRC-Plattform
Onesurance nutzt Eramba als Governance-, Risiko- und Compliance-Plattform (GRC). Darin werden alle Business-Continuity-Pläne, Risiken, Kontrollen und Testergebnisse zentral verwaltet und überwacht.
Disaster-Recovery-Plan
Unser DR-Plan beschreibt die Verfahren zur Wiederherstellung von Diensten nach einer Störung. Der Plan wird jährlich getestet und auf Basis der Testergebnisse und sich ändernder Geschäftsanforderungen aktualisiert.
Backup-Strategie (Detail)
| Typ | Frequenz | Aufbewahrung | Beschreibung |
|---|---|---|---|
| Vollbackup | Taeglich | 30 Tage | Vollständiges Backup aller Datenbanken, Konfigurationen und Anwendungsdaten |
| Differentielles Backup | Alle 24 Stunden | 30 Tage | Änderungen seit dem letzten Vollbackup |
| Transaction Log | Alle 10 Minuten | 30 Tage | Kontinuierliche Transaktionsprotokolle für Point-in-Time-Recovery |
Recovery-Verfahren
Bei Ausfall einer Availability Zone wird der Datenverkehr automatisch zu den verfügbaren Zonen umgeleitet. Azure Load Balancer erkennt den Ausfall und routet den Verkehr innerhalb von Sekunden um. Kein manueller Eingriff für Zone-Level-Failover erforderlich.
Dank Transaction-Log-Backups alle 10 Minuten kann die Datenbank zu jedem beliebigen Zeitpunkt innerhalb der Aufbewahrungsfrist von 30 Tagen wiederhergestellt werden. Dies minimiert Datenverlust bei versehentlicher Löschung, Korruption oder anderen Vorfällen.
Bei einem vollständigen Dienstausfall wird der Wiederherstellungsprozess aus dem aktuellsten Backup gestartet. Infrastructure-as-Code ermöglicht den vollständigen Neuaufbau der Umgebung. Ziel ist die vollständige Dienstwiederherstellung innerhalb von 24 Stunden, kritische Dienste innerhalb von 4 Stunden.
Kundenkommunikationsplan
Bei einer Störung mit Kundenauswirkungen wird das folgende Kommunikationsprotokoll befolgt:
- Erste Meldung — Kunden werden innerhalb von 1 Stunde über die Störung und die erwarteten Auswirkungen informiert
- Status-Updates — Regelmäßige Updates über den Fortschritt der Wiederherstellung
- Post-Incident-Bericht — Nach Wiederherstellung erhalten Kunden einen vollständigen Bericht mit Ursache, Auswirkungen und ergriffenen Maßnahmen
RTO- & RPO-Ziele
Recovery Time Objective (RTO) und Recovery Point Objective (RPO) definieren unsere Wiederherstellungsziele bei einer Störung.
Recovery Time Objective (RTO)
| Dienst | RTO | Erlaeuterung |
|---|---|---|
| Kritische Dienste | <4 Stunden | Kernfunktionalität für Versicherungsprozesse, einschließlich Policenverwaltung und Schadenbearbeitung |
| Vollständige Dienste | <24 Stunden | Alle Funktionalität einschließlich Berichte, Dashboards und nicht-kritische Module |
Recovery Point Objective (RPO)
Formelles RPO: <24 Stunden
Das formelle RPO ist auf weniger als 24 Stunden festgelegt, gemäß den SLA-Vereinbarungen mit Kunden und DORA-Anforderungen.
Tatsächliches RPO: ~10 Minuten
Dank Transaction-Log-Backups alle 10 Minuten ist der tatsächliche Datenverlust bei einem Vorfall auf maximal circa 10 Minuten begrenzt.
Service Window
Unterstütztes Service Window: Montag bis Freitag, 08:30 - 17:30 CET.
Ausserhalb des Service Window wird das Monitoring fortgesetzt. Kritische Vorfälle (P1) werden auch ausserhalb der Geschäftszeiten über das Eskalationsprotokoll bearbeitet. Geplante Wartungsarbeiten finden ausserhalb des Service Window statt, mit vorheriger Benachrichtigung der Kunden.
Tests & Validierung
Der Business-Continuity-Plan wird regelmäßig getestet und validiert, um die Wirksamkeit zu gewährleisten. Testergebnisse werden in Eramba dokumentiert und führen zu konkreten Verbesserungsmaßnahmen.
Jährlicher DR-Test
Mindestens einmal jährlich führen wir einen vollständigen Disaster-Recovery-Test durch. Dabei wird der Wiederherstellungsprozess Ende-zu-Ende durchlaufen, einschließlich Kundenvalidierung der wiederhergestellten Umgebung.
Testszenarien
Datenverlust
Simulation einer versehentlichen Löschung oder Korruption von Daten. Test von Point-in-Time-Recovery und Verifizierung der Datenintegrität nach Wiederherstellung.
Dienstausfall
Simulation eines vollständigen Ausfalls eines oder mehrerer Dienste. Test von Failover-Mechanismen und manuellen Wiederherstellungsverfahren.
Sicherheitsvorfall
Simulation eines Sicherheitsvorfalls mit Auswirkungen auf die Verfügbarkeit. Test der Zusammenarbeit zwischen IRT und DR-Team.
Kapazitätsplanung
- Quartalsreview — Jedes Quartal wird die Kapazität aller Systeme basierend auf aktuellem Verbrauch und Wachstumserwartungen bewertet
- Proaktive Skalierung — Bei erwartetem Wachstum wird die Kapazität rechtzeitig hochskaliert, um Engpässe zu vermeiden
Cloud-Ausfall-Reaktion
Bei einer Azure-Plattformstörung wird innerhalb von <15 Minuten das Eskalationsprotokoll aktiviert. Das Team überwacht das Azure Service Health Dashboard, kommuniziert proaktiv mit Kunden und leitet bei Bedarf manuelle Failover-Verfahren ein.
Personelle Kontinuität
- Backup-Rollen — Fuer jede kritische Funktion ist mindestens eine Backup-Person benannt und geschult
- Wissenstransfer — Verfahren sind dokumentiert, sodass Backup-Personal eigenständig handeln kann
- Cross-Training — Teammitglieder werden regelmäßig in Aufgaben ausserhalb ihrer primären Rolle geschult
Fragen zur Business Continuity?
Unser Datenschutzbeauftragter hilft Ihnen gerne bei Fragen zu unseren Kontinuitätsplänen, DR-Verfahren oder Verfügbarkeitsgarantien.