Mindmap-Galerie Alibaba Cloud Hochverfügbarkeitsdienst AHAS
Der Application High Availability Service (kurz AHAS) konzentriert sich auf die Verbesserung der Hochverfügbarkeit von Anwendungen durch die Funktion der multiaktiven Notfallwiederherstellung (kurz MSHA) und bietet Funktionen wie Datenverkehrseingang, Anwendungsschicht sowie Daten-Failover und Fehlerübungen von innerstädtischen und überregionalen Cloud-Diensten verbessert die Stabilität.
Bearbeitet um 2024-01-20 08:44:41Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
Alibaba Cloud Hochverfügbarkeitsdienst AHAS
Produkteinführung
Der Application High Availability Service ist ein SaaS-Produkt, das sich auf die Verbesserung der Hochverfügbarkeitsfunktionen von Anwendungen konzentriert. Es umfasst hauptsächlich drei unabhängige Funktionsmodule: multiaktive Notfallwiederherstellung, Fehlerübungen und Verkehrsschutz. Der Verkehrsschutz wurde auf den Microservice-Governance-Dienst MSE migriert.
Funktionen und Nutzungsszenarien
Multiaktive Notfallwiederherstellung
Multi-Site High Availability MSHA (Multi-Site High Availability) ist eine Multi-Site-Disaster-Recovery-Architekturlösung, die in der E-Commerce-Geschäftsumgebung von Alibaba entwickelt wurde. Sie kann Geschäftswiederherstellung und Fehlerwiederherstellung entkoppeln und verfügt über eine flexible, regelbasierte Planung. Domänen- und cloudübergreifende Verwaltung und Kontrolle, Datenschutz und andere Funktionen, um bei Ausfallszenarien eine schnelle Geschäftswiederherstellung sicherzustellen und Unternehmen beim Aufbau einer Disaster-Recovery-Stabilität zu unterstützen.
Arbeitsprozess
Die Multi-Active-Disaster-Recovery-MSHA-Architektur unterteilt das Unternehmen in drei Schichten: Zugriffsschicht, Anwendungsschicht und Datenschicht. Die Anwendungsschicht kann in mehrere Funktionsdomänen wie Microservice-Aufruf und Messaging unterteilt werden Komponenten, Verwaltung und Steuerung verfügen über umfassende Multiaktivitätsverwaltungs- und Steuerungsfunktionen basierend auf jeder Komponentenschicht.
Szenen, die verwendet werden sollen
Die Architektur Katastrophentoleranz Anwendbare Szene Mehr Leben in der gleichen Stadt RPO: Fehler auf regionaler Ebene sind unkontrollierbar; Fehler auf Computerraumebene dauern zwischen Sekunden und Minuten. RTO: Fehler auf regionaler Ebene sind unkontrollierbar; Fehler auf Computerraumebene treten innerhalb von Minuten bis zehn Minuten auf. veranschaulichen Die konkrete Situation hängt von der Verzögerung bei der Synchronisierung von Primär- und Sekundärdaten ab. Das Budget ist begrenzt und eine externe Notfallwiederherstellung wird nicht in Betracht gezogen. Rechnen Sie mit einer kurzen Bauzeit (≤2 Wochen). Erwarten Sie keine Änderung des Geschäftscodes. Datenkonsistenzprobleme werden nicht berücksichtigt. Aktiv-Aktiv-Remote-Anwendung RPO: Minuten. RTO: Minuten bis zehn Minuten. veranschaulichen Die konkrete Situation hängt von der Verzögerung bei der Synchronisierung von Primär- und Sekundärdaten ab. Entscheiden Sie sich für die Einrichtung eines Rechenzentrums an einem anderen Standort für die Notfallwiederherstellung. Es wird erwartet, dass die Ressourcen des Backup-Centers nicht im Leerlauf sind und der Datenverkehr aktiv-aktiv erfolgt. Akzeptieren Sie regionale Netzwerkverzögerungen. Erwarten Sie keine oder weniger Änderungen am Geschäftscode. Datenkonsistenzprobleme werden nicht berücksichtigt. Im Vergleich zu Remote-Multiaktivität erfordert diese Lösung keine Verkehrskennzeichnung und Routing-Fehlerkorrektur. Remote aktiv-aktiv RPO: Minuten. RTO: Minuten bis zehn Minuten. veranschaulichen Die konkrete Situation hängt von der Verzögerung bei der Synchronisierung von Primär- und Sekundärdaten ab. Wenn Sie über ausreichend Budget verfügen, entscheiden Sie sich für den Bau eines multiaktiven Rechenzentrums an einem externen Standort. Akzeptieren Sie eine lange Bauzeit (3 bis 6 Monate). Kann geeignete Dimensionen auswählen, um den Datenverkehr weiterzuleiten und Daten-Sharding durchzuführen. Akzeptieren Sie die Transformation der Geschäftsverkehrskennzeichnung, die Geschäftscodekennzeichnung und Middleware-Upgrades. Akzeptieren Sie, dass die Daten irgendwann konsistent sein werden.
Fehlerbehebung
Fault Drill ist ein Produkt, das den experimentellen Prinzipien des Chaos Engineering folgt und die internen Praktiken von Alibaba berücksichtigt. Es bietet umfassende Fehlerszenario-Implementierungen und kann verteilten Systemen helfen, Fehlertoleranz und Wiederherstellbarkeit zu verbessern.
Verfahren
Die Fehlerübung legt eine Reihe von Standardübungsverfahren fest, einschließlich der Vorbereitungsphase, der Ausführungsphase, der Inspektionsphase und der Wiederherstellungsphase. Durch einen vierstufigen Prozess deckt es den kompletten Bohrprozess des Anwenders von der Planung bis zur Sanierung ab und wird dem Anwender durch Visualisierung anschaulich dargestellt.
Anwendbare Szene
Fehlerübungen können auf die folgenden typischen Szenarien angewendet werden:
Messung der Fehlertoleranz von Microservices.
Überprüfen Sie, ob die Container-Orchestrierungskonfiguration sinnvoll ist.
Testen Sie, ob die PaaS-Schicht robust ist.
Überprüfen Sie die Aktualität der Überwachungsalarme.
Notfallfähigkeit, Probleme zu lokalisieren und zu lösen.