In einem Failover-Cluster übernimmt der aktive Knoten zusätzlich die Failover IP Adresse auf seine Netzwerkkarte
Fällt der aktive Knoten aufgrund einer Störung aus, übernimmt der sekundäre Knoten die Failover IP Adresse, wird dadurch zum aktiven Knoten und ist für die anderen Netzwerkkomponenten wie z.B. Firewall und Mail Server weiterhin unter dieser IP-Adresse erreichbar
Eine Umkonfiguration der IP-Adresse entfällt.
Das Heartbeat Netzwerk wird über die beiden sekundären LAN-Interfaces (LAN 2) der Appliances mittels eines gekreuzten Patchkabels hergestellt.
Beide Appliances überwachen mit einem regelmäßigen Impuls (Heartbeat), ob die andere Appliance noch ordnungsgemäß reagiert.
Falls die primäre Appliance nicht mehr reagiert, übernimmt die sekundäre Appliance alle Datenressourcen und startet die erforderlichen Dienste (Engine und Datenbank).
Im Falle einer Ressourcenübernahme (Failover) oder bei Ausfall einer Appliance erfolgt eine Benachrichtigung an den Administrator.
Verständlicherweise besteht in Unternehmen vermehrt der Wunsch einer Ausfallsicherheit.
Diese können wir auch mit der REDDOXX Appliance im Cluster Modus erfüllen.
Allerdings ist hier die Architektur und Umgebung für einen sinnvollen Einsatz des Clusters entscheidend.
Wir Empfehlen den Cluster Modus für REDDOXX Appliances, wenn beide Appliances als Hardware betrieben werden.
Mischbetrieb zwischen Virtueller Maschine und Hardware, oder gar VM + VM im Cluster empfehlen wir hingegen nicht und raten davon explizit ab.
Damit das Cluster reibungslos funktioniert, ist eine direkte Heartbeat Verbindung ohne zwischenliegende Switche notwendig.
Dies ist insbesondere im virtuellen Umfeld so nicht realisierbar und kann dazu führen, dass die Cluster Nodes z.B.
in einen Split Brain Zustand geraten, bei denen beide Nodes der Meinung sind, dass der andere Node ausgefallen ist.
Ein Split Brain Zustand kann entstehen, wenn durch einen kurzzeitigen Ausfall oder eine Nicht-Erreichbarkeit (dropped Packages) keine oder nur eine verzögerte Antwort über das Heartbeat Netz erfolgt.
Daraufhin stellt der andere Cluster Knoten fest, dass die Verbindung gestört ist und geht davon aus, dass der Cluster Partner ein Problem hat.
Daraus können sich dann unter Umständen schwerwiegende Folgefehler ergeben, die kontraproduktiv zum eigentlichen Einsatzzweck des Clusters stehen.