This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Sophos UTM HA Cluster Node wechselt in nicht bestimmbaren Intervallen auf "DEAD"

Guten Tag liebes Sophos Forum,

ich habe momentan ein Problem mit zwei verschiedenen HA-Clustern.

Der erste HA-Cluster ändert den Status in unregelmäßigen, nicht wirklich bestimmbaren Abständen auf "DEAD" (Firmware: 9.703-3, Sophos SG115). Der Cluster läuft mehrere Wochen ohne Probleme bis irgendwann ein Node "DEAD" ist.

Der zweite HA-Cluster ändert den Status eines Nodes nach einem Firmware-Update auf "DEAD" (Firmware: 9.705-3, Sophos SG115).

Die Logs besagen das der Node kein bzw. ein stark "wackelnden" Link und keine IP-Adresse erhält und aufgrund eines Timeouts dann als "DEAD" gekennzeichnet wurde. Weder die Neuinstallation der UTM, noch das rekonfigurieren des Cluster half das Problem zu lösen. Gibt es evtl. jemanden der das Problem ebenfalls hatte und dieses lösen konnte oder hat jemand noch eine Idee um das Problem zu lösen?

Folgend noch ein Logauszug:

020:10:24-10:11:27 sophos-***_daemon[4179]: id="38A3" severity="debug" sys="System" sub="ha" seq="M:  197 27.497" name="Netlink: Lost link beat on eth3!"
2020:10:24-10:11:39 sophos-***_daemon[4179]: id="38A3" severity="debug" sys="System" sub="ha" seq="M:  198 39.230" name="Netlink: Found link beat on eth3 again!"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38C1" severity="error" sys="System" sub="ha" seq="M:  199 40.266" name="up2date: Node 2 is dead, received no heart beats"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38A0" severity="info" sys="System" sub="ha" seq="M:  200 40.266" name="Executing (wait) /usr/local/bin/confd-setha mode master master_ip 198.19.250.1 slave_ip ''"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38A0" severity="info" sys="System" sub="ha" seq="M:  201 40.547" name="Executing (nowait) /etc/init.d/ha_mode topology_changed"

Vielen Dank für die Mithilfe.

Mit freundlichen Grüßen,

Julian Schreiner



This thread was automatically locked due to age.
Parents
  • Hallo Julian,

    sind die beiden SGs denn am "HA"-Anschluss direkt miteinander mittels LAN-Kabel verbunden?

    Mit freundlichem Gruß, best regards from Germany,

    Philipp Rusch

    New Vision GmbH, Germany
    Sophos Silver-Partner

    If a post solves your question please use the 'Verify Answer' button.

  • Guten Morgen Philipp,

    ja, die beiden SGs hängen direkt am HA Port zusammen, ohne Dritt-Gerät (Switch). Ergänzend wurde mir mittgeteilt, dass die Sophos UTM die dann als "DEAD" markiert wurde einmal testweise als "Haupt-UTM" ins Netzwerk gehängt wurde. (Die 2. Sophos UTM die nicht als "DEAD" markiet war - Also der Master wurde natürlich abgeklemmt). Daraufhin wurde von der Sophos in etwa 10 Sekunden Abschnitten gemeldet das die Verbindung zum WAN verloren geht.

    Mit freundlichen Grüßen,

    Julian Schreiner

  • Genau das darf man nicht tun: "testweise" HA umklemmen und dann wieder anklemmen.

    Danach kann man HA komplett zurücksetzen und muss neu anfangen.

    Mit freundlichem Gruß, best regards from Germany,

    Philipp Rusch

    New Vision GmbH, Germany
    Sophos Silver-Partner

    If a post solves your question please use the 'Verify Answer' button.

  • Hallo Philipp,

    ich habe wie oben genannt momentan 2 Fälle dieser Art, einen Fall kann ich nun erstmal ausnehmen, da hier noch ein Switch zwischen dem HA besteht, der erstmal entfernt werden muss.

    Beim 2. Fall (wo dieser Test durchgeführt wurde) ist mir noch nicht ganz schlüssig, ob er nach dem Status "Active - Dead" durchgeführt wurde oder danach. Das müsste ich erstmal erfragen.

    Mit freundlichen Grüßen,

    Julian Schreiner

Reply
  • Hallo Philipp,

    ich habe wie oben genannt momentan 2 Fälle dieser Art, einen Fall kann ich nun erstmal ausnehmen, da hier noch ein Switch zwischen dem HA besteht, der erstmal entfernt werden muss.

    Beim 2. Fall (wo dieser Test durchgeführt wurde) ist mir noch nicht ganz schlüssig, ob er nach dem Status "Active - Dead" durchgeführt wurde oder danach. Das müsste ich erstmal erfragen.

    Mit freundlichen Grüßen,

    Julian Schreiner

Children
No Data