This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Sophos UTM HA Cluster Node wechselt in nicht bestimmbaren Intervallen auf "DEAD"

Guten Tag liebes Sophos Forum,

ich habe momentan ein Problem mit zwei verschiedenen HA-Clustern.

Der erste HA-Cluster ändert den Status in unregelmäßigen, nicht wirklich bestimmbaren Abständen auf "DEAD" (Firmware: 9.703-3, Sophos SG115). Der Cluster läuft mehrere Wochen ohne Probleme bis irgendwann ein Node "DEAD" ist.

Der zweite HA-Cluster ändert den Status eines Nodes nach einem Firmware-Update auf "DEAD" (Firmware: 9.705-3, Sophos SG115).

Die Logs besagen das der Node kein bzw. ein stark "wackelnden" Link und keine IP-Adresse erhält und aufgrund eines Timeouts dann als "DEAD" gekennzeichnet wurde. Weder die Neuinstallation der UTM, noch das rekonfigurieren des Cluster half das Problem zu lösen. Gibt es evtl. jemanden der das Problem ebenfalls hatte und dieses lösen konnte oder hat jemand noch eine Idee um das Problem zu lösen?

Folgend noch ein Logauszug:

020:10:24-10:11:27 sophos-***_daemon[4179]: id="38A3" severity="debug" sys="System" sub="ha" seq="M:  197 27.497" name="Netlink: Lost link beat on eth3!"
2020:10:24-10:11:39 sophos-***_daemon[4179]: id="38A3" severity="debug" sys="System" sub="ha" seq="M:  198 39.230" name="Netlink: Found link beat on eth3 again!"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38C1" severity="error" sys="System" sub="ha" seq="M:  199 40.266" name="up2date: Node 2 is dead, received no heart beats"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38A0" severity="info" sys="System" sub="ha" seq="M:  200 40.266" name="Executing (wait) /usr/local/bin/confd-setha mode master master_ip 198.19.250.1 slave_ip ''"
2020:10:24-10:11:40 sophos-***_daemon[4179]: id="38A0" severity="info" sys="System" sub="ha" seq="M:  201 40.547" name="Executing (nowait) /etc/init.d/ha_mode topology_changed"

Vielen Dank für die Mithilfe.

Mit freundlichen Grüßen,

Julian Schreiner



This thread was automatically locked due to age.
  • Hello Emmanuel,

    sorry, i can't answer this because i'am not configured or connected this Sophos UTM in this Office. I'm just try to helping out to fix the Problem with HA. Is there any obvious entries in the logs, that says a failure because of that? If yes, that can be the reason why a completly System reimage with backup restore didn't help.

    Regards,

    Julian Schreiner

  • Let's take them some photos with the mobile.

    Mit freundlichem Gruß, best regards from Germany,

    Philipp Rusch

    New Vision GmbH, Germany
    Sophos Silver-Partner

    If a post solves your question please use the 'Verify Answer' button.

  • Hallo Julian,

    Herzlich willkommen hier in der Community !

    (Sorry, my German-speaking brain isn't creating thoughts at the moment.

    Agreed with Philipp that somethings not right here.  Please show a picture of the HA configuration.

    MfG - Bob (Bitte auf Deutsch weiterhin.)

     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hello and good morning everyone,

    sorry for the late answer. The customer "try something else" to fix the Problem. He don't want to take a picture for now. I don't know why. I will inform you when i get new informations.

    Thank you for your Support.

    Best Regards,

    Julian Schreiner