This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Up2date installation on HA killed slave

Hi

After investigating on how to do the Up2Date-installation in an active/passive HA environment I finally felt safe doing it.

15 minutes after clicking "Upgrade to latest version now" I ended up with a DEAD slave. Now it has passed 30 minutes and still the SLAVE is dead.

The log says:

2010:02:17-22:14:35 (none) ha_daemon[3539]: id="38A2" severity="error" sys="System" sub="ha" name="Node 2 died during up2date process!"
2010:02:17-22:14:35 (none) ha_daemon[3539]: id="38C1" severity="info" sys="System" sub="ha" name="Node 2 is dead, received no heart beats!"
2010:02:17-22:14:37 (none) slon_control[3668]: Killing slon reporting [21816]
2010:02:17-22:14:37 (none) slon_control[3668]: Killing slon pop3 [21817]
2010:02:17-22:14:45 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
2010:02:17-22:14:47 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
2010:02:17-22:14:56 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
2010:02:17-22:14:57 (none) slon_control[3668]: Slon reporting exited with value 0!
2010:02:17-22:14:57 (none) slon_control[3668]: Slon pop3 exited with value 0!
2010:02:17-22:14:59 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!" 


What am I doing wrong?


This thread was automatically locked due to age.
Parents
  • Unbelievable, it happened again...

    Today I was about to go from 7.507 to 7.511

    Exactly the same happened, it got stuck, node 2 is dead. I shows up in the log on and off:

    2011:07:12-19:42:51 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:19 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
    2011:07:12-19:43:33 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:36 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
    2011:07:12-19:43:38 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:43 rama-1 ha_daemon[3537]: id="38A0" severity="info" sys="System" sub="ha" name="Access granted to remote node 2!"
    2011:07:12-19:49:19 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"

    I cannot believe how shaky this software is. Anyone else experience this? I really hesitate to update Astaro since it hangs everytime I do it.
Reply
  • Unbelievable, it happened again...

    Today I was about to go from 7.507 to 7.511

    Exactly the same happened, it got stuck, node 2 is dead. I shows up in the log on and off:

    2011:07:12-19:42:51 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:19 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
    2011:07:12-19:43:33 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:36 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
    2011:07:12-19:43:38 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
    2011:07:12-19:43:43 rama-1 ha_daemon[3537]: id="38A0" severity="info" sys="System" sub="ha" name="Access granted to remote node 2!"
    2011:07:12-19:49:19 rama-1 ha_daemon[3537]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"

    I cannot believe how shaky this software is. Anyone else experience this? I really hesitate to update Astaro since it hangs everytime I do it.
Children
No Data