This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Up2date installation on HA killed slave

Hi

After investigating on how to do the Up2Date-installation in an active/passive HA environment I finally felt safe doing it.

15 minutes after clicking "Upgrade to latest version now" I ended up with a DEAD slave. Now it has passed 30 minutes and still the SLAVE is dead.

The log says:

2010:02:17-22:14:35 (none) ha_daemon[3539]: id="38A2" severity="error" sys="System" sub="ha" name="Node 2 died during up2date process!"
2010:02:17-22:14:35 (none) ha_daemon[3539]: id="38C1" severity="info" sys="System" sub="ha" name="Node 2 is dead, received no heart beats!"
2010:02:17-22:14:37 (none) slon_control[3668]: Killing slon reporting [21816]
2010:02:17-22:14:37 (none) slon_control[3668]: Killing slon pop3 [21817]
2010:02:17-22:14:45 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
2010:02:17-22:14:47 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!"
2010:02:17-22:14:56 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Lost link beat on eth5!"
2010:02:17-22:14:57 (none) slon_control[3668]: Slon reporting exited with value 0!
2010:02:17-22:14:57 (none) slon_control[3668]: Slon pop3 exited with value 0!
2010:02:17-22:14:59 (none) ha_daemon[3539]: id="38A3" severity="debug" sys="System" sub="ha" name="Netlink: Found link beat on eth5 again!" 


What am I doing wrong?


This thread was automatically locked due to age.
Parents
  • I had a similar issue this evening when I applied the 7.503 update, the master pushed the update to the slave, slave got stuck in the up2date cycle, then barfed and halted.  Factory reset was required to bring it back.
    Second time (after the rebuild) it worked fine [:)]
  • I have  the standard backup files from webadmin, but no other than that. Is there special backup file for the slave that I missed?

    With factory reset I take it you have an appliance? We run on Supermicro servers. But do you mean, reinstall the whole server and restore the backup file with the Astaro configuration?

    If so, which version should I install? 7.503? 7.301 (dont have that one...)?
Reply
  • I have  the standard backup files from webadmin, but no other than that. Is there special backup file for the slave that I missed?

    With factory reset I take it you have an appliance? We run on Supermicro servers. But do you mean, reinstall the whole server and restore the backup file with the Astaro configuration?

    If so, which version should I install? 7.503? 7.301 (dont have that one...)?
Children
No Data