This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

All devices Offline

Hello

Just an hour ago, our provider changed a card on a device on our side. Not because it failed, but because it's new and better hard- and sowftware.

But since the replacement, ACC shows all devices as offline. Everything works fine again, except ACC.

Already rebooted ACC twice, nothing. Restarted ACC agent on two ASG's manually over WeAdmin, nothing. Even the Firewall which is connected to the same Network as the ACC is not able to connect to it.

First the ASG's showed "Login Successful" in the ACC message box. Now, it always shows "starting '/usr/sbin/acc-agent.plx'" (in meantime it also shows Successfull again sometimes). When trying to connect to the port 4433 of the ACC with telnet, it connects, but does not gives back anything. It's just hanging and hanging. Don't know if it should give back something when connecting with telnet.

Then wanted to connect with SSH, connection timeout... (But WebAdmin works just fine and fast)

Looked at the "Process List" in WebAdmin. "accd" is running at 60-95% (since 20 minutes now)

I think i remember, that i already had such a problem with ACC in the past, and just have to wait some time (maybe some hours). But that would be very bad on a productional system.

Here some output from the ACC client log on a firewall:
2010:10:21-07:38:12 fw20 device-agent[25901]: We are now connected (ip=11.12.13.14, port=4433).
2010:10:21-07:38:12 fw20 device-agent[25901]: (ec) Connection to remote ACC established.
2010:10:21-07:38:12 fw20 device-agent[25901]: Init iWatcher dropping file 0 '/etc/raid/status'.
2010:10:21-07:38:12 fw20 device-agent[25901]: Login complete.
2010:10:21-07:38:12 fw20 device-agent[25901]: Creating Watcher (timer) for 'weekly' -> 3600
2010:10:21-07:38:12 fw20 device-agent[25901]: _create_time_watcher: Event->timer( weekly, 3600 )
2010:10:21-07:38:12 fw20 device-agent[25901]: Creating Watcher (timer) for 'monthly' -> 43200
2010:10:21-07:38:12 fw20 device-agent[25901]: _create_time_watcher: Event->timer( monthly, 43200 )
2010:10:21-07:38:12 fw20 device-agent[25901]: Creating Watcher (timer) for 'yearly' -> 172800
2010:10:21-07:38:12 fw20 device-agent[25901]: _create_time_watcher: Event->timer( yearly, 172800 )
2010:10:21-07:38:12 fw20 device-agent[25901]: Creating Watcher (timer) for 'daily' -> 900
2010:10:21-07:38:12 fw20 device-agent[25901]: _create_time_watcher: Event->timer( daily, 900 )
2010:10:21-07:38:12 fw20 device-agent[25901]: Done subscribing
2010:10:21-07:51:54 fw20 device-agent[25901]: Write failed after 510000 retries. Could not send data for over 1 Minute.
2010:10:21-07:52:55 fw20 device-agent[25901]: Write failed after 1020000 retries. Could not send data for over 2 Minutes.
2010:10:21-07:53:56 fw20 device-agent[25901]: Write failed after 1520000 retries. Could not send data for over 3 Minutes. Giving up.
2010:10:21-07:53:56 fw20 device-agent[25901]: >=========================================================================
2010:10:21-07:53:56 fw20 device-agent[25901]: RaiseError called. 'main'
2010:10:21-07:53:56 fw20 device-agent[25901]: 'acc-agent.pl'
2010:10:21-07:53:56 fw20 device-agent[25901]: 1384
2010:10:21-07:53:56 fw20 device-agent[25901]: .
2010:10:21-07:53:56 fw20 device-agent[25901]: 


07:38 was the last time i rebooted ACC.

After last reboot, the most of the ASG's were shown as online, maybe for 30 seconds or so, then all changed to offline.

Thanks for you help
Urs


This thread was automatically locked due to age.
  • Patch your ACC - HowTo

    Login your ACC via SSH as 'root' and enter following commands - confirm each command with ENTER:

    cd /home/login/
    wget http://people.astaro.com/svogt/cm-chroot-accd-2.2-219.i686.rpm
    /var/mdw/scripts/accd stop
    rpm -Uvh --force cm-chroot-accd-2.2-219.i686.rpm
    /var/mdw/scripts/accd start
  • Hi i'm trying solve  the proble  but not work for  me.
    take a look to the output

    > ACC:/home/login # /var/mdw/scripts/accd stop
    > :: Stopping ACC core daemon                                          done
    > ACC:/home/login # rpm -Uvh --force cm-chroot-accd-2.2-219.i686.rpm
    > Preparing...                ########################################### [100%]
    >    1:cm-chroot-accd         ########################################### [100%]
    > chown: changing ownership of `/tmp/sh': No such file or directory
  • Please ignore that line "chown: changing ownership of `/tmp/sh': No such file or directory"

    Finally start your ACC: /var/mdw/scripts/accd start
  • Patch your ACC - HowTo

    Login your ACC via SSH as 'root' and enter following commands - confirm each command with ENTER:

    cd /home/login/
    wget http://people.astaro.com/svogt/cm-chroot-accd-2.2-219.i686.rpm
    /var/mdw/scripts/accd stop
    rpm -Uvh --force cm-chroot-accd-2.2-219.i686.rpm
    /var/mdw/scripts/accd start


    Thank you! My ACC is now usable again.

    Ronny
  • I can´t download the file.
    I have the same Problem. CPU shows 100%. All devices are offline.
    Can anyone tell me, where i can download the file??
  • I just checked. The file is there and can be downloaded.

    Please make sure you don't copy and paste the text, but the link.
    (link has been abbreviated in the text)

    Here is the complete link (without abbreviation):

       [noparse]people.astaro.com/.../noparse]
  • Hi friends,

    same problem for me since long time. I was informed about this thread in one of the last technical workshop on astaro. I´ve download an test it now for 2 weeks without problems.

    For documentation:
    By me i have only the "crash" when connected an v8.002 to the acc v2.2. If the central management was disabled on this versions of maschines, the acc works without problems.

    cu

  • By me i have only the "crash" when connected an v8.002 to the acc v2.2. If the central management was disabled on this versions of maschines, the acc works without problems.


    This is correct. The problem occurs with V8.002 machines only. It is fixed with the ACC rpm which is linked in this thread. And the problem does not occur with V7 ASGs and ASGs with beta V8.055 or later.
  • i have aplied the patch as described - and all ASG V8, AMG V7 and AWG V7 Devices are online again
    but all my ASG 7.50x devices stay offline

    any succestions?
  • Hi potsdam,

    this is strange since we didn't observed this in the context of the problem discussed in this thread.

    You may have encountered a different problem. The main symptom of the problem here is that all devices are shown offline though the problem was originally caused by a V8 device. Furthermore the accd process then has a cpu usage about 100 %.

    Could you please check the cpu usage of the accd process and could you please ensure whether the respective devices are reachable from the ACC by pinging them?

    Regards, Hakan