This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

[ASG 7.302 / 7.303] "ACC device agent not running - restarted"

Hello,

I have 4 ASGs running v7.302 and 2 running 7.303.
I don't know when/why it started, but since last week, I get one mail from every ASG, every 2 hours. Subject is: "ACC device agent not running - restarted"

Does anybody else have the same problem?


This thread was automatically locked due to age.
Parents
  • Which mode is it running in, 1.400 or 1.900?  I've got many units still on 1.400 and I haven't seen this problem yet.

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Sophos Platinum Partner

    --------------------------------------

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • The ACC is v1.900, and the ASGs are also set to "ACC V1.9"
  • So they are running the "nexgen-agent" ... hmm.  I know they updated the ACC agents in 7.303 ... but it appears you're having the problems with 7.302 and 7.303 agents.  Have you looked at the agent logfiles on the ASG units?  Any clues there?

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Sophos Platinum Partner

    --------------------------------------

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • Sorry, I forgot to meantion that I had temporarily shut down the ACC-server. I guess that's when the mess started... But even after rebooting the ACC-server and all ASGs, those error-messages did not stop.

    I found out that the "device agent" log-file is responsible for the "ACC device agent". (why isn't it called "ACC device agent"-log? well, anyway...)
    The device agent log says:
    |----------------------------------------------------------------------|
    2008:10:21-09:18:18 (none) device-agent[29412]:   Recieved 0 bytes (eof).
    2008:10:21-09:18:18 (none) device-agent[29412]: >=========================================================================
    2008:10:21-09:18:18 (none) device-agent[29412]:   RaiseError called. 'main'
    2008:10:21-09:18:18 (none) device-agent[29412]: 'acc-agent.pl'
    2008:10:21-09:18:18 (none) device-agent[29412]: 1283.
    2008:10:21-09:18:19 (none) device-agent[29412]: This morning, I shut down the ACC-server for testing. That's why it's complaining. But why is it dying? About 10 minutes after the ACC-server-shutdown, I received a notification mail from all ASGs, that the ACC device agent was restarted.

    selfmon.log says:
    |----------------------------------------------------------------------|
    2008:10:21-09:25:36 (none) selfmonng[3142]: I check Failed increment nextgen-agent_running counter 1 - 3
    2008:10:21-09:25:41 (none) selfmonng[3142]: I check Failed increment nextgen-agent_running counter 2 - 3
    2008:10:21-09:25:46 (none) selfmonng[3142]: W check Failed increment nextgen-agent_running counter 3 - 3
    2008:10:21-09:25:46 (none) selfmonng[3142]: W NOTIFYEVENT Name=nextgen-agent_running Level=INFO Id=136 sent
    2008:10:21-09:25:46 (none) selfmonng[3142]: W triggerAction: 'cmd'
    2008:10:21-09:25:46 (none) selfmonng[3142]: W actionCmd(+):  '/var/mdw/scripts/nextgen-agent restart'
    2008:10:21-09:25:46 (none) selfmonng[3142]: W child returned status: exit='0' signal='0'
    |----------------------------------------------------------------------|

    Well, I'll report this to Astaro support.
Reply
  • Sorry, I forgot to meantion that I had temporarily shut down the ACC-server. I guess that's when the mess started... But even after rebooting the ACC-server and all ASGs, those error-messages did not stop.

    I found out that the "device agent" log-file is responsible for the "ACC device agent". (why isn't it called "ACC device agent"-log? well, anyway...)
    The device agent log says:
    |----------------------------------------------------------------------|
    2008:10:21-09:18:18 (none) device-agent[29412]:   Recieved 0 bytes (eof).
    2008:10:21-09:18:18 (none) device-agent[29412]: >=========================================================================
    2008:10:21-09:18:18 (none) device-agent[29412]:   RaiseError called. 'main'
    2008:10:21-09:18:18 (none) device-agent[29412]: 'acc-agent.pl'
    2008:10:21-09:18:18 (none) device-agent[29412]: 1283.
    2008:10:21-09:18:19 (none) device-agent[29412]: This morning, I shut down the ACC-server for testing. That's why it's complaining. But why is it dying? About 10 minutes after the ACC-server-shutdown, I received a notification mail from all ASGs, that the ACC device agent was restarted.

    selfmon.log says:
    |----------------------------------------------------------------------|
    2008:10:21-09:25:36 (none) selfmonng[3142]: I check Failed increment nextgen-agent_running counter 1 - 3
    2008:10:21-09:25:41 (none) selfmonng[3142]: I check Failed increment nextgen-agent_running counter 2 - 3
    2008:10:21-09:25:46 (none) selfmonng[3142]: W check Failed increment nextgen-agent_running counter 3 - 3
    2008:10:21-09:25:46 (none) selfmonng[3142]: W NOTIFYEVENT Name=nextgen-agent_running Level=INFO Id=136 sent
    2008:10:21-09:25:46 (none) selfmonng[3142]: W triggerAction: 'cmd'
    2008:10:21-09:25:46 (none) selfmonng[3142]: W actionCmd(+):  '/var/mdw/scripts/nextgen-agent restart'
    2008:10:21-09:25:46 (none) selfmonng[3142]: W child returned status: exit='0' signal='0'
    |----------------------------------------------------------------------|

    Well, I'll report this to Astaro support.
Children
  • Hi,

    let me just step in here, support will forward the issue to us anyway [;)]

    Logfile: 


    • the logfile is named device-agent.log because of historical reasons, e.g. it has always been named this way and we do not introduce any spaces in filenames
    • the logfile can be easily viewed and identified from the WebAdmin where you have the information that it belongs to the ACC device-agent

    Dying device notifications:


    • if you shut down the ACC but keep your agents running, they will try for a certain amount of time to reconnect, but will eventually give up and exit
    • they will then be raised again by the selfmonitor which causes the notification to be send
    • we will increase the notification interval so you will not get pestered by too many notifications, but if you do not want to get anymore notifications you need to properly shutdown the agents on the respective devices

    Why are your devices unable to connect?


    • did you change the IP address of the ACC?
    • did you change the allowed networks setting for connecting devices on the ACC?
    • do you have an intermediate firewall/ASG between the other ASGs and the ACC which requires some DNAT?

    Regards,
    Henning
  • Hmmm, I have got the same problem...
    BUt it seems to come very regular...
    Every 90 minutes one ACC Agent restarted mail is sent to my BB... [[:(]][[:(]]

    ACC Version 1.9

    and no, I did not change any IP adresses or something else...
  • Guys,

    joining the lamentation efforts is not helping. The agent is not restarting because it has nothing else to do. If you want us to help you please post some logfile snippet and a bit more information on your infrastructure and configuration.

    Thanks and regards