This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Device flapping between Online and Offline

Hi,

we have running a SUM Version 4.300-4 with now 6 devices connected.
The newest device SG210 (Version: 9.312-8) is flapping between Online and Offline all the time.

I already disabled the SUM-Management on the SG Device and deleted it from SUM. When I enabled the Management again but the problem is still their.

This is the log from the SG210:

2015:06:25-14:02:10 sg2 device-agent[6464]: Starting logging output (level=2 [2])...
2015:06:25-14:02:10 sg2 device-agent[6464]: Set minimal required sum version to: 4.2
2015:06:25-14:02:10 sg2 device-agent[6464]: /usr/sbin/acc-agent.plx starting as daemon.
2015:06:25-14:02:10 sg2 device-agent[6464]: /usr/sbin/acc-agent.plx has started with PID=6464 ()-
2015:06:25-14:02:10 sg2 device-agent[6464]: Initializing global queues...
2015:06:25-14:02:10 sg2 device-agent[6464]: ---- Output Options ----
2015:06:25-14:02:10 sg2 device-agent[6464]: TRACE -> 0
2015:06:25-14:02:10 sg2 device-agent[6464]: DEBUG -> 1
2015:06:25-14:02:10 sg2 device-agent[6464]: INFO -> 2
2015:06:25-14:02:10 sg2 device-agent[6464]: WARN -> 3
2015:06:25-14:02:10 sg2 device-agent[6464]: ERROR -> 6
2015:06:25-14:02:10 sg2 device-agent[6464]: CRIT -> 8
2015:06:25-14:02:10 sg2 device-agent[6464]: Current Level is: 2
2015:06:25-14:02:10 sg2 device-agent[6464]: INFO messages are displayed
2015:06:25-14:02:10 sg2 device-agent[6464]: WARN messages are displayed
2015:06:25-14:02:10 sg2 device-agent[6464]: ERROR messages are displayed
2015:06:25-14:02:10 sg2 device-agent[6464]: CRIT messages are displayed
2015:06:25-14:02:10 sg2 device-agent[6464]: Clearing cache object.
2015:06:25-14:02:10 sg2 device-agent[6464]: Init cache.
2015:06:25-14:02:10 sg2 device-agent[6464]: Using confd system_id as GUID.
2015:06:25-14:02:10 sg2 device-agent[6464]: Failed to get local object:REF_DefaultHTTPCFFProfile
2015:06:25-14:02:11 sg2 device-agent[6464]: Updating Location...
2015:06:25-14:02:11 sg2 device-agent[6464]: Updating Features...
2015:06:25-14:02:11 sg2 device-agent[6464]: Updating Product...
2015:06:25-14:02:11 sg2 device-agent[6464]: Updating Inventory...
2015:06:25-14:02:13 sg2 device-agent[6464]: Initializing Module AggregatedReporting
2015:06:25-14:02:13 sg2 device-agent[6464]: Initializing roles
2015:06:25-14:02:13 sg2 device-agent[6464]: Connecting to confd...
2015:06:25-14:02:13 sg2 device-agent[6464]: Initializing cache...
2015:06:25-14:02:13 sg2 device-agent[6464]: Initializing intervals
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for ip from 2160 to 2160
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for services from 3 to 3
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for availability_ha from 10 to 10
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for license_count from 10 to 10
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for availability_ups from 10 to 10
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for license_subscriptions from 100 to 100
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for monitoring_vpn from 9 to 9
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for check_connections from 2 to 2
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for remove_old_downloads from 12 to 12
2015:06:25-14:02:13 sg2 device-agent[6464]: Attempt to set update interval for '/etc/raid/status', which does not exist
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/log/reporting/accu/mailsec.accu from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /etc/sysmond.ph from 30 to 30
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/log/reporting/accu/pfilter.accu from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/log/reporting/accu/websec-json.accu from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/up2date/up2date_progress from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/log/reporting/accu/admin.accu from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /etc/agent/live_debug from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /etc/selfmon.ph from 30 to 30
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /var/log/reporting/accu/ipsevent.accu from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /etc/up2date/up2date_status from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for /etc/location from 0 to 0
2015:06:25-14:02:13 sg2 device-agent[6464]: Initialization complete
2015:06:25-14:02:13 sg2 device-agent[6464]: Connecting to SUM
2015:06:25-14:02:13 sg2 device-agent[6464]: Creating new SUM connection with id [1]
2015:06:25-14:02:13 sg2 device-agent[6464]: Updating SUM IP address for path: acc/server1/server
2015:06:25-14:02:13 sg2 device-agent[6464]: [1] Connecting to SUM (ip=10.***.***.***, port=4433).
2015:06:25-14:02:13 sg2 device-agent[6464]: [1] Using SUM SSL connection.
2015:06:25-14:02:13 sg2 device-agent[6464]: [1] We are now connected (ip=10.***.***.***, port=4433).
2015:06:25-14:02:13 sg2 device-agent[6464]: Connection to remote SUM established.
2015:06:25-14:02:13 sg2 device-agent[6464]: Starting watchers...
2015:06:25-14:02:13 sg2 device-agent[6464]: Starting connection...
2015:06:25-14:02:13 sg2 device-agent[6464]: Entering event loop...
2015:06:25-14:02:13 sg2 device-agent[6464]: SUM ehlo notification from [1]
2015:06:25-14:02:13 sg2 device-agent[6464]: Found SUM version 4.300004. Treating it as release 4.3.
2015:06:25-14:02:13 sg2 device-agent[6464]: Full SUM support is granted as the current SUM version isn't lower than the minimal required SUM version of: 4.2
2015:06:25-14:02:13 sg2 device-agent[6464]: Using confd system_id as GUID.
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting minimum notify wait for '/etc/sysmond.ph' to 60
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting minimum notify wait for '/etc/selfmon.ph' to 60
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for availability_ups from 10 to 20
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for license_subscriptions from 100 to 200
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for monitoring_vpn from 9 to 18
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for services from 3 to 6
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for ip from 2160 to 4320
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for availability_ha from 10 to 20
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting update interval for license_count from 10 to 20
2015:06:25-14:02:13 sg2 device-agent[6464]: 'login successful, welcome to duty'.
2015:06:25-14:02:13 sg2 device-agent[6464]: Login complete for [1].
2015:06:25-14:02:13 sg2 device-agent[6464]: Updating Location...
2015:06:25-14:02:13 sg2 device-agent[6464]: Setting available subscriptions for product 'ASG'
2015:06:25-14:02:13 sg2 device-agent[6464]: Creating Watcher (timer) for 'weekly' -> 14400
2015:06:25-14:02:13 sg2 device-agent[6464]: Creating Watcher (timer) for 'monthly' -> 43200
2015:06:25-14:02:13 sg2 device-agent[6464]: Creating Watcher (timer) for 'yearly' -> 86400
2015:06:25-14:02:13 sg2 device-agent[6464]: Creating Watcher (timer) for 'daily' -> 900
2015:06:25-14:02:13 sg2 device-agent[6464]: Done subscribing
2015:06:25-14:02:13 sg2 device-agent[6464]: Starting deployment.
2015:06:25-14:02:22 sg2 device-agent[6464]: >=========================================================================
2015:06:25-14:02:22 sg2 device-agent[6464]: _AgentTermHandler -> '' -> 'Agent::Config::Global'
2015:06:25-14:02:22 sg2 device-agent[6464]: '/Agent/Config/Global.pm'
2015:06:25-14:02:22 sg2 device-agent[6464]: 497 


The other 5 devices are all working fine.
Any Ideas?


This thread was automatically locked due to age.
  • Hi,

    We have the same problem.

    SUM version 4300-4

    UTM version 9305-4 work properly

    UTM version 9309-3 enters the behavior described above
  • I did some additional tests. 
    When I disable the option "Configuration" with the SUM-Options, the connection is stable.
    After enabling it again it came back flapping. I disable the Auto-Deployment option for the objects OU within SUM. The connection is stable again.

    Now I also recognized, that opening the definitions on SUM is also unbelievable slow...
    We have round about 700 objects running at networks, hosts, etc. In the past the speed was not the bast, but ok. Now I need to wait more that 30 seconds until I can work in the definitions options. CPU, memory and all the stuff looks good.

    I checked the log httpd log file on the SUM to ensure waht happens there:
    2015:06:29-14:14:11 sum httpd[15662]: [fastcgi:error] [pid 15662] [client 10.10.3.104:55996] FastCGI: incomplete headers (0 bytes) received from server "/var/acc/webadmin.plx", referer: https://sum.***.de:4422/
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:13:54 +0200] "POST /webadmin.plx HTTP/1.1" 500 518
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 440
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 274
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 313
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 1457
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 314
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "POST /webadmin.plx HTTP/1.1" 200 94262
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "GET /wfe/acc/js/dynamic_includes/_tableObjItem_network.min.js?rnd=0.3748787778017851 HTTP/1.1" 404 254
    2015:06:29-14:14:11 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:11 +0200] "GET /wfe/acc/js/dynamic_includes/_tableObjItem_network.js?rnd=0.48805321309390986 HTTP/1.1" 200 3369
    2015:06:29-14:14:15 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:12 +0200] "POST /webadmin.plx HTTP/1.1" 200 290
    2015:06:29-14:14:48 sum httpd[15594]: [fastcgi:error] [pid 15594] [client 10.10.3.104:56006] FastCGI: comm with server "/var/acc/webadmin.plx" aborted: idle timeout (30 sec), referer: https://sum.***.de:4422/
    2015:06:29-14:14:48 sum httpd[15594]: [fastcgi:error] [pid 15594] [client 10.10.3.104:56006] FastCGI: incomplete headers (0 bytes) received from server "/var/acc/webadmin.plx", referer: https://sum.***.de:4422/
    2015:06:29-14:14:48 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:16 +0200] "POST /webadmin.plx HTTP/1.1" 500 518
    2015:06:29-14:14:50 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:49 +0200] "POST /webadmin.plx HTTP/1.1" 200 293
    2015:06:29-14:14:51 sum httpd[15594]: [:error] [pid 15594] [client 10.10.3.104:56009] FastCGI: server "/var/acc/webadmin.plx" stderr: Use of uninitialized value $form_name in concatenation (.) or string at /core/modules/core_grids.pm line 567., referer: https://sum.***.de:4422/
    2015:06:29-14:14:51 sum httpd[15594]: [:error] [pid 15594] [client 10.10.3.104:56009] FastCGI: server "/var/acc/webadmin.plx" stderr: Use of uninitialized value $form_name in concatenation (.) or string at /core/modules/core_grids.pm line 567., referer: https://sum.***.de:4422/
    2015:06:29-14:14:51 sum httpd[15594]: [:error] [pid 15594] [client 10.10.3.104:56009] FastCGI: server "/var/acc/webadmin.plx" stderr: Use of uninitialized value $form_name in concatenation (.) or string at /core/modules/core_grids.pm line 567., referer: https://sum.***.de:4422/
    2015:06:29-14:14:51 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:50 +0200] "POST /webadmin.plx HTTP/1.1" 200 2271
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_dropzone.js?rnd=0.7821182131902817 HTTP/1.1" 200 314
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_list.js?rnd=0.8861494876071652 HTTP/1.1" 200 288
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_toggle.js?rnd=0.6776887151410352 HTTP/1.1" 200 514
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_dropdown.js?rnd=0.3339490307842381 HTTP/1.1" 200 1846
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_text.js?rnd=0.04075256147038864 HTTP/1.1" 200 510
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_checkbox.js?rnd=0.64339746093467 HTTP/1.1" 200 541
    2015:06:29-14:14:54 sum httpd: 10.10.3.104 - - [29/Jun/2015:14:14:54 +0200] "GET /core/js/dynamic_includes/_formInput_toggle_end.js?rnd=0.08354826961286393 HTTP/1.1" 200 183
    2015:06:29-14:13:54 sum httpd[15893]: [fastcgi:error] [pid 15893] [client 10.10.3.104:55988] FastCGI: incomplete headers (0 bytes) received from server "/var/acc/webadmin.plx", referer: https://sum.***.de:4422/Jun 29 14:15:24 httpd[15893]: [fastcgi:error] [pid 15893] [client 10.10.3.104:56017] FastCGI: comm with server "/var/acc/webadmin.plx" aborted: idle timeout (30 sec), referer: https://sum.***.de:4422/


    I started to look at the definitions at 14:14:11. The interface was showing "Please wait, searching..." short after the last log entry listed before.

    I'm now pushing all definitions manually to the affected firewall. As SUM is slow and often hangs up (I have to login again) it takes some time.

    I will report how it goes on. But it would be nice to know if others have similar issues.
  • I have sorted out the issue with the flapping now.

    The objects which had been created during my initial configuration (e.g. networks, hosts) which had been added to restrict access the shell and webadmin access had been twice on the affected machine. I changing the localy used objects within the utm configuration to the SUM managed objects and I delete the local objects. After enabling the auto deployment function within SUM again the UTM is not flapping anymore.

    But the speed of SUM was still very poor. We reinstalled a brand new SUM and restored it with a backup. The speed is a better again, but still not the best.

    Please Sophos, please, make a good working centrally managed system where the speed is also good with a lot of objects and definition deployment is also working fine. In several cases we still have the issue that objects are not transferred from SUM to UTM when the object already exists.
  • this type of problems still continues, the truth discourages me S U M