This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Hot to debug segfault

Hi Guys, Im running a UTM Home Edition on an ESXi server.

Hardware: Core2Quad 9550 and 6 GB RAM

I installed the UTM from an iso image and the system has 3 GB RAM and two cpus assigned.

I constantly getting segfaults in my kernel.log Even if the system is not in use, because nobody is at home. I came back from a short trip today, and this is, what my kernel.log looks like.

heimd4ll:/var/log # cat kernel.log | wc -l
3507


2015:08:15-09:56:36 heimd4ll kernel: [119133.438827] confd.plx[31922]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:37 heimd4ll kernel: [119134.123841] confd.plx[31905]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:37 heimd4ll kernel: [119134.484043] confd.plx[31930]: segfault at 500000a ip 00000000f7307e2f sp 00000000fffc94d0 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119134.890702] confd.plx[31891]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119134.897733] confd.plx[31910]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119134.906393] confd.plx[31816]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119134.944832] confd.plx[31869]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119135.071317] confd.plx[31883]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:38 heimd4ll kernel: [119135.134234] confd.plx[31951]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:42 heimd4ll kernel: [119138.859342] show_signal_msg: 1 callbacks suppressed
2015:08:15-09:56:42 heimd4ll kernel: [119138.859347] confd.plx[32047]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:42 heimd4ll kernel: [119138.907892] confd.plx[31803]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:56:43 heimd4ll kernel: [119139.821835] confd.plx[32080]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:57:37 heimd4ll kernel: [119194.373520] confd.plx[32168]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:57:37 heimd4ll kernel: [119194.396584] confd.plx[32169]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:58:37 heimd4ll kernel: [119254.374644] confd.plx[32205]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:58:37 heimd4ll kernel: [119254.424314] confd.plx[32204]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:59:37 heimd4ll kernel: [119314.333631] confd.plx[32236]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-09:59:38 heimd4ll kernel: [119314.459803] confd.plx[32237]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:00:01 heimd4ll kernel: [119338.297783] confd.plx[32302]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:00:37 heimd4ll kernel: [119374.302531] confd.plx[32374]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:00:38 heimd4ll kernel: [119374.559769] confd.plx[32375]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:01:37 heimd4ll kernel: [119433.879529] confd.plx[32422]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:01:38 heimd4ll kernel: [119434.256865] confd.plx[32430]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:01:38 heimd4ll kernel: [119434.580494] confd.plx[32436]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:02:02 heimd4ll kernel: [119458.298411] confd.plx[32465]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:02:38 heimd4ll kernel: [119494.225534] confd.plx[32513]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:02:38 heimd4ll kernel: [119494.613599] confd.plx[32521]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:03:38 heimd4ll kernel: [119554.215876] confd.plx[32544]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:03:38 heimd4ll kernel: [119554.641673] confd.plx[32552]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:04:38 heimd4ll kernel: [119614.169457] confd.plx[32571]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]
2015:08:15-10:04:38 heimd4ll kernel: [119614.667268] confd.plx[32579]: segfault at d363914 ip 00000000f7279a00 sp 00000000fffc9360 error 4 in libperl.so[f7252000+14d000]


Often this results in a hanging confd.plx process which is consuming 100% CPU which is not very healthy for my electricity bill. For now I disabled smtp and webfiltering, so the only active features are some firewall rules und the intrusion prevention

On the server there are also two other VMs running which are not showing any problems at all. Also the logs of the ESXi itself doesn't show any probs.

But I'm digging in the dark here, I can't find whats the reason. If there would be faulty RAM there should be more problems in all VMs. Up to now i'm very impressed over the features sophos is offering for free, but the software seems very buggy to me.

Any idea you have would be appreciated.

[EDIT]
If if is helpful, I used the "Other Linux 3.x Kernel x64" option and machine version 11


This thread was automatically locked due to age.
  • Hi, CaBaL, and welcome to the User BB!

    Did you check that the md5sum of the ISO was correct?  Did you download the Software and not the Hardware (Appliance) version?

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi, CaBaL, and welcome to the User BB!

    Did you check that the md5sum of the ISO was correct?  Did you download the Software and not the Hardware (Appliance) version?

    Cheers - Bob


    Hi Bob, thanks for the welcome.

    No I didn't check the md5 but used the correct iso, starting with asg. I currently downloaded the newest iso again and will give it a second try.

    I also read that you should use the sles 10 template, because the UTM is based on openSuse.
  • So I did a new installation but it didn't help ;(

    I was three days aways, so the only thing I used were some vpn connections.

    These are my logs

    17.08.15
    2015:08:17-10:39:16 heimd4ll kernel: [124775.561445] confd.plx[16375]: segfault at 19eac7a0 ip 00000000f7351529 sp 00000000ffaee250 error 4 in libperl.so[f72b2000+14d000]
    2015:08:17-10:40:02 heimd4ll kernel: [124821.712439] confd.plx[16408]: segfault at ff023ac ip 00000000f736798e sp 00000000ffaedf20 error 4 in libperl.so[f72b2000+14d000]
    2015:08:17-10:40:16 heimd4ll kernel: [124835.563685] confd.plx[16449]: segfault at 5000004 ip 00000000f72d9a00 sp 00000000ffaedfd0 error 4 in libperl.so[f72b2000+14d000]


    and 18.08.15
    2015:08:18-03:47:20 heimd4ll kernel: [186377.286806] confd.plx[2046]: segfault at df37544 ip 00000000f736798e sp 00000000ffaeddf0 error 4 in libperl.so[f72b2000+14d000]
    2015:08:18-05:02:29 heimd4ll kernel: [190880.204858] confd.plx[5867]: segfault at 8e2b862 ip 00000000f7367e5d sp 00000000ffaee300 error 4 in libperl.so[f72b2000+14d000]


    and what's the worst part...

    top - 19:43:52 up 2 days, 19:47,  1 user,  load average: 2.08, 2.14, 2.26
    Tasks: 146 total,   3 running, 141 sleeping,   0 stopped,   2 zombie
    Cpu(s): 43.8%us,  1.0%sy,  0.1%ni, 55.0%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
    Mem:   3089164k total,  2860636k used,   228528k free,   349512k buffers
    Swap:  3145724k total,     4544k used,  3141180k free,  1306892k cached

      PID USER      PR  NI  VIRT  RES  SHR S   %CPU %MEM    TIME+  COMMAND
     5936 root      20   0 47608  31m 1892 R     98  1.1 858:53.76 confd.plx
     2622 root      20   0 47608  31m 1924 R     96  1.1 919:01.66 confd.plx


    After restarting confd everything is fine for a while. I have no idea where this is coming from.

    Maybe i should write a cronjob which is monitoring kernel.log and top and then restarts confd
  • It seems to be a bug in perl

    this is a command, which can reproduce the segfault without probs

    perl -e "sub M:[:D]ESTROY; bless {}, M;"


    Found it here -> https://bugzilla.redhat.com/show_bug.cgi?id=839788
  • Does anyone have some ideas?

    If not I'll switch back to endian. Not so many features, but it does work without so much trouble.