This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

HELP! UTM just "crashed"

Hello all, I'm hoping you can help me.

I have UTM 9 (9.304-9; Pattern 73559) installed on a C2D Dell desktop w/ 8gb ram and 2 PCI NICs (Realtek RTL8169) for LAN/WAN .  The on-board internal NIC (Broadcom BCM5784M) is disabled/not in use.  Have approximately 70 PCs using a single 50mbps broadband connection.


I've been running UTM for the past couple of weeks and besides much trial and error on my end fixing my own mistakes, it's been good.  However about an hour ago the UTM just died!

I do not know what happened.  I got called that someone's pc couldn't get online, then another call, then another call and realized I could not get online either.  Nothing was recently changed on the UTM.

I then tried to connect to the UTM web interface and couldn't.  Just got a "page could not be displayed".  I then tried to ping the gateway.  No response.  

I went to the box I have UTM installed on and it was on/running.  I held the power button down for a few seconds, the PC beeped three times and shortly thereafter the system powered down.  This makes me think the UTM itself was indeed still "running".  I waited 10 seconds and powered it back up.  About 20 seconds later, I could ping the gateway and everyone could get "out"/online again.

Can someone let me know what might have caused this?  What would make the UTM's LAN interface (in the very least) just die?  More importantly, can someone let me know what troubleshooting steps I can perform to attempt to track down what the issue was/is so I can resolve it before it occurs again!?!  Any logs I can/should check??  Any diagnostics I can run on the unit?


Thanks much in advance.


This thread was automatically locked due to age.
  • An attached monitor and keyboard with console/shell access configured is very useful in this kind of situation.

    Logs?  All of them as you neither know what it is nor what it isn't at this point.

    Diagnostics?  Standard hardware diagnostics from the hardware vendor and memtest.  Capacitors and fans in good working order?  Power and cabling too?

    As you appear to be operating on some software based license you can build spare units and swap while you attempt to rule out any hardware problems.
  • An attached monitor and keyboard with console/shell access configured is very useful in this kind of situation.

    Logs?  All of them as you neither know what it is nor what it isn't at this point.

    Diagnostics?  Standard hardware diagnostics from the hardware vendor and memtest.  Capacitors and fans in good working order?  Power and cabling too?

    As you appear to be operating on some software based license you can build spare units and swap while you attempt to rule out any hardware problems.


    I actually had it running head-less, but I can definitely connect a monitor and keyboard to it.  If it happens again, what would be some commands I could/would run?

    And I'm fairly certain I ran vendor & memtest diags on the hardware before the install, but I will do again to be double-sure.  I guess I was asking if UTM had it's own sort of built-in diagnostic?

    And as far as the logs, as I'm sure you know, there are many logs and many things to weed through.  Would you have in mind maybe what you think the top few candidates of logs I might find the problem would be?

    Just grasping at straws, but I'm wondering if there's something wrong with the LAN nic card--I'm debating on reconfiguring things to use the built-in NIC card for LAN instead of the pci one and see if the problem returns.  I do not see any log particular geared towards "hardware", can you let me know which log would have information relating to a hardware error if one occured?

    Thanks so much!
  • kernel and system logs to start?  I don't recommend trying to review the logs via WebAdmin at all or on the problem system if it can be avoided.  Copy the logs to another system for review and analysis.  Additional logs of interest will will largely depend on your configuration and feature set licensed/enabled.

    Do you have an existing support relationship with your vendor and/or Sophos?  It may be more effective on the short term to engage them than to try to build the skillset on your own.
  • Sounds like you have a commercial license; your best course of action is to start a support case with Sophos (or your Reseller if you have Standard Support).   Posting here may get the attention of a few users, but Sophos Support does not start official support cases from postings here.

    Contact Support - Sophos Technical Support: SophosTalk, Knowledgebase, User Bulletin Board and Customer Resource Centers - Cloud Antivirus, Endpoint, UTM, Encryption, Mobile, DLP, Server, Web, Wireless Security, Network Storage and Next-Gen Firewall 

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Sophos Platinum Partner

    --------------------------------------

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • I agree fully with teched.  If you have standard support, contact your reseller.  If you have premium support, contact Sophos support.  This should always be your first step in an "emergency" situation.
    __________________
    ACE v8/SCA v9.3

    ...still have a v5 install disk in a box somewhere.

    http://xkcd.com
    http://www.tedgoff.com/mb
    http://www.projectcartoon.com/cartoon/1
  • Thank you all for the responses.

    @teched: thank you much.  I appreciate that knowledge, I will check those logs and will be sure to export!

    @all: I actually guess I should have mentioned, we are community non-profit (many of the systems are in a computer lab for public usage) and so we did not have the funds to purchase any licensing.  The UTM we are running is actually the "Essential Firewall" which is free for business use.  We are just using it for the firewall protection and the dhcp server so it definitely fits our needs.  I assumed (still do?) that it being free means that there is no technical support included with it?  All in all, we did not purchase anything from anyone, we just "registered" on the website and then downloaded the iso and installed it on the Dell PC.
  • I assumed (still do?) that it being free means that there is no technical support included with it
    You are correct.
    __________________
    ACE v8/SCA v9.3

    ...still have a v5 install disk in a box somewhere.

    http://xkcd.com
    http://www.tedgoff.com/mb
    http://www.projectcartoon.com/cartoon/1
  • You are correct.


    Thank you Scott.  

    I just filled out a form on Sophos' site asking for pricing information.

    Do any of you whom reside in the USA have any suggestions for good resellers you use/prefer?

    Also, would you have a ballpark of what's the cheapest license we could get which would enable technical support?  Looking through the options, honestly the only one we would probably be interested in is the QOS/bandwidth shaping.  I do not know if it's possible just to purchase licensing for that feature and then get technical support which might aid in the issue explained here in the thread?
  • An attached monitor and keyboard with console/shell access configured is very useful in this kind of situation.


    This advice from my side is not strictly related to the topic, but having keyboard and monitor attached to any kind of UTM appliance (as teched suggested) is a very good practice.

    In the picture below (my recent UTM SG230 implementation in a client company), you will see that I left USB keyboard on top of the UTM because KVM rack mounted switch supported only PS/2 ports.

  • Hello all, I'm hoping you can help me.

    I have UTM 9 (9.304-9; Pattern 73559) installed on a C2D Dell desktop w/ 8gb ram and 2 PCI NICs (Realtek RTL8169) for LAN/WAN .  The on-board internal NIC (Broadcom BCM5784M) is disabled/not in use.  Have approximately 70 PCs using a single 50mbps broadband connection.


    I've been running UTM for the past couple of weeks and besides much trial and error on my end fixing my own mistakes, it's been good.  However about an hour ago the UTM just died!

    I do not know what happened.  I got called that someone's pc couldn't get online, then another call, then another call and realized I could not get online either.  Nothing was recently changed on the UTM.

    I then tried to connect to the UTM web interface and couldn't.  Just got a "page could not be displayed".  I then tried to ping the gateway.  No response.  

    I went to the box I have UTM installed on and it was on/running.  I held the power button down for a few seconds, the PC beeped three times and shortly thereafter the system powered down.  This makes me think the UTM itself was indeed still "running".  I waited 10 seconds and powered it back up.  About 20 seconds later, I could ping the gateway and everyone could get "out"/online again.

    Can someone let me know what might have caused this?  What would make the UTM's LAN interface (in the very least) just die?  More importantly, can someone let me know what troubleshooting steps I can perform to attempt to track down what the issue was/is so I can resolve it before it occurs again!?!  Any logs I can/should check??  Any diagnostics I can run on the unit?


    Thanks much in advance.

    first trash the realtek and get broacom or intel nics.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow