[7.507+] APs don't connect any more

Hi everyone,

after some sucessfull tests with 7.507 i deleted everything in the wireless section, installed the new beta ISO:

# cat /tmp/.build
sles10.intranet.astaro.de:/asg-7.508-100820-2.iso (16:24:18)

and restored a backup. Then i wanted to join the AP 10 again but is doesn't work. With activated debug i got this:

2010:09:01-10:56:49 asg awed[13986]: base mac: '00:1a:8c:06:13:00'
2010:09:01-10:56:51 asg awed[13986]: >=========================================================================
2010:09:01-10:56:51 asg awed[13986]: confd error: $VAR1 = [
2010:09:01-10:56:51 asg awed[13986]:           'OBJECT_INVALID_PARAM',
2010:09:01-10:56:51 asg awed[13986]:           {
2010:09:01-10:56:51 asg awed[13986]:             'attrs' => [],
2010:09:01-10:56:51 asg awed[13986]:             'value' => '00:1A:8C:06:13:8',
2010:09:01-10:56:51 asg awed[13986]:             'name' => 'Invalid object parameter',
2010:09:01-10:56:51 asg awed[13986]:             'external' => 'set_object',
2010:09:01-10:56:51 asg awed[13986]:             'attr' => 'lan_mac',
2010:09:01-10:56:51 asg awed[13986]:             'msgtype' => 'OBJECT_INVALID_PARAM',
2010:09:01-10:56:51 asg awed[13986]:             'format' => 'Invalid object parameter',
2010:09:01-10:56:51 asg awed[13986]:             'fatal' => 1,
2010:09:01-10:56:51 asg awed[13986]:             'type' => 'device',
2010:09:01-10:56:51 asg awed[13986]:             'class' => 'awe',
2010:09:01-10:56:51 asg awed[13986]:             'datatype' => 'MACADDR'
2010:09:01-10:56:51 asg awed[13986]:           }
2010:09:01-10:56:51 asg awed[13986]:         ];
2010:09:01-10:56:51 asg awed[13986]: =========================================================================
2010:09:01-10:56:53 asg awed[13986]: low-level recv error: sysread failed
2010:09:01-10:56:53 asg awed[13986]:
2010:09:01-10:56:53 asg awed[13986]:  1. main::handle_read:259() awed.pl
2010:09:01-10:56:53 asg awed[13986]:  2. main::top-level:226() awed.pl
2010:09:01-10:58:25 asg awed[13986]: =========================================================================
2010:09:01-10:58:28 asg awed[13986]: low-level recv error: sysread failed
2010:09:01-10:58:28 asg awed[13986]:
2010:09:01-10:58:28 asg awed[13986]:  1. main::handle_read:259() awed.pl
2010:09:01-10:58:28 asg awed[13986]:  2. main::top-level:226() awed.pl

I highlighted the area where the problem should be. The MAC of the AP is

# arp -a | grep 192.168.7.180
? (192.168.7.180) at 00:1A:8C:06:13:08 [ether] on eth0

but the MAC labeled on the back of the AP 10 is 00:1a:8c:06:13:00. Maybe
the firmware of the AP got corrupted. Is it possible to do a reset?

An AP 30 was also working fine with the normal 7.507. With the beta the AP
30 connects to the ASG so that a can authorize him. After that he is only
listet in the inactive AP list. There is also the MAC 00:00:00:00:00:00 displayed like in https://community.sophos.com/products/unified-threat-management/astaroorg/f/107/t/70006 Here is the debug output:

2010:09:01-11:26:01 asg awed[13986]: =========================================================================
2010:09:01-11:26:02 asg awed[13986]: error setting peer host (tid: 800 peer: 192.168.7.180)
2010:09:01-11:26:02 asg awed[13986]:
2010:09:01-11:26:02 asg awed[13986]:  1. main::handle_read:407() awed.pl
2010:09:01-11:26:02 asg awed[13986]:  2. main::top-level:226() awed.pl
2010:09:01-11:26:02 asg awed[13986]: 
  • Hi Mario,

    it took a while for the APs to show up when I moved to 7.507+ as this release contains a few firmware updates for the APs.

    The MAC address issue (label and AP MAC is not equal) is known to Astaro and nothing to worry about, it's just inconvenient.

    As far as I know the 00:00:00:00:00:00 bug is also known, the same happened to my AP-10 (or was it the AP-30??) However at the end it all worked out, and I also reapplied the backup.

    For how long did you wait?

    Christian
  • Hi Christian,

    i'm waiting for 3 h now. The awed tries to insert this in the confd: 
     'lan_mac' => '00:1A:8C:06:13:8'

    The MAC has the wrong syntax, so the confd rejects this:
    [23960] [awed.plx] [system (127.0.0.1)] [set_object] warn: id="3100" severity="warn" sys="System" sub="confd" name="OBJECT_INVALID_PARAM (Invalid object parameter)" client="awed.plx" facility="system" user="system" srcip="127.0.0.1" value="00:1A:8C:06:13:8" external="set_object" attr="lan_mac" class="awe" type="device" datatype="MACADDR"

    The 00:00:00:00:00:00 MAC is just a cosmetic error and doesn't matter for me till the
    final 7.508 firmware.

    Marco
  • There's a bug in 7.507+ with the MAC handling. This was already reported and is already fixed (it will be contained in 7.508), it is the same problem like the one you already linked to.

    Regarding the other issue (AP staying inactive): can you please do a "cat /proc/net/red" from the command line and post the output?

    Thanks,
     andreas
  • Hi Andreas,

    you wrote:
    ---
    Fortunately, the functionality is not affected, so everything should still work for those devices.
    ---
    But in my case these APs don't connect at all to the 7.507+.
    With 7.507 there weren't any problems. I now tried to connect the two APs to 
    my original ASG 7.507 and this worked fine. Should i try a new installation of
    the 7.507+ image or is this a known bug that it don't work with 7.507+ but
    with 7.507 it does?
  • sorry i forgot:

    #  cat /proc/net/red
    id 0001, peer reds1 10.254.254.254, keyid 0, RX seq 0, TX seq 0, crypto 1, refcnt 1
  • Thanks for the information. To my knowledge, the MAC address thingy is unrelated to the other problem you are having.
    To summarize: you have 4 APs. One does not show the correct MAC address, but does connect to the ASG and is shown as active. One does not show up as active and generates the 'error setting peer host' message you posted. The two other APs work as expected. Did I get that right?

    How many wireless networks do you have configured, and how many are configured as "seperate zone" and/or "bridge to ap lan" / "bridge to vlan" ?
    Can you please post the results of "ifconfig -a" ?

    Thanks, 
    andreas
  • Hi Andreas,

    i have 2 APs. Both APs generted the message "error setting peer host". Because i was 
    testing the 7.507+ step by step i didn't created a wireless network yet. As soon as i created one, the APs got the active status. I think that's the desired behavior ;-)
    I just got confused about those warning signs at the device screen. Thanks for your help and sorry for the inconvenience.
  • Thanks for the help, and I'm glad this cleared up. From a technical perspective, it really doesn't make much sense to have "active" APs without having them broadcast at least one network. The way that configuration is handled leaves room for improvement, though - proof that no one tried that configuration yet [;)]

    Thanks for testing this!
    Cheers,
     andreas