This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Error I40E promiscuous mode after update from 9.715 to 9.716

Nach dem Update von 9.715 auf die 9.716 erhalten wir diese Fehlermeldung im kernel.log:

i40e 0000:08:00.2: Error I40E_AQ_RC_EINVAL adding RX filters on PF, promiscuous mode forced on

Nach kurzer Zeit bricht dann irgendwann die komplette Verbindung der 10G Interfaces zusammen.

Abhilfe brachte bisher nur das Downgrade auf die 9.715.

Sonst noch jemand mit dem gleichen Fehler?



This thread was automatically locked due to age.
Parents Reply Children
  • Moin,

    sehe nur ich keine weiteren Antworten oder kam hier nichts mehr?
    Ist das Problem bei euch gelöst?

  • Hallo,

    das Ganze gestaltet sich etwas zäh. Auf meinen offiziellen Call bei Sophos direkt habe ich letztlich nur bestätigt bekommen, dass es so ist wie Dirk weiter oben im Thread schon analysiert hat. Hier mal die offizielle Antwort von Sophos zum meinem Call:

    As I have completed the log review and investigation, I was able to identify the same issue being reported by other customers as well. Below is the investigation ID:
     

    Development reference number: 

    NUTM-14332

    Current Status: 

    Escalated to Development 

    Issue type: 

    Investigation


    Our development team have confirmed that, there are changes been taken with 9.7.16 which has potential cause the issue. With the new changes been taken with 9.7.16, we would require to make manual changes.

    RCA: The error "I40E_AQ_RC_EINVAL adding RX filters on PF, promiscuous mode forced on" indicates that Ethernet card has run out of space for more filters the driver (i40e) is trying to add. In order to release the Ethernet card from this, we suggest to turn off the offload feature that should save some memory and power as well. To make it easier, 9.716 has added the configuration option for it. Earlier, there were rules available in the "/etc/udev/rules.d/20-nic.rules"

    Zur Info.

    Gruß

    Helmut

  • klingt alles nach unglaublichem gebastel.

    ich sollte folgendes machen, was aber auch nichts gebracht hat.
    NIC geht weiterhin regelmäßig down/up  :-/

    OBJS itfhw ethernet REF_ItfEthEth17C1Intel[eth17> eth_offload_disabled=1 <= 0=einschalten (Standard); 1=ausschalten

    Was ja komisch ist, bei mir bestrifft es nur das eth17 aus dem 4-Port Modul. Das aber auf beiden Maschinen, egal welche gerade Master im HA ist.
    Werde im nächsten Wartungsfenster das mal auf einen anderen Slot umbauen.

    Grüße

  • Ja, es ist unbefriedigend was der offizielle Support von Sopohos da macht. Der Fehler tritt auch tatsächlich nur auf dem 10G Flexiport Module auf, da das den i40e Treiber nutzt. Ich fahre zurzeit immer noch auf auf der 9.715. Was Dirk getestet hat ist per ethtool den "TCP Segmenation Offloading" Modus zu deaktivieren. "/sbin/ethtool -K ethNN tso off"; In deinem Fall wäre das ethNNN dann eth17. Und ja, betrifft beide Clusterpartner und tritt auch ohne LACP Verbund auf. Kannst ja mal berichten ob das mit den TSO=off zuverlässig läuft.

  • Guten Morgen,

    ja es sieht gut aus, die ersten Tests waren erfolgreich und es kam bis jetzt nach dem Update zu keinen weiteren Störungen.

    Gruß Dirk

  • Guten Morgen,

    ich arbeite seit knapp 3 Wochen mit 9.716 mit dem OBJS-Hotfix und es läuft stabil. Das Update auf die 9.717 mache ich erst nächste Woche. Da Dirk die gleichen Probleme hatte wie ich, gehe ich davon aus, dass die 9.717 auch bei mir ohne Probleme laufen wird.

    Gruß

    Helmuu