This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Enable Spamassassin Bayes

We have ASG V6.  Spam threshold is set to quarantine at 4 and reject at 8.  We have blocked a few legitimate emails at the 4 level so any lower for us and we would probably block too much legitimate mail.  We have bl.spamcop.net, sbl.spamhaus.org, list.dsbl.org, relays.ordb.org, and xbl.spamhaus.org for RBL's in use.  I was trying to figure out if the BAYES feature of spamassassin is used by default but it doesn't appear to be.  I've seen others posting spam email contents with Bayes information in them.  I have never seen any spam email in proxy content manager with Bayes filtering in it.  How does one go about using this feature??  We still get very obvious spam inside our network with buzz words in the body such as V I A GrA, and other variations of this word and other drugs.  It seems obvious that a spam program should block stuff as obvious as this.  So, how do I learn this spamassassin to block using the bayes feature??


This thread was automatically locked due to age.
Parents
  • Hi! [:)] 
     
    The Bayers feature is NOT used by default. That and autowhitelist is disabled. To enable them i have tried this...
     
    This will void your warranty and support and so forth... 
    *Just a warning*
     
    Edit the file
    /etc/mail/spamassassin/local.cf
     
    Change the rows containg bayers from 0 -> 1
    I also enabled autowhitelist as you can see + More headers.
     
    # This is the right place to customize your installation of SpamAssassin.
    #
    # See 'perldoc Mail::SpamAssassin::Conf' for details of what can be
    # tweaked.
    #
    # Only a small subset of options are listed below
    #
    ###########################################################################
     
    # Add *****SPAM***** to the Subject header of spam e-mails
    #
    # rewrite_header Subject *****SPAM*****
     
     
    # Save spam messages as a message/rfc822 MIME attachment instead of
    # modifying the original message (0: off, 2: use text/plain instead)
    #
    # report_safe 1
     
     
    # Set which networks or hosts are considered 'trusted' by your mail
    # server (i.e. not spammers)
    #
    # trusted_networks 212.17.35.
     
     
    # Set file-locking method (flock is not safe over NFS, but is faster)
    #
    # lock_method flock
     
     
    # Set the threshold at which a message is considered spam (default: 5.0)
    #
    # required_score 5.0
     
     
    # Use Bayesian classifier (default: 1)
    #
    use_bayes 1
     
     
    # Bayesian classifier auto-learning (default: 1)
    #
    bayes_auto_learn 1
     
     
    # Set headers which may provide inappropriate cues to the Bayesian
    # classifier
    #
    bayes_ignore_header X-Bogosity
    bayes_ignore_header X-Spam-Flag
    bayes_ignore_header X-Spam-Status
     
    use_auto_whitelist 1
     
    score DRUGS_ERECTILE 2
    score DRUGS_ANXIETY_EREC 2
     
    score HTML_MIME_NO_HTML_TAG 1
    score HTML_MESSAGE 0.0
    score HTML_FONT_BIG 1
     
    score RCVD_NUMERIC_HELO 2
    score RCVD_BY_IP 1
     
    #EOF
     
    When your done restart the spam protection in the Webadmin GUI.
     
    BTW; 
    The bayers database can be found at 
    /var/lib/nobody/.spamassassin
     
    Hope this does the trick [;)]
  • Ok, thanks Frank.  We aren't prepared to void all support.  Maybe in a year after what we paid for is ready for a renewal.  What the hell is the point of having a great spam blocking program if the best feature isn't being used.  Don't suppose you or anyone else know whether future versions will have this ENABLED?  
    Thanks again.
  • Hi!
     
    I can understand that completly. I have since i wrote the original mail in this topic trained my bayesian database with about 20-30000 non spam mail from my UNIX mailbox. Using the sa-learn command. And I can say that it is working like a dream! [[:)]] 
     
    From my expriance in SPAM protections (However different products) the bayesian feature properly configured can catch around 97-99,9% of the spam. I work as an IT-Administator at a local goverment in Sweden and we run a different spam solution that heavely depends on just bayesian learning. And i can say it works excellent! [[:)]] 
     
    It will however require its administrator and a learning period. Or as I did and uploaded and trained it with some real mail and some spam. If you do not do this the bayesian database will probably not be even close to as efficiant as it can be. My guess is this i why Astaro has not implimented it. You want a Firewall with SPAM features that works from the box, NOT that you have to maintain a lot in the begining and every now and then later.
     
    Well I have been running ASL since V3.2 at home and at another company that i help since V4. When they first became intrested in ASL at that company i wrote a topic here about features i would like to se in future ASL versions. Bayesian learning was one of the thinks i wrote down then. Tom then responded to that post and said that it would be included in Spamassassin 2.55, but I looked at it then and most versions since then and i did not see it implimented in the ASL version of spamassassin. Or at least not working properly. [[:(]] 
     
    Later they included DCC and Razor2 witch I was very happy to see. However it looks like they have removed this in (6.105) or some versions ago. [[:(]] 
     
    But if they include Bayesian learning with an upload option for SPAM / HAM or just as an extra option that you can enable in V7 I would be more then happy to say THANKS ASTARO!
Reply
  • Hi!
     
    I can understand that completly. I have since i wrote the original mail in this topic trained my bayesian database with about 20-30000 non spam mail from my UNIX mailbox. Using the sa-learn command. And I can say that it is working like a dream! [[:)]] 
     
    From my expriance in SPAM protections (However different products) the bayesian feature properly configured can catch around 97-99,9% of the spam. I work as an IT-Administator at a local goverment in Sweden and we run a different spam solution that heavely depends on just bayesian learning. And i can say it works excellent! [[:)]] 
     
    It will however require its administrator and a learning period. Or as I did and uploaded and trained it with some real mail and some spam. If you do not do this the bayesian database will probably not be even close to as efficiant as it can be. My guess is this i why Astaro has not implimented it. You want a Firewall with SPAM features that works from the box, NOT that you have to maintain a lot in the begining and every now and then later.
     
    Well I have been running ASL since V3.2 at home and at another company that i help since V4. When they first became intrested in ASL at that company i wrote a topic here about features i would like to se in future ASL versions. Bayesian learning was one of the thinks i wrote down then. Tom then responded to that post and said that it would be included in Spamassassin 2.55, but I looked at it then and most versions since then and i did not see it implimented in the ASL version of spamassassin. Or at least not working properly. [[:(]] 
     
    Later they included DCC and Razor2 witch I was very happy to see. However it looks like they have removed this in (6.105) or some versions ago. [[:(]] 
     
    But if they include Bayesian learning with an upload option for SPAM / HAM or just as an extra option that you can enable in V7 I would be more then happy to say THANKS ASTARO!
Children
No Data