Date: Mon, 3 Nov 2003 14:22:51 +0100 (CET)
From: Aart Koelewijn
Subject: Re: spam filtering.
Op 2003-11-03 om 13:37 schreef Raymond A. Meijer:
> On Mon, 03 Nov 2003, 13:30, Raymond A. Meijer wrote:
>
> > > X-Spam-Flag: YES
>
> > :0:
> > * ^X-Spam-Status: Yes
> > ${MAILDIR}/spam
>
> Hmmm...uiteraard moet "-Status" in bovenstaande vervangen
worden door
> "-Flag" en "Yes" door "YES" :o)
bij mij in $HOME/.procmailrc:
# Eerst worden alle mailinglist in aparte mailboxen gezet, daar zit
# zelden spam tussen. Het filteren kost veel cpu, vooral als je
# auto_learn 1 in je user_prefs hebt staan (Bayes leerproces)
# daarna
:0fw: spamassassin.lock
* < 256000
| spamassassin
# Mails with a score of 10 or higher are almost certainly spam (with ?%
# false positives according to rules/STATISTICS.txt). Let's put them in
a
# different mbox. (This one is optional.)
:0:
* ^X-Spam-Level: \*\*\*\*
/dev/null
# All mail tagged as spam (eg. with a score higher than the set
threshold)
# is moved to "probably-spam".
:0:
* ^X-Spam-Status: Yes
/home/aart/mail/probably-spam
Overgenomen uit het voorbeeld van spamassassin. Dat weggooien deed ik
eerst bij 10 *'s. Naarmate ik meer zekerheid kreeg dat al op een lager
niveau geen vergissingen worden begaan (ten onrechte als spam aanmerken)
heb ik geleidelijk het aantal verminderd. Mijn "threshold"
staat op dit
moment op 2, ben geloof ik begonnen met 5, en het is me nog niet
overkomen
dat een mailtje ten onrechte als spam wordt aangemerkt. Van de
binnengekomen spam heeft naar schatting 90% een score hoger dan 4 en
wordt
dus direkt naar /dev/null verwezen. Dit niveau is overigens pas te
bereiken na handmatig behoorlijk wat recente (2000-3000) mailtjes, zowel
spam als geen spam, door het leerproces te sturen. Hierbij de nadruk op
mailtjes die scores rond de 0 krijgen, waarbij spamassassin het dus niet
weet.
Aart
--
Afmelden: mail 'SIG linux' naar listserv@nllgg.nl
Nederlandse Linux Gebruikers Groep http://www.nllgg.nl/
Mailinglist info: http://mail.nllgg.nl/
|