Micro-HOWTO SpamAssassin
SpamAssassin est un logiciel écrit en Perl dont le but est de reconnaître les mails qui sont en réalité des spams et de les cataloguer comme tel.
Il fait son travail en examinant tous les mails reçus et en leur faisant passer un ensemble de tests. Suivant le résultat, chaque test va donner des points (que SA appele des hits) au mail. On peut ensuite additioner tous les hits et obtenir un score final pour le mail en question.
Un très grand nombre de tests existent et l'aspect modulaire de SA fait qu'il est très facile de créer ses propres tests et de les intégrer. Citons les tests sur les mots-clés, sur les URLs contenus dans les mails, le type de contenu (html, base64, ...), les filtres bayesiens (calcul de la probabilité que le mail soit un spam suivant les mots qu'il contient).
SA ajoute trois lignes dans les en-têtes de chaque mail qu'il examine. Ces lignes sont :
X-Spam-Checker-Version: SpamAssassin 2.64 (2004-01-11) on troll.parinux.org
X-Spam-Level: ***
X-Spam-Status: No, hits=3.4 required=5.0 tests=HTML_40_50,...
La première ligne indique la machine sur laquelle a eu lieu le test et la version de SA utilisée. La deuxième indique le score du mail, en représentant chaque hit par une étoile. La dernière, enfin, donne une synthèse des actions de SA. Elle indique :
- si le mail est catalogué comme un spam (Yes ou No)
- le score du mail (appelé hits par SA)
- le nombre de hits qu'il faut pour être catalogué comme étant un spam (le palier par défaut est de 5 hits)
- les tests qui ont donné ses hits au mail
Ainsi, on peut mettre un filtre sur la ligne "X-Spam-Status: Yes" dans son lecteur de mails pour filtrer ceux des mails qui ont été catalogués comme étant du spam ou filtrer sur la ligne "X-Spam-Level: **" si on veut filtrer les mails dont le score dépasse 2.
La page de SA sur lea-linux.org explique comment l'intégrer dans les principaux lecteurs mail disponibles sous Linux: http://lea-linux.org/reseau/message/spamassassin.html
Medintux et les logiciels libres pour le secteur médical
Hébergement de sites web : une comparaison
debutant.odt