wiki.in.tum.de
Technische Universität München

Spamlearning

Die RBG betreibt auf den Maileingangsservern in der DMZ ein auf Spamassassin basierendes Spamklassifizierungs- und -filtersystem.

Sie finden hier Informationen über die Funktionsweise und Benutzung dieses Systems.

Allgemeine Informationen

Spamsortierung

Standardmäßig werden von Spamassassin mit hoher Wahrscheinlichkeit als Spam klassifizierte E-Mails (Spam-Score >= 7) markiert und (falls der Ordner in der Mailbox vorhanden ist) in den IMAP-Ordner "INBOX.Spam" (Mathematik: "Spam") abgelegt.

Dieses System ist sehr konservativ eingestellt und kann nicht für alle Benutzer optimal sein. Verschiedene Benutzer bekommen in der Regel auch Spam-Mails von verschiedenen Quellen, und auch die echten Mail (Ham) weisen eine zwischen den Benutzern stark varrierende Streuung der automatisch ermittelten Spam-Scores auf.

Im RBG User Central Web-Interface (https://ucentral.in.tum.de / https://ucentral.ma.tum.de) kann dieses Verhalten darum so angepasst werden, dass E-Mails nach Spam-Score in benutzerdefinierte Ordner abgelegt werden:

  • Zuerst IMAP-Ordner anlegen die "spam" oder "junk" als Namensbestandteil enthalten
  • In ucentral im "Mail delivery settings"-Menü unter "Spam folders" die Checkbox "Use custom spam filter settings" anwählen
  • Mit den Checkboxen Ordner aktivieren und mit dem Slider Spam-Score einstellen
  • Mit dem "Save"-Button speichern
Das selbe kann natürlich auch mit einem selbstgeschriebenen Sieve-Script erreicht werden.

Spam-Header

Spamassassin fügt folgende Header in geprüfte E-Mails ein:

  • X-Spam-Level: Spam-Score der E-Mail in Sternen (X-Spam-Level: *** bedeutet: Spam-Level 3)
  • X-Spam-Flag: Ist dieser Header vorhanden, hat die E-Mail ein Spam-Level von 7 oder höher
  • X-Spam-Status: Spam-Status Yes/No und gematchte Regeln

Wenn man mehr Informationen über das Spam-System haben will, empfiehlt es sich, den =X-Spam-Status=-Header bei allen E-Mails anzeigen zu lassen.

Manuelle Spam-Markierung

Die automatische Spam-Klassifizierung benutzt in den E-Mails enthaltene Merkmale wie Absender, Adresse des Mailservers oder in der E-Mail enthaltene Signaturen um eine Spam-Score zu ermitteln.

Um diese Klassifizierung zu verbessern, kann "nachgearbeitet" werden, indem vom System falsch klassifizierte E-Mails explizit als Spam oder Ham (Nicht-Spam) markiert und in das System eingelernt werden.

Diese manuelle Spam-Markierung ist sowohl für den Webmail-Client als auch für IMAP-Benutzer ("normale" Mail-Clients) implementiert.

Achtung: Die E-Mails werden maschinell verarbeitet, aber da die Qualität der Markierung überprüft werden muss, behält sich die RBG vor, diese E-Mails ohne Ankündigung oder Nachfrage zu lesen.
Bitte beachten Sie dies falls Sie den "diese Mail ist kein Spam" Button bzw. den Ham-Learning-Ordner bei persönlichen E-Mails verwenden. Selbstverständlich werden die E-Mails absolut vertraulich behandelt und ausschließlich für die Spam-Klassifizierung verwendet.

Damit Ihre E-Mail-Markierungen vom System berücksichtigt werden können, füllen Sie bitte das Formular am Ende der Seite aus und schicken Sie es an die RBG (rbg@in.tum.de)

Spam-Markierung über Webmail

In der Webmail-Anwendung der RBG (https://webmail.in.tum.de / https://webmail.ma.tum.de) können einfach die Spam/Nicht-Spam-Buttons benutzt werden. Die Anleitung für Webmail-Benutzer finden Sie hier.

Spam-Markierung für IMAP-Benutzer

IMAP-Benutzer können spezifische IMAP-Ordner benutzen die für das Spam-Learning benutzt werden sollen. Aus diesen Ordnern werden E-Mails vom System "abgeholt" und analysiert. Diese Ordner müssen separat sein von "normalen" Spam-Ordnern, in die E-Mail automatisch (durch den E-Mail-Client oder Sieve-Scripts / ucentral-Spamsortierung) sortiert wird.

Für IMAP-Benutzer gilt folgendes Vorgehen:

  • IMAP-Ordner für Spam-Markierung und Ham-Markierung einrichten (z.B. "INBOX.Spam.Learn-Spam" und "INBOX.Spam.Learn-Ham")
  • Folgendes Formular ausfüllen und an die RBG (rbg@in.tum.de) schicken:

Formular

Antrag auf Einbeziehung in das Spam-Markierungs-System

Name                       :

Fakultät:                    [ ] Mathematik
                             [ ] Informatik

Status an der Fakultät:
                             [ ] Mitarbeiter / Gast
                             [ ] Student

RBG-Benutzerkennung        :
LRZ-Kennung                :

IMAP-Ordner
Spamlearning-Ordner        :
Hamlearning-Ordner         :
(optional, bei Benutzung des eigenen Mailclients nötig)
(nicht benötigt falls nur Webmail benutzt wird)

Benutzungsvereinbarung:
1. Mir ist klar, dass die manuelle Spam-Markierung in den globalen Spamfilter
für das Mailsystem der RBG einfließt, also alle Benutzer der Informatik- und
Mathematikfakultät betrifft.

2. Mir ist klar, dass nur echte Spam- / Phishing- / Scam- / Malware-Mails als
Spam markiert werden dürfen; "Academic Spam" (Call for Papers,
Konferenzankündigungen etc.), Mails von Mailinglisten und Rundmails fallen
explizit *nicht* unter Spam-Mails.

3. Mit ist bewusst, dass es verboten ist, ein automatisiertes System (z.B.
adaptiven Spamfilter des Mailclients) zu benutzen um Mails in die Ordner für
das Spamlearning-System zu markieren. Markierungen müssen vom Benutzer
vorgenommen werden.

4. Mir ist bewusst, dass die RBG die Funktion des Spamfilters überwacht und dazu
unter Umständen ohne Vorankündigung oder Benachrichtigung vom Benutzer markierte
E-Mails durch die RBG untersucht werden; und insbesondere, dass dies
gegebenenfalls auch für vom Benutzer als "Nicht-Spam" markierte E-Mails
passiert.

Alles weitere regeln die Benutzungsrichtlinien für
Informationsverarbeitungssysteme der Technischen Universität München.
Topic revision: r9 - 17 Oct 2019, AyseguelOmusNe63guq
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback