Search
Spam filtry byly spuštěny na 3 datových sadách, na každé bylo možné získat až 4 body za úspěšnost filtru. Datové sady 2 a 3 byly tento rok změněny. Nová data se ukázala být obtížnější pro klasifikaci, takže jsme zmírnili úrovně kvality filtru potřebné pro získání určitého počtu bodů. Hodnocení probíhalo podle následující tabulky:
První sada byla ta, která byla použita v online testovacím skriptu v upload systému a kterou jste měli k dispozici. Data se dají popsat následovně:
Výsledky 1
Druhá sada dat byla podobně velká a měla shodné rozdělení emailů. Emaily ale byly jiné, než v první sadě.
Výsledky 2
Třetí data se lišila hlavně v trénovací sadě. Byla větší, než u prvních dvou, a HAMy i SPAMy v ní byly zastoupeny rovnoměrně.
Výsledky 3
Celkové výsledky
Gratulujeme!