Search
Stejně jako v celém předmětu RPH se cení především vaše snaha. Pak se nemusíte bát, že byste kvůli této úloze předmět neukončili. Úlohu budeme považovat za splněnou, pokud vyhoví kritériím, která jsou nastavena značně volně.
Rozpis hodnocení spam filtru:
compute_quality_for_corpus
if-then
“Kvalita filtru”, podle níž budou přidělovány body, se bude počítat podle následujícího vzorce:
<latex>
q = \frac{TP + TN}{TP + TN + 10 \cdot FP + FN}.
</latex>
Pozitivní případy (P) zde odpovídají mailům, které filtr označil jako spam, negativní (N) pak těm, které filtr označil jako korektní emaily. FP tedy označuje počet korektních emailů označených jako spam, FN označuje počet spamů označených jako korektní email. Zdůrazňujeme, že hodnoty TP, FP, TN, FN ve výše uvedeném vzorci představují počty případů, nikoli procenta.
Podle kvality filtru změřené na příslušné datové sadě bude následně udělen počet bodů: