Bodové hodnocení

Stejně jako v celém předmětu RPH se cení především vaše snaha. S ní se nemusíte bát, že byste kvůli této úloze předmět neukončili. Úlohu budeme považovat za splněnou, pokud vyhoví kritériím, která jsou nastavena značně volně.

Rozpis hodnocení úlohy Spam filtr:

Hodnocený výkon	min	max	poznámka
sp_eval			Termín odevzdání najdete v Upload systému!!!
`compute_quality_for_corpus`	0	5	Funkce funguje správně (ano/ne).
sp_filt			Termín odevzdání najdete v Upload systému!!!
Filtr běží	4	4	Aplikujeme-li spam filtr na sadu dat, filtr poskytne predikce, nespadne, … Touto částí oceníme vaši schopnost zapsat v Pythonu jakýkoli (alespoň primitivní) spam filtr
Filtr není triviální	0	2	Ocenění snahy o vytvoření alespoň trochu rozumného filtru. Nepatří sem filtry typu “vše je spam”, “vše je OK”, “rozhoduj se náhodně”. Patří sem filtry, které se např. rozhodují podle jednoduchého `if-then` pravidla.
Složitější filtr	0	2	Např. kombinace více pravidel, …
Filtr se umí učit	0	3	(+ plný počet bodů z předchozích kategorií hodnocení filtru) Filtr mění svůj model na základě vlastností trénovací sady dat.
Čistota kódu	0	4	Vhodná jména objektů, funkcí, proměnných, konstant. Přehlednost, čitelnost, komentáře.
Kvalita filtru	0	12	Viz níže.
Celkem	4	32

Hodnocení kvality filtru

Poslední složkou bodování je hodnocení kvality filtru. Filtr bude aplikován na 3 datové sady. Na každé z nich se určí skóre kvality filtru. Podle kvality filtru změřené na příslušné datové sadě bude následně udělen počet bodů:

q	body
<0, 0.3)	0
<0.3, 0.5)	1
<0.5, 0.7)	2
<0.7, 0.9)	3
<0.9, 1>	4

Je tedy možno získat až 4 body na každé ze 3 datových sad, tedy 12 bodů celkem.