====== Bodové hodnocení ====== Stejně jako v celém předmětu RPH se cení především vaše snaha. S ní se nemusíte bát, že byste kvůli této úloze předmět neukončili. Úlohu budeme považovat za splněnou, pokud vyhoví kritériím, která jsou nastavena značně volně. Rozpis hodnocení úlohy Spam filtr: ^ Hodnocený výkon ^ min ^ max ^ poznámka ^ | [[specifikace#xx_sp_eval|sp_eval]] ||| **Termín odevzdání najdete v Upload systému!!!** | | ''compute_quality_for_corpus'' | 0 | 5 | Funkce funguje správně (ano/ne). | | [[specifikace#xx_sp_filt|sp_filt]] ||| **Termín odevzdání najdete v Upload systému!!!** | | Filtr běží | 4 | 4 | Aplikujeme-li spam filtr na sadu dat, filtr poskytne predikce, nespadne, ... Touto částí oceníme vaši schopnost zapsat v Pythonu jakýkoli (alespoň primitivní) spam filtr | | Filtr není triviální | 0 | 2 | Ocenění snahy o vytvoření alespoň trochu rozumného filtru. Nepatří sem filtry typu "vše je spam", "vše je OK", "rozhoduj se náhodně". Patří sem filtry, které se např. rozhodují podle jednoduchého ''if-then'' pravidla. | | Složitější filtr | 0 | 2 | Např. kombinace více pravidel, ... | | Filtr se umí učit | 0 | 3 | (+ plný počet bodů z předchozích kategorií hodnocení filtru) Filtr mění svůj model na základě vlastností trénovací sady dat. | | Čistota kódu | 0 | 4 | Vhodná jména objektů, funkcí, proměnných, konstant. Přehlednost, čitelnost, komentáře. | | Kvalita filtru | 0 | 12 | Viz níže.| ^ Celkem ^ 4 ^ 32 ^ /*| Soutěž s ostatními filtry | 0 | 12 | Podle umístění v turnajích; turnaje budou 3 |*/ ===== Hodnocení kvality filtru ===== Poslední složkou bodování je hodnocení kvality filtru. Filtr bude aplikován na 3 datové sady. Na každé z nich se určí [[specifikace#mira_kvality_filtru|skóre kvality filtru]]. Podle kvality filtru změřené na příslušné datové sadě bude následně udělen počet bodů: ^ q ^ body ^ | <0, 0.3) | 0 | | <0.3, 0.5) | 1 | | <0.5, 0.7) | 2 | | <0.7, 0.9) | 3 | | <0.9, 1> | 4 | Je tedy možno získat až 4 body na každé ze 3 datových sad, tedy 12 bodů celkem.