Search
Učitelská verze stránky
Po tomto cvičení student
Představme si, že máme učicí se filtr, který funguje následovně. Při trénování si pro všechny trénovací emaily zapamatuje začátek řetězce zprávy o délce N znaků a třídu, do níž daný email patří. Při hodnocení nové zprávy spočítá, s kolika spamy a s kolika hamy se shoduje začátek nové zprávy, a zaklasifikuje zprávu podle majority. Parametr N představující délku fragmentů, které si filtr pamatuje, nám umožňuje filtr ladit.
Zadání hádanky bude sděleno na cvičení.
Řešení problémů s vašimi filtry a unit testy.
TrainingCorpus
Zanedlouho následují termíny odevzdání: