Table of Contents

Spam IV

Přeučení

Představme si, že máme učicí se filtr, který funguje následovně. Při trénování si pro všechny trénovací emaily zapamatuje začátek řetězce zprávy o délce N a třídu, do níž daný email patří. Při hodnocení nové zprávy spočítá, s kolika spamy a s kolika hamy se shoduje začátek nové zprávy, a zaklasifikuje zprávu podle majority. Parametr N představující délku fragmentů, které si filtr pamatuje, nám umožňuje filtr ladit.

Hádanka

Programovací tipy

Projděte si sekci krok 6: programovací tipy uvedenou v programu prací na úloze spam. Obsahuje (neúplný) výčet tříd, metod a funkcí jazyka Python, které by se vám mohly při vytváření spam filtru hodit.

Konzultace

Řešení problémů s vašimi filtry a unit testy.

Domácí úkol

Zanedlouho je termín pro odevzdání 2. části úlohy Spam filtr! Postupujte podle specifikací. Termín najdete v odevzdávacím systému.

Programování