Warning
This page is located in archive.

Spam filter - krok 7: Report a prezentace

Důležitou dovedností inženýrů je schopnost objektivně, stručně a přitom přesně popsat vlastní práci a prezentovat její výsledky. Proto je součástí úlohy Spam filter i vytvoření reportu a prezentace vašich spam filtrů spolužákům.

Report

Report by měl obsahovat:

 • Název práce
 • Autory
 • Stručný úvod (může být skutečně stručný, protože všichni víme, jakou úlohu řešíme)
 • Popis principu/algoritmu použitého spam filtru (příp. popis principu použitých spam filtrů, pokud jste jich zkoušeli víc).
 • Popis a zdůvodnění zvolených metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd.
 • Popis způsobu trénování filtru (na jakých datech jste filtr trénovali, na jakých testovali).
 • Výsledky dosažené vaším spam filtrem (nebo porovnání výsledků vašich spam filtrů, pokud jste jich zkoušeli víc, nebo jste zkoušeli různá nastavení jednoho typu filtru). Zkuste prezentovat výsledky na trénovací i testovací sadě dat
 • Stručný popis práce v týmu:
  • Rozdělení prací nejlépe formou tabulky/matice (kdo dělal na úloze co).
  • Organizace práce v týmu (jaké nástroje jste použili pro sdílení - mail, Dropbox/OneDrive/GDrive, git, …)
 • Zhodnocení, závěr
 • Seznam použité literatury, online zdrojů, atd.

Report můžete vypracovat v jakémoli editoru chcete, nepředepisujeme žádný specifický formát. Pokud byste si chtěli vyzkoušet tvorbu dokumentů v LaTeXu, což se vám v budoucnu může dost hodit, zkuste https://www.overleaf.com/, který umožňuje i spolupráci více lidí na jednom dokumentu.

Prezentace

Prezentovat své filtry budete na posledním cvičení (kam byste měli přijít, i pokud sami prezentovat nebudete). Prezentaci vytváříte pro své spolužáky. Myslete na to, co pro ně bude přínosné, a co prezentovat nemusíte (protože to buď všichni vědí, nebo to jsou detaily, které jim nic moc nového nepřinesou). Soustřeďte se na následující:

 • Prezentace by neměla být dlouhá (do 10 slidů). Na její prezentaci budete mít cca 10 minut.
 • Stručně a srozumitelně popište hlavní princip vašeho filtru. Je-li možné použít názorný obrázek místo textu, udělejte to.
 • Popište a zdůvodněte zvolené metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd.
 • Ukažte hlavní výsledky vašeho filtru (příp. nějaké porovnání s dalšími filtry).
 • Zkuste připojit pár osobních postřehů, co vám třeba na úloze přišlo zajímavé nebo naopak divné, co jste se na úloze naučili, jak by šel filtr dále vylepšit, apod.
courses/b4b33rph/cviceni/spam/krok7.txt · Last modified: 2024/01/11 15:09 by xposik