Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

Spam filter - krok 7: Report a prezentace

Důležitou dovedností inženýrů je schopnost objektivně, stručně a přitom přesně popsat vlastní práci a prezentovat její výsledky. Proto je součástí úlohy Spam filter i vytvoření reportu a prezentace vašich spam filtrů spolužákům.

Report

Report by měl obsahovat:

  • Název práce
  • Autory
  • Stručný úvod (může být skutečně stručný, protože všichni víme, jakou úlohu řešíme)
  • Popis principu/algoritmu použitého spam filtru (příp. popis principu použitých spam filtrů, pokud jste jich zkoušeli víc).
  • Popis a zdůvodnění zvolených metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd.
  • Popis způsobu trénování filtru (na jakých datech jste filtr trénovali, na jakých testovali).
  • Výsledky dosažené vaším spam filtrem (nebo porovnání výsledků vašich spam filtrů, pokud jste jich zkoušeli víc, nebo jste zkoušeli různá nastavení jednoho typu filtru). Zkuste prezentovat výsledky na trénovací i testovací sadě dat
  • Stručný popis práce v týmu:
    • Rozdělení prací nejlépe formou tabulky/matice (kdo dělal na úloze co).
    • Organizace práce v týmu (jaké nástroje jste použili pro sdílení - mail, Dropbox/OneDrive/GDrive, git, …)
  • Zhodnocení, závěr
  • Seznam použité literatury, online zdrojů, atd.

Report můžete vypracovat v jakémoli editoru chcete, nepředepisujeme žádný specifický formát. Pokud byste si chtěli vyzkoušet tvorbu dokumentů v LaTeXu, což se vám v budoucnu může dost hodit, zkuste https://www.overleaf.com/, který umožňuje i spolupráci více lidí na jednom dokumentu.

Prezentace

Prezentovat své filtry budete na posledním cvičení (kam byste měli přijít, i pokud sami prezentovat nebudete). Prezentaci vytváříte pro své spolužáky. Myslete na to, co pro ně bude přínosné, a co prezentovat nemusíte (protože to buď všichni vědí, nebo to jsou detaily, které jim nic moc nového nepřinesou). Soustřeďte se na následující:

  • Prezentace by neměla být dlouhá (do 10 slidů). Na její prezentaci budete mít cca 10 minut.
  • Stručně a srozumitelně popište hlavní princip vašeho filtru. Je-li možné použít názorný obrázek místo textu, udělejte to.
  • Popište a zdůvodněte zvolené metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd.
  • Ukažte hlavní výsledky vašeho filtru (příp. nějaké porovnání s dalšími filtry).
  • Zkuste připojit pár osobních postřehů, co vám třeba na úloze přišlo zajímavé nebo naopak divné, co jste se na úloze naučili, jak by šel filtr dále vylepšit, apod.
courses/b4b33rph/cviceni/spam/krok7.txt · Last modified: 2024/01/11 15:09 by xposik