====== Spam filter - krok 7: Report a prezentace ====== Důležitou dovedností inženýrů je schopnost objektivně, stručně a přitom přesně popsat vlastní práci a prezentovat její výsledky. Proto je součástí úlohy Spam filter i vytvoření reportu a prezentace vašich spam filtrů spolužákům. ===== Report ===== Report by měl obsahovat: * Název práce * Autory * Stručný úvod (může být skutečně stručný, protože všichni víme, jakou úlohu řešíme) * Popis principu/algoritmu použitého spam filtru (příp. popis principu použitých spam filtrů, pokud jste jich zkoušeli víc). * Popis a zdůvodnění zvolených metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd. * Popis způsobu trénování filtru (na jakých datech jste filtr trénovali, na jakých testovali). * Výsledky dosažené vaším spam filtrem (nebo porovnání výsledků vašich spam filtrů, pokud jste jich zkoušeli víc, nebo jste zkoušeli různá nastavení jednoho typu filtru). Zkuste prezentovat výsledky na trénovací i testovací sadě dat * Stručný popis práce v týmu: * Rozdělení prací nejlépe formou tabulky/matice (kdo dělal na úloze co). * Organizace práce v týmu (jaké nástroje jste použili pro sdílení - mail, Dropbox/OneDrive/GDrive, git, ...) * Zhodnocení, závěr * Seznam použité literatury, online zdrojů, atd. Report můžete vypracovat v jakémoli editoru chcete, nepředepisujeme žádný specifický formát. Pokud byste si chtěli vyzkoušet tvorbu dokumentů v LaTeXu, což se vám v budoucnu může dost hodit, zkuste [[https://www.overleaf.com/]], který umožňuje i spolupráci více lidí na jednom dokumentu. ===== Prezentace ===== Prezentovat své filtry budete na posledním cvičení (kam byste měli přijít, i pokud sami prezentovat nebudete). **Prezentaci vytváříte pro své spolužáky.** Myslete na to, co pro ně bude přínosné, a co prezentovat nemusíte (protože to buď všichni vědí, nebo to jsou detaily, které jim nic moc nového nepřinesou). Soustřeďte se na následující: * Prezentace by neměla být dlouhá (do 10 slidů). Na její prezentaci budete mít cca 10 minut. * Stručně a srozumitelně popište hlavní princip vašeho filtru. Je-li možné použít názorný obrázek místo textu, udělejte to. * Popište a zdůvodněte zvolené metody předzpracování textu, tokenizace, výpočtu pravděpodobností, atd. * Ukažte hlavní výsledky vašeho filtru (příp. nějaké porovnání s dalšími filtry). * Zkuste připojit pár osobních postřehů, co vám třeba na úloze přišlo zajímavé nebo naopak divné, co jste se na úloze naučili, jak by šel filtr dále vylepšit, apod.