Table of Contents

Spam filter - krok 1

Budeme vytvářet funkci, která bude umět načíst údaje ze souborů !truth.txt nebo !prediction.txt do datové struktury typu dictionary.

Příprava

Načtení klasifikace ze souboru

Úkol:

K čemu nám to bude:

Specifikace

Funkce read_classification_from_file (v modulu utils.py):

Vstupy: cesta k textovému souboru (v našem případě to budou typicky soubory !truth.txt a !prediction.txt)
Výstupy: dictionary obsahující pro každý název souboru identifikátor SPAM nebo OK

Funkce načte textový soubor, v němž jsou na řádku vždy 2 řetězce oddělené mezerou,

email01.txt OK
email02.msg OK
email03.txt SPAM
email1234.txt OK
...
a vytvoří z něj datovou strukturu dictionary (na pořadí jednotlivých “řádků” v následujícím výpisu nezáleží):
{'email1234.txt': 'OK', 'email03.txt': 'SPAM', 'email02.msg': 'OK', 'email01.txt': 'OK'}

Bude-li soubor prázdný, funkce vrátí prázdný slovník.