Search
Od třídy Corpus odvoďte třídu TrainingCorpus, která bude obalovat korpus se známým ohodnocením emailů, tedy korpus, který je možno použít k učení filtru.
Corpus
TrainingCorpus
Testy ke kroku 5:
Třída TrainingCorpus není nijak povinná a její implementace není pevně dána. Implementujte jen ty metody, které se vám budou hodit. Dodávané testy kontrolují všechny níže uvedené metody - rozhodnete-li se nějaké z nich neimplementovat, smažte (nebo zakomentujte) příslušné testy ve třídě TrainingCorpusTest.
TrainingCorpusTest
Úkol:
trainingcorpus.py
K čemu nám to bude?
!truth.txt
Specifikace tohoto úkolu není pevná, záleží na vás, jaké metody se vám budou hodit. Následující berte jako inspiraci. (Unit testy ale tyto metody testují.)
get_class()
OK
SPAM
is_ham()
is_spam()
True
False
spams()
hams()
emails()
Záleží jen na vás, zda některé z metod implementujete nebo zda se rozhodnete pro jiný přístup.