Harmonogram cvičení

týden datum téma
1. 5. 10. Seznámení s nástrojem R a jeho instalací. Připomenutí základních pojmů ze statistiky v příkladech.
2. 12. 10. Základy vizualizace v R. Průzkumová analýza dat.
3. 19. 10. Lineární regrese. Naivní Bayesův klasifikátor. xZadání úkolu Ax
4. 26. 10. Algoritmy pro shlukování (k-means, rozdíl mezi hierarchickým a nehierarchickým shlukováním, volba optimálního počtu shluků) a jejich použití.
5. 2. 11. Kontrukce rozhodovacího stromu - příklad, kdy je tento model vhodný a nevhodný. Výhody prořezávání. Odevzdání úkolu A
6. 9. 11. Vyhodnocení a využití modelů: křížová validace, bootstrapping, křivka učení. Klasifikátor k-nejbližších sousedů. xZadání úkolu Bx
7. 16. 11. Naivní bayesovský klasifikátor. Lineární klasifikátor.
8. 23. 11. Další nástroje pro modelování dat: neuronové sítě, volba parametrů a jejich aplikace.
9. 30. 11. Další nástroje pro modelování dat: SVM, ... Odevzdání úkolu B
10. 7. 12. Porozumnění datům a jejich příprava: postupy pro diskretizaci, normalizaci a doplnění chybějících hodnot, agregace dat. Selekce a extrakce příznaků. PCA. xZadání úkolu Cx
11. 14. 12. Tvorba modelu kombinací více základních modelů - bagging, boosting, AdaBoost.
12. 21. 12. Konzultace.
13. 4. 1. Další nástroje pro modelování: neklasifikovaná data a konstrukce asociačních pravidel (s využitím Apriori algoritmu). Odevzdání úkolu C
14. 11. 1. Zpracování přirozeného jazyka jako vstupu: "text mining" a jeho základní úlohy.