týden | datum | téma |
1. | 5. 10. | Seznámení s nástrojem R a jeho instalací. Připomenutí základních pojmů ze statistiky v příkladech. |
2. | 12. 10. | Základy vizualizace v R. Průzkumová analýza dat. |
3. | 19. 10. | Lineární regrese. Naivní Bayesův klasifikátor. xZadání úkolu Ax |
4. | 26. 10. | Algoritmy pro shlukování (k-means, rozdíl mezi hierarchickým a nehierarchickým shlukováním, volba optimálního počtu shluků) a jejich použití. |
5. | 2. 11. | Kontrukce rozhodovacího stromu - příklad, kdy je tento model vhodný a nevhodný. Výhody prořezávání. Odevzdání úkolu A |
6. | 9. 11. | Vyhodnocení a využití modelů: křížová validace, bootstrapping, křivka učení. Klasifikátor k-nejbližších sousedů. xZadání úkolu Bx |
7. | 16. 11. | Naivní bayesovský klasifikátor. Lineární klasifikátor. |
8. | 23. 11. | Další nástroje pro modelování dat: neuronové sítě, volba parametrů a jejich aplikace. |
9. | 30. 11. | Další nástroje pro modelování dat: SVM, ... Odevzdání úkolu B |
10. | 7. 12. | Porozumnění datům a jejich příprava: postupy pro diskretizaci, normalizaci a doplnění chybějících hodnot, agregace dat. Selekce a extrakce příznaků. PCA. xZadání úkolu Cx |
11. | 14. 12. | Tvorba modelu kombinací více základních modelů - bagging, boosting, AdaBoost. |
12. | 21. 12. | Konzultace. |
13. | 4. 1. | Další nástroje pro modelování: neklasifikovaná data a konstrukce asociačních pravidel (s využitím Apriori algoritmu). Odevzdání úkolu C |
14. | 11. 1. | Zpracování přirozeného jazyka jako vstupu: "text mining" a jeho základní úlohy. |