CourseWare Wiki
Switch Term
Winter 2018 / 2019
Older
Search
Log In
old
courses
a6m33dvz
cviceni
Warning
This page is located in archive. Go to the latest version of this
course pages
. Go the latest version of
this page
.
Harmonogram cvičení
týden
datum
téma
1.
5. 10.
Seznámení s nástrojem R a jeho instalací. Připomenutí základních pojmů ze statistiky v příkladech.
2.
12. 10.
Základy vizualizace v R. Průzkumová analýza dat.
3.
19. 10.
Lineární regrese. Naivní Bayesův klasifikátor.
x
Zadání úkolu A
x
4.
26. 10.
Algoritmy pro shlukování (k-means, rozdíl mezi hierarchickým a nehierarchickým shlukováním, volba optimálního počtu shluků) a jejich použití.
5.
2. 11.
Kontrukce rozhodovacího stromu - příklad, kdy je tento model vhodný a nevhodný. Výhody prořezávání.
Odevzdání úkolu A
6.
9. 11.
Vyhodnocení a využití modelů: křížová validace, bootstrapping, křivka učení. Klasifikátor k-nejbližších sousedů.
x
Zadání úkolu B
x
7.
16. 11.
Naivní bayesovský klasifikátor. Lineární klasifikátor.
8.
23. 11.
Další nástroje pro modelování dat: neuronové sítě, volba parametrů a jejich aplikace.
9.
30. 11.
Další nástroje pro modelování dat: SVM, ...
Odevzdání úkolu B
10.
7. 12.
Porozumnění datům a jejich příprava: postupy pro diskretizaci, normalizaci a doplnění chybějících hodnot, agregace dat. Selekce a extrakce příznaků. PCA.
x
Zadání úkolu C
x
11.
14. 12.
Tvorba modelu kombinací více základních modelů - bagging, boosting, AdaBoost.
12.
21. 12.
Konzultace.
13.
4. 1.
Další nástroje pro modelování: neklasifikovaná data a konstrukce asociačních pravidel (s využitím Apriori algoritmu).
Odevzdání úkolu C
14.
11. 1.
Zpracování přirozeného jazyka jako vstupu: "text mining" a jeho základní úlohy.
courses/a6m33dvz/cviceni/start.txt
· Last modified: 2017/11/23 09:57 by
anyzjiri