A6M33DVZ: Dobývání a vizualizace znalostí

(zimní semestr akademického roku 2016/2017)

Výuka

Kontakty

Harmonogram přednášek

týden datum místnost přednášející téma ke stažení
1. 6. 10. KN:E-112 Lenka Vysloužilová Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů: pozorování, příznak, příznakový prostor, expertní klasifikace, modelování, učení s učitelem a bez učitele, parametry modelu, kvalita modelu, trénovací a testovací množina. Průzkumová analýza dat. Základy vizualizace dat. Přednáška 2015-1
2. 13. 10. Olga Štěpánková Nástroje pro modelování neklasifikovaných dat a jejich využití I (učení bez učitele): algoritmy pro shlukování (k-means, rozdíl mezi hierarchickým a nehierarchickým shlukováním, volba optimálního počtu shluků), vlastnosti, použití. Metoda nejbližšího souseda. Přednáška 2016-2
3. 20. 10. Olga Štěpánková Nástroje pro modelování klasifikovaných dat a jejich využití II (učení s učitelem): algoritmy pro tvorbu rozhodovacího stromu, vlastnosti, příklady aplikací. Přednáška 2016-3
4. 27. 10. Olga Štěpánková Ověřování modelů: křížová validace, bootstrapping, křivka učení. Přednáška 2016-4
5. 3. 11. Olga Štěpánková Srovnávání výkonnosti modelů, ROC křivka. SVM a “kernel trick”. Přednáška 2016-5a Přednáška 2016-5b
6. 10. 11. Tomáš Sieger Nástroje pro modelování klasifikovaných dat a jejich využití II (učení s učitelem): SVMPřednáška2016-6
7. 17. 11. Státní svátek
8. 24. 11. Lenka Vysloužilová Různé metody vizualizace dat (např. scatter plot matrix, paralelní souřadnice, RadViz) a jejich použití. Identifikace odlehlých a nesprávných hodnot. Porozumnění datům a jejich příprava: postupy pro diskretizaci, normalizaci a doplnění chybějících hodnot, agregace dat. Volba relevantních atributů: proč je tento problém důležitý? Prednaska2015-7.pdf Přednáška6lonska(CZ) Přednáška6lonska(EN)
9. 1. 12. Olga Štěpánková Tvorba modelu kombinací více základních modelů - bagging, boosting, AdaBoost. Přednáška 2016-8
10. 8. 12. Olga Štěpánková Další nástroje pro modelování dat III: neuronové sítě, volba parametrů a jejich aplikace. Přednáška 2016-9
11. 15. 12. Olga Štěpánková Další nástroje pro modelování IV: neklasifikovaná data a konstrukce asociačních pravidel (s využitím Apriori algoritmu). Přednáška 2016-10
12. 22. 12. Olga Štěpánková Zpracování přirozeného jazyka jako vstupu: “text mining” a jeho základní úlohy, metody reprezentace dokumentů, jejich výhody či nevýhody, tokenizace, stem, stop words, definice vzdálenosti dokumentů. Přednáška 2016-11
13. 5. 1. Olga Štěpánková Práce s časovými řadami. Přednáška 2016-12
14. 12. 1. Olga Štěpánková Je vůbec možné se něco naučit z dat a jaký rozsah dat DM potřebuje? Přednáška 2015-13

Vybraná doporučená literatura

  • Mařík V., Štěpánková O., Lažanský J. a kol. : Umělá inteligence (4), Academia 2003
  • Berka P. : Dobývání znalostí z databází, Academia 2005
 
Groups:
courses/a6m33dvz/start.txt · Last modified: 2016/12/28 18:38 by stepanko