====== xp33ppd -- Praktické problémy data mining ====== ===== Anotace ===== Předmět je zaměřen na řešení praktických problémů data mining, zejména transformace, předzpracování a verifikace dat, zvolení vhodného algoritmu data mining, vyhodnocení procesu data mining a interpretace výsledků. Velký důraz je kladen na řešení samostatné úlohy na reálných datech pod dohledem vyučujícího. * [[http://www.feld.cvut.cz/cz/education/bk/predmety/12/04/p12040004.html| Fakultní informace o předmětu, rozvrh ]] * [[https://cw.felk.cvut.cz/forum/viewforum.php?id=84|Diskuzní fórum předmětu]] ===== Přednášky ===== ^ Přednáška (přednášející) ^ Obsah ^ Materiály ^ | 1) 6.3.2014 \\ (L.Vysloužilová) | DM – úvod, popis a metodika procesu a vizualizace 2D | {{:courses:xp33ppd:ppd2014-01-dobyvani_znalosti.pdf|ppd2014-01.pdf}} | | 2) 13.3.2014 \\ (L.Vysloužilová) | Vizualizace dat a její využití v DM |{{:courses:xp33ppd:ppd2014-02-vizualizace.pdf|ppd2014-02.pdf}}| | 3) 20.3.2014 \\ (T.Sieger) | Předzpracování dat. Selekce a extrakce příznaků |{{:courses:xp33ppd:ppd2014-03-predzpracovani_dat_osnova.pdf|Osnova přednášky}} ({{:courses:xp33ppd:ppd2014-03-predzpracovani_dat_osnova_txt.pdf|osnova ve zhuštěné textové formě)}}. Doplňkové materiály: {{:courses:xp33ppd:ppd2014-03-predzpracovani_dat.pdf|předzpracování dat}}, {{:courses:xp33ppd:ppd2014-03-selekce_a_extrakce_priznaku.pdf|výběr a extrakce příznaků}}| | 4) 3.4.2014 \\ (O.Štěpánková) | Nástroje pro modelování klasifikovaných dat I. (rozhodovací stromy) |{{:courses:xp33ppd:ppd2014-04-rozhodovaci_stromy.pdf}}| | 5) 10.4.2014 \\ (T.Sieger) | Nástroje pro modelování klasifikovaných dat II. (neuronové sítě, SVM) | SVM: {{:courses:xp33ppd:svm.pdf|přednáška}} a {{:courses:xp33ppd:svm_print.pdf|verze k tisku}}. Ilustrace křížové validace a volby optimálního modelu: {{:courses:xp33ppd:cv.pdf|přednáška}} a {{:courses:xp33ppd:cv-no-transition.pdf|verze k tisku}}. | | 6) 17.4.2014 \\ (O.Štěpánková) | Vyhodnocení a využití modelů |{{6|}}| | 7) 24.4.2014 \\ (O.Štěpánková) | Tvorba modelu kombinací více základních modelů |{{7|}}| | 8) 29.4.2014 \\ (O.Štěpánková) | Konstrukce asociačních pravidel (s využitím Apriori algoritmu) |{{8|}}| | 9) 15.5.2014 \\ (T.Sieger) | Nástroje pro modelování neklasifikovaných dat a jejich využití |{{9|}}| |10) 22.5.2014 \\ (L.Vysloužilová) | Zpracování přirozeného jazyka jako vstupu |{{:courses:xp33ppd:ppd2014-10-text_mining.pdf|text_mining.pdf}}| |11) 29.5.2014 \\ (O.Štěpánková) | Zpracování časových řad |{{11|}}| ===== Literatura ===== * Petr Berka: Dobývání znalostí z databází, Academia 2003 * F.Železný, J.Kléma, O.Štěpánková: Strojové učení v dobývání dat, Mařík et al. (eds) Umělá inteligence (4), Academia 2003 * M. Kubát: Strojové učení, Mařík et al. (eds) Umělá inteligence (1), Academia 1993 * Michael Berthold, David J. Hand: Intelligent Data Analysis, Springer 1999, 2003 * Daniel T. Larose: Discovering Knowledge in Data, Wiley 2005 * Daniel T. Larose: Data Mining: Methods and Models, Wiley 2006 * Oded Maimon, Lior Rokach (eds): The Data Mining and Knowledge Discovery Handbook, Springer 2005