Search
Za semestr proběhne 7 konzultací po 14 dnech, každá v délce 1:30h. V tomto čase nelze frontálně vyložit všechna témata. Konzultace budou v prvním plánu orientované projektově, tedy na zvládnutí základních úloh (7 vybraných úloh z celkovych 11 v denním studiu – tam jsou některé “přípravné”). Současně budou poskytovat prostor pro diskusi témat nepokrytých úlohami. Každá konzultační hodina bude mít dané schéma: T) výklad nezbytné teorie pro úlohu, Z) zadání úlohy, C) přehled vstupů pro nepokrytá témata, četba do příští konzultace, D) diskuse četby a nejasností v minulých úlohách a tématech. Pracovní model předpokládá pravidelnou domácí přípravu mezi konzultacemi.
1. Algoritmus EM
(-) (náhrada diskuse, pravidelného bodu 4) Základní informace (jména, web předmětu, plán pro dálkové studium, způsob odevzdání úloh, 10min), přehled a cíle předmětu (slajdy Úvod, vysvětlení pojmu vzor, 15min).
(T) Maximální věrohodnost a algoritmus EM (EM slajdy, 45min).
(Z) Implementace EM (zadání, ukázky v Matlabu, 15min).
(C) Nepokryto: bayesovské sítě, základy pravděpodobnosti a statistiky, Matlab, RapidMiner, četba: slajdy na BN, Bishop: Pattern Recognition and Machine Learning (Chapter 8 on GPM), další příklady použití EM EM1, EM2 (5min).
2. Shluková analýza, algoritmus kMeans
(T) Shluková analýza, algoritmus kMeans (slajdy na shlukovou analýzu, 30min).
(Z) Implemenace kMeans (zadání, 15min).
(C) Nepokryto: hierarchicke shlukování, detaily pro metriky apod., četba: slajdy na shlukovou analýzu, CMP 11 stránek o hierarchickém a kmeans shlukování (5min).
(D) 40min.
3. Samoorganizující se mapy
(T) Samoorganizující se mapy (slajdy na SOM, 30min).
(Z) Text mining pomocí SOM (viz zadání úlohy ve cvičení 5 a 6, na rozdíl od denních studentů je předzpracování textů v RapidMineru nepovinné, dostanete tf-idf soubor jako vstup a pracujete se SOM toolboxem v Matlabu, 15min).
(C) Nepokryto: PCA, MDS, četba: PCA Tutoriál (5min).
4. Časté množiny položek, APRIORI
(T) Časté množiny položek, APRIORI (APRIORI slajdy,30min).
(Z) Analýza nákupního košíku (zadání, 15min).
(C) Nepokryto: klasifikace dle maximální podmíněné psti, nejbližší soused, četba: slajdy na klasifikaci (5min).
5. Rozhodovací stromy
(T) Klasifikační úloha (úvod do klasifikace), rozhodovací stromy (Rozhodovací stromy a pravidla, 30min).
(Z) Prořezávání stromu (zadání, 15min).
(C) Nepokryto: rozhodovací pravidla (Rozhodovací stromy a pravidla, závěr přednášky, další typy klasifikátorů ( Klasifikační úloha, závěr přednášky) 5min).
6. Lineární klasifikace perceptronem
(T) Lineární klasifikace perceptronem (Lineární klasifkace, začátek přednášky, 30min).
(Z) Implementace perceptronu (zadání, 15min).
(C) Nepokryto: LDA, logistická regrese (Lineární klasifkace, konec přednášky, včetně referencí nebo např. LR video 5min).
7. Testování klasifikátorů a klasifikačních algoritmů
(T) Testování modelů (Testování modelů, 30min).
(Z) Testování klasifikátorů BreastCancer dat (zadání), 15min. (C) Nepokryto: neuronové sítě, algoritmus zpětného šíření (Neuronové sítě), kombinování modelů (Kombinování modelů), 5min.
(D) Diskuse 30min, ukázka zkouškového testu 10min.
Zkouška spolu s denními studenty. Termíny: 24.1., 3.2., 14.2.