====== AD7B36VYD -- kombinované studium ====== ===== Doplňující informace, základní plán ===== Za semestr proběhne 7 konzultací po 14 dnech, každá v délce 1:30h. V tomto čase nelze frontálně vyložit všechna témata. Konzultace budou v prvním plánu orientované projektově, tedy na zvládnutí základních úloh (7 vybraných úloh z celkovych 11 v denním studiu -- tam jsou některé "přípravné"). Současně budou poskytovat prostor pro diskusi témat nepokrytých úlohami. Každá konzultační hodina bude mít dané schéma: T) výklad nezbytné teorie pro úlohu, Z) zadání úlohy, C) přehled vstupů pro nepokrytá témata, četba do příští konzultace, D) diskuse četby a nejasností v minulých úlohách a tématech. Pracovní model předpokládá pravidelnou domácí přípravu mezi konzultacemi. ===== Program semestru ===== ** 1. Algoritmus EM ** (-) (náhrada diskuse, pravidelného bodu 4) Základní informace (jména, web předmětu, plán pro dálkové studium, způsob odevzdání úloh, //10min//), přehled a cíle předmětu ({{:courses:a7b36vyd:prednasky:01-uvod.pdf|slajdy Úvod}}, vysvětlení pojmu vzor, //15min//). (T) Maximální věrohodnost a algoritmus EM ({{:courses:a7b36vyd:prednasky:02-rozdeleni.pdf|EM slajdy}}, //45min//). (Z) Implementace EM ({{:courses:a7b36vyd:cviceni:c03.pdf|zadání}}, ukázky v Matlabu, //15min//). (C) Nepokryto: bayesovské sítě, základy pravděpodobnosti a statistiky, Matlab, RapidMiner, četba: {{:courses:a7b36vyd:prednasky:03-gpm.pdf|slajdy na BN}}, [[http://research.microsoft.com/en-us/um/people/cmbishop/prml|Bishop: Pattern Recognition and Machine Learning (Chapter 8 on GPM)]], další příklady použití EM [[http://ai.stanford.edu/~chuongdo/papers/em_tutorial.pdf|EM1]], [[http://www.cs.huji.ac.il/~yweiss/emTutorial.pdf|EM2]] (//5min//). ** 2. Shluková analýza, algoritmus kMeans ** (T) Shluková analýza, algoritmus kMeans ({{:courses:a7b36vyd:prednasky:p04-shlukovani.pdf|slajdy na shlukovou analýzu}}, //30min//). (Z) Implemenace kMeans ({{:courses:a7b36vyd:cviceni:cv05.pdf|zadání}}, //15min//). (C) Nepokryto: hierarchicke shlukování, detaily pro metriky apod., četba: {{:courses:a7b36vyd:prednasky:p04-shlukovani.pdf|slajdy na shlukovou analýzu}}, [[http://cmp.felk.cvut.cz/cmp/courses/recognition/zapis_prednasky/zapis_02/13/shlukovani.pdf|CMP 11 stránek o hierarchickém a kmeans shlukování]] (//5min//). (D) //40min//. ** 3. Samoorganizující se mapy ** (T) Samoorganizující se mapy ({{:courses:a7b36vyd:prednasky:05-SOM-print.pdf|slajdy na SOM}}, //30min//). (Z) Text mining pomocí SOM (viz zadání úlohy ve cvičení 5 a 6, na rozdíl od denních studentů je předzpracování textů v RapidMineru nepovinné, dostanete tf-idf soubor jako vstup a pracujete se SOM toolboxem v Matlabu, //15min//). (C) Nepokryto: PCA, MDS, četba: [[http://www.cs.cmu.edu/~elaw/papers/pca.pdf|PCA Tutoriál]] (//5min//). (D) //40min//. ** 4. Časté množiny položek, APRIORI ** (T) Časté množiny položek, APRIORI ({{:courses:a7b36vyd:prednasky:06-itemsets.pdf|APRIORI slajdy}},//30min//). (Z) Analýza nákupního košíku ({{:courses:a7b36vyd:cviceni:c08-apriori.pdf|zadání}}, //15min//). (C) Nepokryto: klasifikace dle maximální podmíněné psti, nejbližší soused, četba: {{:courses:a7b36vyd:prednasky:07-class.pdf|slajdy na klasifikaci}} (//5min//). (D) //40min//. ** 5. Rozhodovací stromy ** (T) Klasifikační úloha ({{:courses:a7b36vyd:prednasky:07-class.pdf|úvod do klasifikace}}), rozhodovací stromy ({{:courses:a7b36vyd:prednasky:stromy.pdf|Rozhodovací stromy a pravidla}}, //30min//). (Z) Prořezávání stromu ({{:courses:a7b36vyd:cviceni:c10-dectree.pdf|zadání}}, //15min//). (C) Nepokryto: rozhodovací pravidla ({{:courses:a7b36vyd:prednasky:stromy.pdf|Rozhodovací stromy a pravidla, závěr přednášky}}, další typy klasifikátorů ({{:courses:a7b36vyd:prednasky:07-class.pdf| Klasifikační úloha, závěr přednášky}}) //5min//). (D) //40min//. ** 6. Lineární klasifikace perceptronem ** (T) Lineární klasifikace perceptronem ({{:courses:a7b36vyd:prednasky:09-linear-print.pdf|Lineární klasifkace}}, začátek přednášky, //30min//). (Z) Implementace perceptronu ({{:courses:a7b36vyd:cviceni:2012:cviceni:cv11-zadani.pdf|zadání}}, //15min//). (C) Nepokryto: LDA, logistická regrese ({{:courses:a7b36vyd:prednasky:09-linear-print.pdf|Lineární klasifkace}}, konec přednášky, včetně referencí nebo např. [[http://www.youtube.com/watch?v=_Po-xZJflPM|LR video]] //5min//). (D) //40min//. ** 7. Testování klasifikátorů a klasifikačních algoritmů ** (T) Testování modelů ({{:courses:a7b36vyd:prednasky:3-testovani.pdf|Testování modelů}}, //30min//). (Z) Testování klasifikátorů {{BC_data.zip|BreastCancer dat}} ({{c7-test.pdf|zadání}}), //15min//. (C) Nepokryto: neuronové sítě, algoritmus zpětného šíření ({{:courses:a7b36vyd:prednasky:10-ns-print.pdf|Neuronové sítě}}), kombinování modelů ({{:courses:a7b36vyd:prednasky:12-ensembles-print.pdf|Kombinování modelů}}), //5min//. (D) Diskuse //30min//, ukázka zkouškového testu //10min//. ===== Vyhodnocení úloh ===== ^ Student\č.úlohy ^ 1 ^ 2 ^ 3 ^ 4 ^ 5 ^ 6 ^ 7 ^ Zápočet ^ Celkem ^ | indrama2 | | | | | | | | | | | kotlito1 | 2.5 | 3.5 | 3 | 7 | 3.5 | 7 | 2.5 | **29** | | | pacakja1 | | | | | | | | | | | regaljin | 5 | 7 | 3 | 7 | 6 | 3.5 | 3.5 | **35** | | | zelezpet | 3.5 | 6 | 7 | 7 | 7 | 7 | 7 | **44.5** | | ===== Zkouškové termíny ===== Zkouška spolu s denními studenty. Termíny: 24.1., 3.2., 14.2. ===== Hodnocení ===== - max 50b. za průběh semestru, min 25b. k zápočtu, * body za domácí úlohy, každá úloha za 7b. (úloha č.3 za 8b.), * úlohy odevzdávejte do data příští konzultace do 12h na mail: klema@fel.cvut.cz, * za odevzdanou považujeme úlohu s alespoň 50% bodovým ohodnocením za obsah, * při pozdním odevzdání srážka 50% z maximálního počtu bodů za úlohu (příklad: úloha za 7b. odevzdaná o týden pozdě, za obsah hodnocená 5b. -- konečné hodnocení 5-7*0.5=1.5), - max 50b. u zkoušky, min 25b. k průchodu zkouškou * zkouška shodná s denním studiem, - celkové hodnocení dle ECTS stupnice.