A7B36VYD: Vytěžování dat

Anotace

Cílem předmětu je seznámit studenty se základy vytěžování dat (data miningu). Studenti se postupně seznámí se základními úlohami vytěžování dat, odhady parametrů pomocí pravděpodobnosti. Dále se základními metodami shlukové analýzy a metodami vyhodnocení úspěšnosti shlukování, vyhledávání častých množin a sekvencí. Poté se studenti seznámí se základy klasifikace (Bayesovský klasifikátor), následovat budou složitější klasifikační metody - rozhodovací stromy, lineární klasifikace, perceptron a dopředné neuronové sítě. Posledními tématy bude testování vytvořených modelů a kombinování modelů.

Cvičení a zápočet

Na (téměř) každém cvičení bude zadána domácí úloha. Náplní cvičení pak bude úvodní analýza úlohy, konzultace a odevzdávání úlohy minulé. Konzultace mimo cvičení jsou možné po předchozí domluvě. Preferovaná forma konzultací je ale přes fórum předmětu.

  • Z každé úlohy se vypracovává krátký protokol, rozsahem přibližně jedna strana A4. Požadovaný obsah protokolu viz jednotlivá cvičení, a to vždy před zadáním další bodované úlohy. Deadline pro úlohy je většinou následující týden od zadání. Explicitní deadline viz jednotlivé úlohy v upload systému.
  • Veškeré zdrojové kódy (MATLAB) musí být přiloženy.
  • Deadline na odevzdání je půlnoc z pondělí na úterý odevzdávacího týdne.
  • Programovací/softwarovou část úlohy můžete ladit ještě i po deadlinu až do odevzdání na cvičení. Stejně tak, pokud při odevzdání na cvičení vyplují na povrch drobné nedostatky, máte šanci je opravit přímo na cvičení bez ztráty bodů.
  • Za úlohy, resp. protokoly se udílí až 3-8 bodů (dohromady max 50 bodů), které si student odnáší ke zkoušce. Úspěšné splnění úkolu posuzuje cvičící systémem „splnil/nesplnil“.
  • Pokud je úloha splněná s týdenním zpožděním, maximální počet bodů se snižuje na polovinu.
  • Při zpoždění o další týden již není možné získat bodové ohodnocení, avšak úlohu stále lze odevzdat a úspěšně splnit.
  • Jakmile dojde k překročení i této lhůty (zpoždění 2 a více týdnů), student ztrácí možnost získání zápočtu.

Účast na cvičeních je povinná. V případě nejasností v odevzdaném protokolu totiž můžete být vyzváni k demonstraci úlohy. Jinými slovy, neomluvenou neúčastí na cvičení riskujete neudělění plného počtu bodů za příslušnou úlohu, v extrémním případě i nesplnění úlohy.

Zkouška

Zkouška bude probíhat formou písemného testu. Maximálně můžete získat 50 bodů. Abyste uspěli, musíte získat minimálně 25 bodů. Test se bude skládat z otázek, na které budete odpovídat zaškrtnutím správných odpovědí (správně může být 0 až N odpovědí). Druhou částí testu budou otázky, které budou vyžadovat odpověď ve “volném textu”. Volný text zda znamená odpověď na otázku, nakreslení obrázku apod.

Výsledná známka se uděluje na základě součtu bodů ze cvičení a ze zkoušky podle následující tabulky.

ECTS známka A B C D E F
Počet bodů 100-90 89-80 79-70 69-60 59-51 50-0

Pokud vám bude chybět 3 nebo méně bodů k lepší známce, nebo dosáhnete mezi 22-24 body z písemného testu, můžete přijít na ústní přezkoušení a pokusit se potřebné body získat. Ústní přezkoušení bude následovat po oznámení výsledků písemné zkoušky.

Odkazy

Literatura

  • Jiří Lažanský, Vladimír Mařík a Olga Štěpánková: Umělá inteligence (1), Academia 2000
  • Petr Berka: Dobývání znalostí z databází, Academia 2005
  • Richard O. Duda, Peter E. Hart, David G. Stork: Pattern Classification, Wiley Interscience 2001

Učitelé

Konzultace jsou možné po předchozí domluvě. Preferovaná forma konzultací je přes diskusní fórum předmětu.

 
Groups:
courses/a7b36vyd/start.txt · Last modified: 2016/11/16 17:53 by andelmi2