Rozvrh B4M33DZO Odevzdávací systém pro studentské úlohy Diskusní fórum

B4M33DZO - Digitální obraz

Přednáška s ohledem na žádanou racionalizaci slouží jak předmětům B4M33DZO Digitální obraz, BE4M33DZO v angličtině a přednášku také navštěvují studenti doktorského předmětu XP33ZVD Základy počítačového vidění.

Před začátkem semestru k 2021-09-19 je zapsán tento počet studentů B4M33DZO 71, BE4M33DZO 2, XP33ZVD 8.

Předmět většinou přednáším anglicky s ohledem na předmět BE4M33DZO a na pravidlo FEL ČVUT v magisterském studiu, kdy se předmět přednáší anglicky, je-li v posluchárně alespoň jeden student nerozumějící česky. Stránky v angličtině včetně odkazů na anglické prezentace přednášek jsou zde. Když na přednášce nebudou studenti, kteří česky nerozumějí, bude přednáška v češtině.

Cíl předmětu

Předmět naučí v počítači reprezentovat, zpracovávat a interpretovat 2D obraz. V první části předmětu se naučíme obraz zpracovávat jako signál bez interpretace. Bude vysvětleno pořízení obrazu, lineární i nelineární metody předzpracování a komprese obrazu. Ve druhé části se naučíme metodám segmentace a registrace 2D obrazů. Látka je v laboratorních cvičeních procvičována na aplikačních příkladech, a tak student získá i praktické dovednosti.

Očekávané předběžné znalosti

Předpokládá se, že studenti předmětu znají matematickou analýzu, lineární algebru, pravděpodobnost a statistiku v rozsahu vyučovaném na FEL. Očekává se také základní programovací dovednost, a to především v MATLABu.

Nabízím studentům jako pomoc při posilování znalosti v prerekvizitách předmětu následující prezentace.

Autor Prezentace a odkaz na ni
V. Hlaváč Probability and statistics, rehearsal
V. Hlaváč Least squares

Přednášky: Středa 9:15-10:45, posluchárna KN:E-301

Pro případ studenta v karanténě nebo když nebudeme moci přednášet prezenčně, je připravený kanál Microsoft Teams spojený pro všechny tři předměty Všichni studenti zapsaní do těchto tří předmětů mají ke kanálu přístup.

Přednášející: Václav Hlaváč, Torsten Sattler,Radoslav Škoviera.

Rozsah: 2 h přednáška + 2 h cvičení + 5 h domácí práce týdně.

Průsvitky pro přednášky jsou k dispozici v češtině na http://people.ciirc.cvut.cz/~hlavac/TeachPresCz/ a v angličtině na http://people.ciirc.cvut.cz/~hlavac/TeachPresEn/. Když se připravuji na konkrétní přednášku, typicky průsvitky vylepšuji.

Týden Datum Obsah Poznámky
1. 22.09.2021 Počítačové vidění. Objekty v obraze. Interpretace. Digitální obraz, pojmy. Transformace jasu.
2. 29.09.2021 Fyzikální podstata obrazu. Optické hledisko. Radiometrické hledisko Cv. 1, transf. jasu
3. 06.10.2021 Geometrické transformace, interpolace. Dynamické programování.
4. 13.10.2021 Zpracování v prostorové oblasti. Konvoluce, korelace. Filtrace šumu. Cv. 2, seam carving, dyn. programování
5. 20.10.2021 Fourierova transformace. Vzorkovací věta. Frekvenční filtrace obrazů. Homomorfický filtr. Obnovení obrazu.
6. 27.10.2021 Detekce hran. Prostor měřítek. Cannyho detektor. Detekce významných bodů/oblastí. Cv. 3, HDR
7. 03.11.2021 (Torsten Sattler) Segmentace obrazů - prahováním, k-průměrů, EM algoritmus
8. 10.11.2021 (Torsten Sattler) Segmentace obrazů - posunem těžiště, Grafy, grafové algoritmy Segmentace hledáním maximálního řezu v grafu. Cv. 4, segmentace
9. 17.11.2021 Státní svátek Bez přednášky i cvičení
10. 24.11.2021 Metoda hlavních směrů. Vlnková transformace.
11. 01.12.2021 Registrace obrazů a objektů v obrazech. Cv. 5, registrace
12. 08.12.2021 Matematická morfologie, binární. Matematická morfologie, šedivá. Cv. 6, Obnovení obrazů
13. 15.12.2021 (Radoslav Škoviera) Barevné obrazy a zpracování barevných obrazů.
14. 05.01.2022 Komprese obrazů. Komprese videa.

Cvičení

Cvičící: Vojtěch Pánek, Maxime Pitrantoni, Jiří Sedlář, Radoslav Škoviera (head of the lab/seminars). Detaily ke cvičením jsou uvedeny v samostatné sekci, a to vždy v kanálu pro příslušný předmět cvičení.

Upozornění: Podle Studijního a zkušebního řádu ČVUT je navštěvování přednášek nepovinné. Pro návštěvu cvičení ovšem požadujeme teoretickou znalost procvičované problematiky (podle programu cvičení), která bude vyučována na předcházejících přednáškách. Když student chce, může si látku před cvičením doplnit z doporučené literatury.

Zkouška a hodnocení

(Studenti doktorandského předmětu XP33ZVD se o zkoušce dohodnou individuálně.)

  • Zkoušeni mohou být jen ti studenti, kteří mají nárok na zápočet ze cvičení.
  • Zkouška má dvě části, písemnou a ústní. Písemka ověřuje rámcovou orientaci studenta v předmětu. V písemné části student odpovídá na typicky šest otázek, které budou vybrány ze seznamu otázek Otázky se mohou mírně měnit do konce prosince. Otázky pro konkrétní zkoušku jsou vybírány náhodně. Student má na napsání písemky 30 minut. Celkem lze z písemky získat maximálně 30 bodů.
  • U ústní zkoušky se diskutuje nad vědeckým článkem vztahujícím se k digitálnímu zpracování obrazu, který si student sám najde a prostuduje. V ústní části učitel ověřuje studentovy hlubší znalosti v oblasti, kterou si sám vybral a prostudoval. Ověřuje se také schopnost zařadit tuto znalost do kontextu předmětu a studentova předchozího studia. Článek má být v angličtině, z nedávné doby (ne starší než pět let), ze špičkového vědeckého časopisu (vyberte z: IEEE Transactions on Pattern analysis and Machine Intelligence, IEEE Transactions on Image Processing, International Journal on Computer Vision, Image Vision and Computing, atd.). Pozor, ne všechny IEEE publikace jsou časopisy. Studenti se mohou o výběru článku poradit se cvičícími. K časopisům studenti mají elektronický přístup přes příslušný portál placený ČVUT, viz Ústřední knihovna ČVUT nebo přímo na portál. Student musí znát a na kopii článku napsat bibliografické údaje o článku, tj. nemůže jít o jen tak o nějaký z webu stažený text. Další tipy pro výběr článku můžete najít zde.
  • Ústní část zkoušky následuje po opravě písemek.
  • Výsledná známka se určí součtem bodů ze cvičení (max. 40 bodů), písemné části (max. 30 bodů) a ústní části (max. 30 bodů). Celkový počet dosažitelných bodů je tedy 100.
  • A 100-90 bodů, B 89-80 bodů, C 79-70 bodů, D 69-60 bodů, E 59-50, F < 50 bodů.

Literatura

  • Hlaváč V., Sedláček M.: Zpracování signálů a obrazů, skriptum, Vydavatelství ČVUT 2009. Obrazová část je ve druhé části skripta a zahrnuje jen část zpracování obrazu bez interpretace.
  • Šonka M., Hlaváč V., Boyle R.: Image Processing, Analysis and Machine vision, 3rd edition, Thomson Learning, Toronto, Canada, 2007. Asi deset kopií je k dispozici v knihovně Centra strojového vnímání, katedry kybernetiky FEL. Zájemci nechť kontaktují sekretářku Ing. Hanu Pokornou.
  • Svoboda T., Kybic J., Hlaváč V.: Image Processing, Analysis and Machine Vision – A MATLAB Companion. Thomson, Toronto, Canada, 1 edition, 2007. Asi deset kopií je k dispozici v knihovně Centra strojového vnímání, katedry kybernetiky FEL. Zájemci nechť kontaktují sekretářku Ing. Hanu Pokornou.
  • Szeliski R.: Computer Vision: Algorithms and Application, Springer, Berlin, 2010. 812 p. The book draft is freely available for download
  • Karu Z.Z.: Signals and Systems Made Ridiculously Easy, ZiZi Press, Cambridge, MA, USA, 2001, (možno stáhnout naskenovanou). Velmi útlou knihu doporučuji těm, kdo neprošli kursem zpracování signálů, ale i těm, kdo si chtějí upevnit základ nepříliš formálním čtením.
  • Doxiadēs, A. K., Papadimitriou, C. H., Papadatos, A., & Di, D. A. Logicomix. An Epic Search for Truth. New York: Bloomsbury, 2009. You can download a free copy from https://archive.org/details/Logicomix-Comic-EarlyLifeOfBertrandRussell/mode/2up
  • Doxiadēs, A. K., Papadimitriou, C. H., Papadatos, A., & Di, D. A. Logikomiks, Hledání absolutní pravdy, český překlad Dokořán 2012, ISBN: 978-80-7363-401-8 / 336 stran, přeložil Jaroslav Peregrin
courses/b4m33dzo/start.txt · Last modified: 2021/09/22 13:53 by hlavac