[[https://intranet.fel.cvut.cz/cz/education/rozvrhy-ng.B242/public/html/predmety/46/84/p4684106.html|Rozvrh B4M33DZO]]
[[https://cw.felk.cvut.cz/upload/|Odevzdávací systém]]
[[https://cw.felk.cvut.cz/forum/forum-1920.html|Diskusní fórum]]
====== B4M33DZO - Digitální obraz LS 2025 ======
===== Cíl předmětu =====
Předmět představuje základní principy digitálního zpracování obrazu. V průběhu semestru je látka procvičena formou šesti implementačních úloh, díky kterým si posluchači osvojí teoretické znalosti z přednášek a využijí je k řešení praktických problémů.
===== Prerekvizity =====
Předpokládá se, že studenti předmětu znají matematickou analýzu, lineární algebru, pravděpodobnost a statistiku v rozsahu vyučovaném na ČVUT FEL. Očekává se také základní programovací dovednost, a to především v [[https://www.mathworks.com/products/matlab.html|MATLABu]].
===== Přednášky =====
Přednášející:
* [[https://cmp.felk.cvut.cz/~drbohlav/|Ondřej Drbohlav]] (ČVUT FEL, Katedra kybernetiky, místnost KN:E-215)
* [[https://dcgi.fel.cvut.cz/~sykorad/|Daniel Sýkora]] (ČVUT FEL, Katedra počítačové grafiky a interakce, místnost KN:E-422)
Čas a místo: **Pondělí 16:15-17:45**, posluchárna **T2:C3-135**
Rozsah: **2 hodiny** týdně
^ Týden ^ Datum ^ Obsah ^ Výukové materiály ^
| 1. | 17.2.2025 | **Bodové (monadické) operace** - obraz a jeho histogram, změna jasu a kontrastu, prahování, negativ, kvantizace, gama korekce, ekvalizace a mapování histogramu | {{ :courses:dzo:l01_2025.pdf |slides}} / video: [[https://youtu.be/LgqinczUQqc https://youtu.be/7E83-R6Hcak| CZ]] previous: [[https://youtu.be/7E83-R6Hcak|CZ1]] [[https://youtu.be/jwFGq3eJI60|CZ2]], [[https://youtu.be/RdZOJWowY0Q|EN1]], [[https://youtu.be/K5I8cvUqSUw|EN2]] |
| 2. | 24.2.2025 | **Fourierova transformace** - základní princip Fourierovy transformace v 1D a 2D, bázové funkce, časová a frekvenční oblast, význam amplitudy a fáze, diskrétní Fourierova transformace, rychlá Fourierova transformace, vzorkovací teorém | {{ :courses:dzo:l02.pdf |slides}} / video: [[https://youtu.be/SAlWMzuDxI0|CZ1]], [[https://youtu.be/VsRm-m1Zc1k|CZ2]], [[https://youtu.be/FaKTCyXp9kc|EN1]], [[https://youtu.be/_zYY3X96wV4|EN2]] |
| 3. | 3.3.2025 | **Konvoluce** - základní princip konvoluce v 1D a 2D, zrychlení výpočtu s využitím separabilních jader, mip-mappingu, integrálního obrazu a Fourierovy transformace | {{ :courses:dzo:l03.pdf | slides}} / video: [[https://youtu.be/p38h4QIXwrc|CZ1]], [[https://youtu.be/KeJyygtmOd8|CZ2]], [[https://youtu.be/qVaRvLn8gbA|EN1]], [[https://youtu.be/PSgS8JqR6xg|EN2]] ([[http://dl.acm.org/ft_gateway.cfm?id=15921&type=pdf&CFID=85229293&CFTOKEN=92024084|1]], [[http://onlinelibrary.wiley.com/doi/10.1111/j.1467-8659.2005.00880.x/pdf|2]]) |
| 4. | 10.3.2025 | **Lineární filtrace** - aplikace 1D a 2D konvoluce: potlačení šumu, detekce hran, rozostření, ostření, Wienerova filtrace, anti-aliasing, hloubka ostrosti, rozmazání pohybem, hybridní obraz | {{ :courses:dzo:l04.pdf |slides}} / video: [[https://youtu.be/MqJlvsSZl2w|CZ1]], [[https://youtu.be/fL1uE2CEJtk|CZ2]], [[https://youtu.be/Rj-UrE1FvIM|EN1]], [[https://youtu.be/HyDHY6k5l_o|EN2]] ([[http://olivalab.mit.edu/abstracts/acm_transactions_graphics.html|1]]) |
| 5. | 17.3.2025 | **Nelineární filtrace** - bilaterální filtr a jeho vlastnosti, zrychlení výpočtu s využitím obdélníkových jader, po částech lineární aproximace a bilaterální mřížky, aplikace: potlačení šumu při zachování ostrých hran, digitální líčení, abstrakce, mapování tónů pro obrazy s vysokým dynamickým rozsahem, modifikace vzhledu, fúze detailů, simulace vysokého dynamického rozsahu, změna materiálu/textury, odstranění odlesků, potlačení šumu s využitím blesku, zaostření hloubkové mapy | {{ :courses:dzo:l05.pdf |slides}} / video: [[https://youtu.be/-0lP30fzSfs|CZ1]], [[https://youtu.be/847SVwGix_g|CZ2]], [[https://youtu.be/CVB8jiDJmYk|EN1]],[[https://youtu.be/HyDHY6k5l_o|EN2]] ([[http://www.shellandslate.com/fastmedian.html|1]], [[http://www.csbio.unc.edu/mcmillan/pubs/sig05_bennett.pdf|2]], [[http://groups.csail.mit.edu/graphics/bilagrid/|3]], [[https://dl.acm.org/doi/abs/10.1145/1141911.1142018|4]], [[http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MANDUCHI1/Bilateral_Filtering.html|5]], [[http://johanneskopf.de/publications/jbu|6]], [[http://people.csail.mit.edu/fredo/PUBLI/flash/index.htm|7]], [[http://people.csail.mit.edu/fredo/PUBLI/Siggraph2002/|8]], [[http://research.microsoft.com/en-us/um/redmond/projects/flashnoflash|9]]) |
| 6. | 24.3.2025 | **Editace obrazu** - lineární a multi-pásmové sešívání obrazu, Laplaceova pyramida, editace v gradientní oblasti a její aplikace: sešívání, klonování, vyhlazování, fúze, zvýraznění kontextu, konverze barevného obrázku do odstínů šedi, difuzní křivky | {{ :courses:dzo:l06.pdf |slides}} / video: [[https://youtu.be/Gjl8A_4JtBI|CZ1]], [[https://youtu.be/QOGGbcpvYYA|CZ2]], [[https://youtu.be/bcpWYwCy_Js|EN1]], [[https://youtu.be/3tcLf_lYdrU|EN2]] ([[http://persci.mit.edu/pub_pdfs/spline83.pdf|1]], [[https://www.cs.jhu.edu/~misha/Fall07/Papers/Perez03.pdf|2]], [[http://graphics.cs.cmu.edu/projects/gradient-paint/|3]]) |
| 7. | 31.3.2025 | **Deformace obrazu** - posuv, rotace, změna měřítka, zkosení, afinní a projektivní transformace, zpětné mapování, bilineární převzorkování, pohybující se nejmenší čtverce, zachování tuhosti a podobnosti | {{ :courses:dzo:l07.pdf |slides}} / video: [[https://youtu.be/olaNN6OiJMk|CZ1]], [[https://youtu.be/NM5D6tdogI8?si=-3ystZy4J8rGO9W5|CZ2]], [[https://youtu.be/ic-gHqIkRYc|EN1]], [[https://youtu.be/uaFQGBRWyLg|EN2]] ([[http://faculty.cs.tamu.edu/schaefer/research/mls.pdf|1]]) |
| 8. | 7.4.2025 | **Registrace obrazu 1** - metriky pro měření podobnosti obrazů, odhad posuvu, fázová korelace, odhad rotace a změny měřítka, log-polární a Fourier-Mellin transformace, | {{ :courses:dzo:l8.pdf |slides}} / video: [[https://youtu.be/hRj0WC40sqE|CZ1]], [[https://youtu.be/8RV4-yprNZQ|CZ2]], [[https://youtu.be/rbQOCse-YHo|EN1]], [[https://youtu.be/U4YCO8gxwXE|EN2]] ([[http://www.ri.cmu.edu/pub_files/pub3/lucas_bruce_d_1981_2/lucas_bruce_d_1981_2.pdf|1]], [[http://www.ri.cmu.edu/pub_files/pub3/baker_simon_2004_1/baker_simon_2004_1.pdf|2]], [[https://people.cs.nctu.edu.tw/~yschen/papers/TIP01-winup.pdf|3]]) |
| 9. | 14.4.2025 | **Registrace obrazu** - pokračování | {{ :courses:dzo:l8.pdf |slides}} / video: [[https://youtu.be/hRj0WC40sqE|CZ1]], [[https://youtu.be/dAzCkwRo1cI|CZ2]], [[https://youtu.be/jWwahkWZsRE|EN1]], [[https://youtu.be/7AoJHVGymP0|EN2]] ([[https://ieeexplore.ieee.org/document/506761|1]], [[http://dcgi.felk.cvut.cz/home/sykorad/deform.html|2]], [[http://dcgi.felk.cvut.cz/home/sykorad/textoons.html|3]], [[http://graphics.cs.cmu.edu/people/efros/research/EfrosLeung.html|4]]) |
| 10. | 21.4.2025 | Velikonoční pondělí | |
| 11. | 28.4.2025 | **Registrace obrazu 2** - block-matching a jeho výpočetně méně náročné varianty: předčasné ukončení, hierarchický sestup, strategie vítěz-bere-první, gradientní sestup pro translaci a obecnější parametrické transformace. Významné body v obraze, Harrisův detektor, deskriptory založené na histogramu, určení transformace pomocí korespondencí. | {{ :courses:dzo:l9.pdf |slides}} / video: [[https://youtu.be/xw4j48YeNOE|CZ]], [[https://youtu.be/JMILEU9SOCQ|EN1]], [[https://youtu.be/d-OD0-c3eX8|EN2]] ([[https://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf|1]], [[http://matthewalunbrown.com/autostitch/autostitch.html|2]], [[http://mesh.brown.edu/DGP/pdfs/Fitzgibbon-etal-98.pdf|3]]) |
| 12. | 5.5.2025 | **Segmentace obrazu** - základní vlastnosti algoritmů interaktivní segmentace obrazu, modifikace a rozšíření optimalizačních kritérií: barevný model, nepřesná specifikace pozadí a popředí, více segmentů, kolorizace, aplikace: odhad alfa-kanálu, přebarvení, interaktivní mapování tónů, vybarvování ručních kreseb | {{ :courses:dzo:l11.pdf | slides1}} {{ :courses:b4m33dzo:l12.pdf |slides2}} / video: [[https://youtu.be/lS01Hu_AVgo|CZ1]], [[https://youtu.be/oSBdFtSczNA|CZ2]], [[https://youtu.be/KoNVOURzuxQ|EN1]], [[https://youtu.be/vmOYciDLIis|EN2]] ([[http://dcgi.felk.cvut.cz/home/sykorad/lazybrush.html|1]], [[http://grail.cs.washington.edu/projects/photomontage/|2]], [[http://www.cs.huji.ac.il/~yweiss/Colorization/|3]]) |
| 13. | 12.5.2025 | **Segmentace** (dokončení) | video: [[https://youtu.be/WAFCRMqyEeM|CZ1]], [[https://youtu.be/HubsSjG3XJQ|CZ2]], [[https://youtu.be/WIdqCfXpsc8|EN1]], [[https://youtu.be/WBSJ9iGvq-I|EN2]] ([[http://vision.cse.psu.edu/people/chenpingY/paper/grady2006random.pdf|1]], [[http://www.csd.uwo.ca/~yuri/Papers/ijcv06.pdf|2]], [[http://leogrady.net/wp-content/uploads/2017/01/sinop2007linf.pdf|3]]) |
| 14. | 19.5.2025 | Přednáška **Dana Sýkory** o současných metodách ve zpracování obrazu: **Towards High-quality Replication of Visual Appearance** | ([[https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_2016_paper.pdf|1]], [[https://people.mpi-inf.mpg.de/~elgharib/projects/PaintingStyle/index.html|2]], [[https://openaccess.thecvf.com/content_CVPR_2019/papers/Kolkin_Style_Transfer_by_Relaxed_Optimal_Transport_and_Self-Similarity_CVPR_2019_paper.pdf|3]], [[https://dl.acm.org/doi/abs/10.5555/3495724.3496298|4]], [[https://proceedings.mlr.press/v139/radford21a/radford21a.pdf|5]], [[https://dcgi.fel.cvut.cz/home/sykorad/dia.html|6]], [[https://proceedings.mlr.press/v162/nichol22a/nichol22a.pdf|7]], [[https://openaccess.thecvf.com/content/CVPR2024/papers/Hertz_Style_Aligned_Image_Generation_via_Shared_Attention_CVPR_2024_paper.pdf|8]], [[https://openreview.net/pdf?id=9VbGjXLzig|9]], [[https://www.wisdom.weizmann.ac.il/~vision/VideoCompletion.html|10]], [[https://sites.cc.gatech.edu/cpl/projects/textureoptimization/|11]], [[https://dcgi.fel.cvut.cz/home/sykorad/stylit|12]], [[https://mrl.cs.nyu.edu/projects/image-analogies/|13]],[[https://dcgi.fel.cvut.cz/home/sykorad/facestyle|14]], [[https://dcgi.fel.cvut.cz/home/sykorad/styleblit|15]], [[https://ondrejtexler.github.io/faceblit/|16]], [[https://dcgi.fel.cvut.cz/home/sykorad/toonsynth|17]], [[https://dcgi.fel.cvut.cz/home/sykorad/styleprop|18]], [[https://dcgi.fel.cvut.cz/home/sykorad/ebsynth|19]], [[https://dcgi.fel.cvut.cz/home/sykorad/stylebin|20]], [[https://www.mmlab-ntu.com/project/fresco/|21]]) |
===== Cvičení =====
Cvičící:
* [[https://cmp.felk.cvut.cz/~cechj/|Jan Čech]] (ČVUT FEL, Katedra kybernetiky, místnost KN:G-2)
* [[https://www.ciirc.cvut.cz/people/people-list/?uid=skovirad|Radoslav Škoviera]] (ČVUT CIIRC, místnost JP:B-611a)
* [[https://dcgi.fel.cvut.cz/~sykorad/|Daniel Sýkora]] (ČVUT FEL, Katedra počítačové grafiky a interakce, místnost KN:E-422)
* Simona Kocour (ČVUT CIIRC)
* [[https://cmp.felk.cvut.cz/~drbohlav/|Ondřej Drbohlav]] (ČVUT FEL, Katedra kybernetiky, místnost KN:E-215)
Čas a místo: **Úterý 14:30-16:00 a 16:15-17.45** , učebna **KN:E-230**
Rozsah: **2 hodiny** týdně
^ Týden ^ Datum ^ Obsah ^ Cvičící ^
| 1. | 18.2.2025 | [[courses:dzo:labs:0_matlab:start|Úvod do MATLABu]] | **Jan Čech**, **Radoslav Škoviera**, **Daniel Sýkora**, **Ondřej Drbohlav** |
| 2. | 25.2.2025 | [[courses:dzo:labs:1_monadic_functions:start|Monadické operace 1]] - jas, kontrast, gama korekce, histogram, ekvalizace a mapování histogramu | **Ondřej Drbohlav** |
| 3. | 4.3.2025 | [[courses:dzo:labs:1_monadic_functions:start|Monadické operace 2]] - odevzdání 1. úlohy (10 bodů) | **Ondřej Drbohlav** |
| 4. | 11.3.2025 | [[courses:dzo:labs:3_fourier|Fourierova transformace 1]] - 2D FFT, zobrazení spektra, obrazy základních funkcí, spektrum posunutých a rotovaných obrazů, vzorkovací teorém, aliasing | **Jan Čech** |
| 5. | 18.3.2025 | [[courses:dzo:labs:3_fourier|Fourierova transformace 2]] - odevzdání 2. úlohy (10 bodů) | **Jan Čech** |
| 6. | 25.3.2025 | [[courses:dzo:labs:4_filtering|Lineární a nelineární filtrace 1]] - konvoluce, využití Fourierovy transformace, separabilní jádro, rozmazání, detekce hran, dekonvoluce, bilaterální filtr | **Radoslav Škoviera** |
| 7. | 1.4.2025 | [[courses:dzo:labs:4_filtering|Lineární a nelineární filtrace 2]] - odevzdání 3. úlohy (10 bodů) | **Radoslav Škoviera** |
| 8. | 8.4.2025 | [[courses:dzo:labs:5_poisson|Editace obrazu 1]] - editace v gradientní oblasti řešením Poissonovy rovnice soustavou lineárních rovnic a Fourierovou transformací, klonování obrazu, mixování gradientů | **Simona Kocour** |
| 9. | 15.4.2025 | [[courses:dzo:labs:5_poisson|Editace obrazu 2]] - odevzdání 4. úlohy (10 bodů) | **Simona Kocour** |
| 10. | 22.4.2025 | [[courses:dzo:labs:6_reg|Registrace obrazu 1]] - geometrické transormace a teoretická příprava na odhad posuvu pomocí fázové korelace. | **Ondřej Drbohlav** |
| 11. | 29.4.2025 | [[courses:dzo:labs:6_reg1|Registrace obrazu 2]] - odhad translace a posunutí pomocí fázové korelace a polární transformace ve frekvenční oblasti. (10 bodů) | **Ondřej Drbohlav** |
| 12. | 6.5.2025 | výuka podle čtvrtečního rozvrhu | |
| 13. | 13.5.2025 | [[courses:dzo:labs:7_segment|Segmentace obrazu 1]] - maximalizace toku v síti | **Ondřej Drbohlav** |
| 14. | 20.5.2025 | [[courses:dzo:labs:7_segment|Segmentace obrazu 2]] - odevzdání 6. úlohy (10 bodů) | **Ondřej Drbohlav** |
Celkově je možné na cvičeních získat 60 bodů. Pro získání zápočtu je nutné nasbírat nejméně 30 bodů.
===== Zkouška =====
Zkouška je písemná. Pokrývá veškerá probraná témata:
* Monadické operace (jednoduché operace s jasem, ekvalizace a mapování histogramu)
* Fourierova transformace (formulace, vlastnosti, vzorkovací teorém)
* Konvoluce (formulace, vlastnosti, zrychlení výpočtu, aplikace)
* Zaostření obrazu (formulace, řešení pomocí Wienerovy filtrace)
* Bilaterální filtr (formulace, zrychlení výpočtu, aplikace)
* Editace obrazu v gradientní oblasti (formulace, řešení, aplikace)
* Deformace obrazu (1, 2, 3, 4-bodová)
* Registrace obrazu (translace, metody řešení)
* Registrace obrazu (translace, rotace a změna měřítka s pomocí Fourier-Mellin)
* Segmentace obrazu (formulace, řešení pomocí maximálního toku v síti, aplikace)
* Segmentace obrazu (formulace, řešení pomocí metody náhodného chodce, aplikace)
V případě nejasností může být student pozván ještě na ústní zkoušku, ta se domluví přes email. Za test je možné získat 40 bodů, prahem pro absolvování zkoušky je polovina, 20 bodů.
===== Hodnocení =====
Výsledná známka je určena součtem bodů získaných ze cvičení (maximálně 60) a ze zkoušky (maximálně 40):
^ Známka ^ Bodové rozmezí ^ Slovní hodnocení ^
| A | 90 a více | výborně |
| B | 80 až 89 | velmi dobře |
| C | 70 až 79 | dobře |
| D | 60 až 69 | uspokojivě |
| E | 50 až 59 | dostatečně |
| F | méně než 50 | nedostatečně |
===== Literatura =====
* He J., Kim C.-S., Kuo C.-C. J.: //Interactive Segmentation Techniques: Algorithms and Performance Evaluation//, Springer, 2014.
* Radke R. J.: //Computer Vision for Visual Effects//, Cambridge University Press, 2012.
* Goshtasby A. A.: //Image Registration: Principles, Tools and Methods//, Springer, 2012.
* Paris S., Kornprobst P., Tumblin J., Durand F.: //Bilateral Filtering: Theory and Applications//, Now Publishers, 2009.
* Gonzalez R. C., Woods R. E.: //Digital Image Processing (3rd Edition)//, Prentice Hall, 2008.
* Šonka M., Hlaváč V., Boyle R.: //Image Processing, Analysis and Machine vision (3rd Edition)//, Thomson Learning, 2007.
* Pratt W.: //Digital Image Processing (3rd Edition)//, John Wiley, 2004.