====== 08 Reinforcement I ====== Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím. ===== Kvíz ===== Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod. ===== Samostatná práce ===== Dokončování úlohy [[courses:b3b33kui:cviceni:sekvencni_rozhodovani:mdps|Markovské rozhodovací procesy]]. V neděli je termín odevzdání. Začátek práce na úloze [[courses:b3b33kui:cviceni:sekvencni_rozhodovani:rl|Posilované učení]]. ===== Různé ===== * [[https://www.youtube.com/watch?v=uH-DNeTAYMM|Mystery game video]], které bylo na začátku přednášky.