====== 08 Reinforcement I ======
Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

===== Kvíz =====
Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod.

===== Samostatná práce =====
Dokončování úlohy [[courses:b3b33kui:cviceni:sekvencni_rozhodovani:mdps|Markovské rozhodovací procesy]]. V neděli je termín odevzdání.

Začátek práce na úloze [[courses:b3b33kui:cviceni:sekvencni_rozhodovani:rl|Posilované učení]].

===== Různé =====
  * [[https://www.youtube.com/watch?v=uH-DNeTAYMM|Mystery game video]], které bylo na začátku přednášky.