Table of Contents

07 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz I - cena uzlů náhodné procházky

Kvíz II - Odhad policy z trénovacích epizod

Samostatná práce

Práce na úloze Markovské rozhodovací procesy.

Různé