Table of Contents

07 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz I

Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod. [0.5 bodu]

Kvíz II

[bez bodoveho hodnoceni]

Samostatná práce

Práce na úloze Markovské rozhodovací procesy.

Můžete postupně začít pracovat na úloze Posilované učení.

Různé