Table of Contents

08 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz

Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod.

Samostatná práce

Dokončování úlohy Markovské rozhodovací procesy. V neděli je termín odevzdání.

Začátek práce na úloze Posilované učení.

Různé