Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

07 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz I

Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod. [0.5 bodu]

Kvíz II

[bez bodoveho hodnoceni]

Samostatná práce

Práce na úloze Markovské rozhodovací procesy.

Můžete postupně začít pracovat na úloze Posilované učení.

Různé

courses/b3b33kui/cviceni/program_po_tydnech/tyden_08.txt · Last modified: 2019/04/05 08:14 by kostkja2