Search
Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.
Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod. [0.5 bodu]
[bez bodoveho hodnoceni]
Práce na úloze Markovské rozhodovací procesy.
Můžete postupně začít pracovat na úloze Posilované učení.