Warning
This page is located in archive. Go to the latest version of this course pages.

This is an old revision of the document!


08 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz

Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod.

Samostatná práce

Dokončování úlohy Markovské rozhodovací procesy. V neděli je termín odevzdání.

Začátek práce na úloze Posilované učení

courses/b3b33kui/cviceni/program_po_tydnech/tyden_08.1523350377.txt.gz · Last modified: 2018/04/10 10:52 by svobodat