Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

08 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz

Tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod.

Samostatná práce

Dokončování úlohy Markovské rozhodovací procesy. V neděli je termín odevzdání.

Začátek práce na úloze Posilované učení.

Různé

courses/b3b33kui/cviceni/program_po_tydnech/tyden_08.txt · Last modified: 2018/04/11 12:42 by svobodat