Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

07 Reinforcement I

  • Kontrola výsledků turnaje Reversi. Hlaste podivnosti.
  • Odpovědi na dotazy.
  • Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz I - cena uzlů náhodné procházky

  • tradiční kvíz, tentokrát na výpočet hodnot stavů při náhodné procházce

Kvíz II - Odhad policy z trénovacích epizod

  • vysvětlení na příkladu
  • bez bodoveho hodnoceni

Samostatná práce

Práce na úloze Markovské rozhodovací procesy.

Dokončení implementace testů pro ověření správnosti specifikace.

Různé

courses/b3b33kui/cviceni/program_po_tydnech/tyden_08.txt · Last modified: 2023/04/28 16:53 by xposik