Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

07 Reinforcement I

Model robota-agenta neznáme, chová se nějak podivně, cestu k cíli neznáme, po cestě navíc nějaké pasti, co s tím.

Kvíz I

  • tradiční kvíz, tentokrát na přímý výpočet Q hodnot z trénovacích epizod
  • bodovaný, bonusových 0.5bodu
  • řešení odevzdat do BRUTE do úlohy lab07quiz, do půlnoci dne, kdy běží dané cvičení
  • formát: textový soubor, fotka řešení na papíře, pdf - co Vám nejlépe vyhovuje a dokážeme to přečíst
  • správné řešení prodiskutujeme na příštím cvičení

Zadání kvíz I

Kvíz II - Odhad policy z trénovacích epizod

Samostatná práce

Různé

courses/b3b33kui/cviceni/program_po_tydnech/tyden_08.txt · Last modified: 2021/04/09 11:41 by kostkja2