Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

09 Reinforcement III

  • Hodnoty stavů při náhodné procházce
  • Aproximace minimalizující součet čtverců chyb (LSQ)
  • Učení aproximační Q-funkce
  • Diskuse k mid-term písemce (pokud budou dotazy)

Kvíz I - cena uzlů náhodné procházky

  • tradiční kvíz, tentokrát na výpočet hodnot stavů při náhodné procházce
  • bodovaný, bonusových 0.5bodu
  • řešení odevzdat do BRUTE do úlohy lab09quiz, do půlnoci dne, kdy běží dané cvičení
  • formát: textový soubor, fotka řešení na papíře, pdf - co Vám nejlépe vyhovuje a dokážeme to přečíst
  • správné řešení prodiskutujeme na příštím cvičení

Zadání kvíz I

Kvíz II - výpočet pomocí aproximace

  • on-line výuka, vysvětlení na příkladech
  • příklad I: aproximace metodou nejmenších čtverců
  • příklad II: aproximativní Q-learning
  • bez bodového hodnocení
courses/b3b33kui/cviceni/program_po_tydnech/tyden_09b.txt · Last modified: 2020/05/10 19:30 by kostkja2