Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

09 Reinforcement III

 • Hodnoty stavů při náhodné procházce
 • Aproximace minimalizující součet čtverců chyb (LSQ)
 • Učení aproximační Q-funkce
 • Diskuse k mid-term písemce (pokud budou dotazy)

Kvíz I - cena uzlů náhodné procházky

 • tradiční kvíz, tentokrát na výpočet hodnot stavů při náhodné procházce
 • bodovaný, bonusových 0.5bodu
 • řešení odevzdat do BRUTE do úlohy lab09quiz, do půlnoci dne, kdy běží dané cvičení
 • formát: textový soubor, fotka řešení na papíře, pdf - co Vám nejlépe vyhovuje a dokážeme to přečíst
 • správné řešení prodiskutujeme na příštím cvičení

Zadání kvíz I

Kvíz II - výpočet pomocí aproximace

 • on-line výuka, vysvětlení na příkladech
 • příklad I: aproximace metodou nejmenších čtverců
 • příklad II: aproximativní Q-learning
 • bez bodového hodnocení
courses/b3b33kui/cviceni/program_po_tydnech/tyden_09b.txt · Last modified: 2021/04/23 10:48 by kostkja2