Table of Contents
09 Reinforcement III
Kvíz I
Kvíz II - výpočet pomocí aproximace
09 Reinforcement III
Aproximace minimalizující součet čtverců chyb (LSQ)
Učení aproximační Q-funkce
Diskuse k mid-term písemce (pokud budou dotazy)
Kvíz I
tradiční kvíz, tentokrát na výpočet Q hodnot z trénovacích epizod pomocí metody časových diferencí
Kvíz II - výpočet pomocí aproximace
vysvětlení na příkladech
příklad I: aproximace metodou nejmenších čtverců
příklad II: aproximativní Q-learning
bez bodového hodnocení