09 Reinforcement III
Hodnoty stavů při náhodné procházce
Aproximace minimalizující součet čtverců chyb (LSQ)
Učení aproximační Q-funkce
Diskuse k mid-term písemce (pokud budou dotazy)