====== 09 Reinforcement III ======
  * Hodnoty stavů při náhodné procházce
  * Aproximace minimalizující součet čtverců chyb (LSQ)
  * Učení aproximační Q-funkce
  * Diskuse k mid-term písemce (pokud budou dotazy)


{{page>courses:b3b33kui:internal:quizzes#Cena uzlů náhodné procházky}}

{{page>courses:b3b33kui:internal:quizzes#Nejmenší čtverce}}

{{page>courses:b3b33kui:internal:quizzes#Aproximativní Q-learning}}