====== 09 Reinforcement III ====== * Hodnoty stavů při náhodné procházce * Aproximace minimalizující součet čtverců chyb (LSQ) * Učení aproximační Q-funkce * Diskuse k mid-term písemce (pokud budou dotazy) {{page>courses:b3b33kui:internal:quizzes#Cena uzlů náhodné procházky}} {{page>courses:b3b33kui:internal:quizzes#Nejmenší čtverce}} {{page>courses:b3b33kui:internal:quizzes#Aproximativní Q-learning}}