Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
courses:b3b33kui:cviceni:program_po_tydnech:tyden_07 [2024/04/04 12:44]
kostkja2 [Zadání]
courses:b3b33kui:cviceni:program_po_tydnech:tyden_07 [2024/05/10 09:06]
kostkja2 [Value Iteration]
Line 50: Line 50:
  
 ==== Value Iteration ==== ==== Value Iteration ====
-  * iterovat: aktualizovat hodnoty $V(s)$ dokud se mění ​více než zadané ​$\epsilon$+  * iterovat: aktualizovat hodnoty $V(s)$ dokud se významně ​mění ​(více než $\epsilon ​\cdot (1-\gamma)/​\gamma$)
   * určit nejlepší strategii $\pi(s) = \rm{argmax}_a V(s)$   * určit nejlepší strategii $\pi(s) = \rm{argmax}_a V(s)$
  
courses/b3b33kui/cviceni/program_po_tydnech/tyden_07.txt · Last modified: 2024/05/10 09:06 by kostkja2