====== 08 Reinforcement II ======
Jak se pořád neopakovat. Už jsme našli cestu, ale možná někde vedle existuje i lepší.


===== Kvíz I =====
  * tradiční kvíz, tentokrát na výpočet Q hodnot z trénovacích epizod pomocí metody časových diferencí
  * bodovaný, bonusových 0.5bodu
  * řešení odevzdat do BRUTE do úlohy **lab08quiz**, do půlnoci dne, kdy běží dané cvičení
  * formát: textový soubor, fotka řešení na papíře, pdf - co Vám nejlépe vyhovuje a dokážeme to přečíst
  * správné řešení prodiskutujeme na příštím cvičení

==== Zadání kvíz I ====
  * p. 101, St 12:45: {{ courses:b3b33kui:cviceni:program_po_tydnech:Qlearning_101.pdf|Q Learning Cviceni 101}}
  * p. 102, St 14:30: {{ courses:b3b33kui:cviceni:program_po_tydnech:20200422-111456_directqevaluation.pdf|Q Learning Cviceni 102}}
  * p. 103, Čt 12:45: {{ :courses:b3b33kui:cviceni:program_po_tydnech:qlearning_cviceni_103.pdf | Q Learning Cviceni 103}}
  * p. 105, Pá 9:15: {{ :courses:b3b33kui:cviceni:program_po_tydnech:qlearning_cviceni_105.pdf | Q Learning Cviceni 105}}

===== Kvíz II - Analýza vlivu discount faktoru na určování policy =====

  * vysvětlení na příkladu, on-line výuka
  * bez bodoveho hodnoceni
  * prezentace {{ :courses:b3b33kui:cviceni:program_po_tydnech:discount_factor_example.pdf | Discount factor example}}

> {{page>courses:b3b33kui:internal:quizzes#Analýza vlivu discount faktoru na určování policy}}


===== Samostatná práce =====

Práce na úloze [[courses:b3b33kui:cviceni:sekvencni_rozhodovani:rl|Posilované učení]].

===== Reinforcement learning plus =====
Reinforecement learning je nyní velmi aktivní oblastí, podporovanou také rychlým pokrokem v oblasti učení hlubokých neuronových sítí. Pár odkazů pro další ínspiraci

  * [[https://www.youtube.com/watch?v=SH3bADiB7uQ|Table tennis robot player]]. Starting from imitation, then generalizing through RL.
  * [[https://research.google.com/teams/brain/robotics/|Robotics@google]]. Well, they can afford many learning episodes many iterations ;-)
  * [[https://medium.com/@dhruvp/how-to-write-a-neural-network-to-play-pong-from-scratch-956b57d4f6e0|Pong game]]. Learning to play the very old computer game with the help of AI-Gym. [[https://www.youtube.com/watch?time_continue=6&v=YOW8m2YGtRg|YT Video]]