Search
Za výběr úlohy děkuji Jiřímu Valáškovi.
Popis prostředí Frozen Lake na AI Gym.
Je zadána 2D mapa 8×8 / 4×4 s počáteční a cílovou polohou, ledem a dírami. Úkolem je navrhnout takovou řídicí strategii, která vám umožní dostat se co nejrychleji do cíle, aniž byste spadli do díry s ledovou vodou. V mapě se pohybujete doprava, doleva, nahoru a dolů. Led může být
Simulace končí pokud jsme spadli do díry, nebo našli cíl.
Hodnocení od AI GYM je
Pro kluzký povrch můžeme použít N běhů a spočítat pravděpodobnost dosažení cíle. Pro nekluzký povrch je problém, že budeme mít hodnoticí funkci 0, kdykoliv jsme nedošli do cíle bez rozdílu, jak daleko jsme došli. (Možno přepsat na inverzní (1/x) manhattonovskou vzdálenost do cíle + penalizace za díry ?)
H
.