Table of Contents

AI Gym: Frozen Lake

Za výběr úlohy děkuji Jiřímu Valáškovi.

Popis prostředí Frozen Lake na AI Gym.

Problém

Je zadána 2D mapa 8×8 / 4×4 s počáteční a cílovou polohou, ledem a dírami. Úkolem je navrhnout takovou řídicí strategii, která vám umožní dostat se co nejrychleji do cíle, aniž byste spadli do díry s ledovou vodou. V mapě se pohybujete doprava, doleva, nahoru a dolů. Led může být

Simulace končí pokud jsme spadli do díry, nebo našli cíl.

Hodnocení od AI GYM je

Pro kluzký povrch můžeme použít N běhů a spočítat pravděpodobnost dosažení cíle. Pro nekluzký povrch je problém, že budeme mít hodnoticí funkci 0, kdykoliv jsme nedošli do cíle bez rozdílu, jak daleko jsme došli. (Možno přepsat na inverzní (1/x) manhattonovskou vzdálenost do cíle + penalizace za díry ?)

Možné reprezentace

Úkoly

Doporučení od PP