Table of Contents

Testy

V úlohách MDP a RL mají funkce find_policy_…() a learn_policy() vracet tzv. strategii (policy). V zadání se uvádí, že by měla být reprezentována slovníkem. Občas ale studenti odevzdají řešení, kde funkce vrací něco jiného, nebo obsah slovníku není formálně správný, což svědčí o tom, že neporozuměli dobře specifikacím. Jako autoři řešení byste měli sami být schopni otestovat, zda návratová hodnota funkce odpovídá požadavkům. Jak na to?

Požadavky na strategii

Jaké požadavky by tedy měla vrácená strategie (policy) splňovat?

  1. Jakým datovým typem má být strategie reprezentovaná?
  2. Kolik položek by měl tento slovník mít? Jak tento počet zjistím z prostředí (env)?
  3. Co mají představovat klíče slovníku? Jakého typu mají být?
  4. Co jsou hodnoty slovníku? Jakého typu mají být?
  5. Obsahuje slovník všechny klíče?
  6. Jaká konkrétní strategie by měla být vrácena pro nějaké jednoduché prostředí?

Úkoly

Proč?

Automatizované testy vám umožní