Bodové hodnocení

Hodnocení je rozděleno následovně:

  1. Automatické hodnocení testuje výkon vašeho agenta na 5 prostředích. Strategii nalezenou vaším agentem pro dané prostředí pustíme n-krát a spočteme průměrný součet jím nasbíraných odměn. To pak porovnáme s učitelským řešením (agent vykonávající optimální strategii). Na každém z 5ti prostředí, ve kterém budete mít 80% a více než je učitelská hodnota součtu odměn, získáváte jeden bod.
  2. Manuální hodnocení je založeno na hodnocení kódu (clean code).
Hodnocený výkon min max poznámka
Kvalita RL algoritmu 0 5 Ohodnocení algoritmu automatickým evaluačním systémem.
Kvalita kódu 0 1 Komentáře, struktura, elegance, čistota kódu, vhodné pojmenování proměnných…

Kvalita kódu (1 body):

Můžete následovat pro Python určený PEP8. Většina editorů (jistě PyCharm) na nedostatky s ohledem na PEP8 i sama upozorňuje. Můžete se také inspirovat např. zde nebo si přečíst o idiomatickém Pythonu na mediu.