Bodové hodnocení

Hodnocení je rozděleno následovně:

Automatické hodnocení testuje výkon vašeho agenta na 5 prostředích. Strategii nalezenou vaším agentem pro dané prostředí pustíme n-krát a spočteme průměrný součet jím nasbíraných odměn. To pak porovnáme s učitelským řešením (agent vykonávající optimální strategii). Na každém z 5ti prostředí, ve kterém budete mít 80% a více než je učitelská hodnota součtu odměn, získáváte jeden bod.
Manuální hodnocení je založeno na hodnocení kódu (clean code).

Hodnocený výkon	min	max	poznámka
Kvalita RL algoritmu	0	5	Ohodnocení algoritmu automatickým evaluačním systémem.
Kvalita kódu	0	1	Komentáře, struktura, elegance, čistota kódu, vhodné pojmenování proměnných…

Kvalita kódu (1 body):

vhodné komentáře, nebo kód je srozumitelný natolik, že komentáře nepotřebuje
rozumně dlouhé, respektive krátké metody/funkce
jména proměnných (podst. jména) a funkcí (slovesa) pomáhají čitelnosti a srozumitelnosti
kusy kódu se neopakují (žádné copy-paste)
rozumné šetření pamětí a procesorovým časem
konzistentní názvy i rozložení kódu v celém souboru (oddělovat slova ve všech metodách stejně, atp.)
přehledná struktura kódu (vyvarujte se např. nepythonovskému přiřazování mnoha proměnných v jednom řádku)
…

Můžete následovat pro Python určený PEP8. Většina editorů (jistě PyCharm) na nedostatky s ohledem na PEP8 i sama upozorňuje. Můžete se také inspirovat např. zde nebo si přečíst o idiomatickém Pythonu na mediu.