Hodnocení je rozděleno následovně:
Automatické hodnocení testuje výkon vašeho agenta na 5 prostředích. Strategii nalezenou vaším agentem pro dané prostředí pustíme n-krát a spočteme průměrný součet jím nasbíraných odměn. To pak porovnáme s učitelským řešením (agent vykonávající optimální strategii). Na každém z 5ti prostředí, ve kterém budete mít 80% a více než je učitelská hodnota součtu odměn, získáváte jeden bod.
Manuální hodnocení je založeno na hodnocení kódu (clean code).
Hodnocený výkon | min | max | poznámka |
Kvalita RL algoritmu | 0 | 5 | Ohodnocení algoritmu automatickým evaluačním systémem. |
Kvalita kódu | 0 | 1 | Komentáře, struktura, elegance, čistota kódu, vhodné pojmenování proměnných… |
Kvalita kódu (1 body):
vhodné komentáře, nebo kód je srozumitelný natolik, že komentáře nepotřebuje
rozumně dlouhé, respektive krátké metody/funkce
jména proměnných (podst. jména) a funkcí (slovesa) pomáhají čitelnosti a srozumitelnosti
kusy kódu se neopakují (žádné copy-paste)
rozumné šetření pamětí a procesorovým časem
konzistentní názvy i rozložení kódu v celém souboru (oddělovat slova ve všech metodách stejně, atp.)
přehledná struktura kódu (vyvarujte se např. nepythonovskému přiřazování mnoha proměnných v jednom řádku)
…
Můžete následovat pro Python určený PEP8. Většina editorů (jistě PyCharm) na nedostatky s ohledem na PEP8 i sama upozorňuje. Můžete se také inspirovat např. zde nebo si přečíst o idiomatickém Pythonu na mediu.