Bodové hodnocení

Hodnocení je rozděleno následovně:

  1. Automatické hodnocení testuje výkon vašeho agenta na 5 prostředích. Strategii nalezenou vaším agentem pro dané prostředí pustíme n-krát a spočteme průměrný součet jím nasbíraných odměn. To pak porovnáme s učitelským řešením (agent vykonávající optimální strategii). Na každém z 5ti prostředí, ve kterém budete mít 80% a více než je učitelská hodnota součtu odměn, získáváte jeden bod.
  2. Manuální hodnocení je založeno na hodnocení kódu (clean code). Malý checklist pro psaní hezkého kódu.
Hodnocený výkon min max poznámka
Kvalita RL algoritmu 0 5 Ohodnocení algoritmu automatickým evaluačním systémem.
Kvalita kódu 0 1 Komentáře, struktura, elegance, čistota kódu, vhodné pojmenování proměnných…

Kvalita kódu (1 body):

  • vhodné komentáře, nebo kód je srozumitelný natolik, že komentáře nepotřebuje
  • rozumně dlouhé, respektive krátké metody/funkce
  • jména proměnných (podst. jména) a funkcí (slovesa) pomáhají čitelnosti a srozumitelnosti
  • kusy kódu se neopakují (žádné copy-paste)
  • rozumné šetření pamětí a procesorovým časem
  • konzistentní názvy i rozložení kódu v celém souboru (oddělovat slova ve všech metodách stejně, atp.)
  • přehledná struktura kódu (vyvarujte se např. nepythonovskému přiřazování mnoha proměnných v jednom řádku)

Můžete následovat pro Python určený PEP8. Většina editorů (jistě PyCharm) na nedostatky s ohledem na PEP8 i sama upozorňuje. Můžete se také inspirovat např. zde nebo si přečíst o idiomatickém Pythonu na mediu.

courses/b3b33kui/semestralni_ulohy/4_rl/hodnoceni.txt · Last modified: 2026/02/17 14:35 by kostkja2