Search
Jak se pořád neopakovat. Už jsme našli cestu, ale možná někde vedle existuje i lepší.
Práce na úloze Markovské rozhodovací procesy.
Můžete postupně začít pracovat na úloze Posilované učení.
Reinforecement learning je nyní velmi aktivní oblastí, podporovanou také rychlým pokrokem v oblasti učení hlubokých neuronových sítí. Pár odkazů pro další ínspiraci