Policy Evaluation - Example

Moderator: Einführung in die Künstliche Intelligenz

Benutzeravatar
mmi1991
Computerversteher
Computerversteher
Beiträge: 349
Registriert: 20. Okt 2011 18:46
Wohnort: Hattersheim

Policy Evaluation - Example

Beitrag von mmi1991 »

Hallo,
Folie 13 in Reinforcement-Learning
Ich dachte, wir führen die Policy einfach aus und schauen, auf welchen Reward wir dann kommen.
Warum werden da mehrere Wege genommen und vor allen Dingen welche?
Wieso rennt er in die -100? Eigentlich sollte das gemäß Policy nicht möglich sein, oder?

Edit: DIe Policy sieht nicht indeterministic aus, oder?


Vielen Dank schon mal :)
Ophasentutor SoSe 2014, WiSe 2015/16
Alle Angaben wie immer ohne Gewähr

Zurück zu „Einführung in die Künstliche Intelligenz“