![]() |
Nutzung von RL/TD Verfahren für die Anwendung eines Strategiespieles Belegarbeit im Fach Neuronale Netze |
|||
| Tom Seifert | ||||
.: Einleitung |
Eine Lösung des Problems liefert "Reinforcement Learning". Dieses Verfahren kann durch Anwendung von "Temporal Difference" Methoden an ein künstlich neuronales Netz gekoppelt werden. Da kein Lehrer notwendig ist kann auch die Forderung nach Eigenständigkeit erfüllt werden. Hierzu ist es erforderlich das Verfahren des "Reinforcement Learning" auf das Spiel zu übertragen. Hierzu müssen die aus dem "Reinforcement Learning" verwendeten Zustände, Aktionen und "Reinforcement-Signale" untersucht und entsprechend umgesetzt werden. Weiterhin ist es notwendig eine geeignetes Trainingsverfahren zu finden. Auch ist eine Anbindung für das neuronalen Netz zu definieren. Ein weiterer Kernpunkt liegt in der Simulation der Umgebung und des Agenten (Spieler). Eine Darstellung der Lösung kann in der Dokumentaton nachgelesen werden. |
|||
.: Lösung |
||||
.: Software |
||||
|
L ö s u n g |
||||
![]() |
![]() |
|||
Tom Seifert | TomSeifert@email.de