Nutzung von RL/TD Verfahren für die Anwendung eines Strategiespieles
Belegarbeit im Fach Neuronale Netze
   Tom Seifert  

 
   .: Einleitung
 

Eine fundamentale Aufgabe für jedes Lebewesen ist es, Strategien zu erlernen, die sein Verhalten in seinem Lebensraum optimieren. Die Lernsituation des Reinforcement-Lernens ist das allgemeinste, aber auch schwierigste Lernproblem.

Dabei erteilt die Umgebung in Abhängigkeit des aktuellen Zustandes und der gewählten Aktion positive oder negative Reinforcement Signale (d.h. Belohnungen oder Bestrafungen). Die Aufgabe des Lernenden (Agent) besteht darin, die Summe der erwarteten zukünftigen Reinforcement Signale zu maximieren. Um diese Zuordnung von Aktionen zu Zuständen zu lernen ist keine Lehrer, sondern nur die Interaktion mit der Umwelt nötig. Da die meisten Lebewesen durch die Interaktion mit Ihrer Umwelt lernen, ist dieses Verfahren dem natürlichen Lernprozess nachempfunden.

 
   .: Lösung
   .: Dokumentation
   .: Software

        E i n l e i t u n g

   

Tom Seifert | TomSeifert@email.de