Acoustic Word-Recognizer

Benutzerdokumentation

 

 

Inhalt

 


 

Karteikarte - Projekt verwalten

 

 

Buttons:

Projekt erstellen: Hier wird ein neues Projekt erstellt, nachdem alle Eingaben getätigt wurden.

Projekt laden: Hier kann ein bereits früher erstelltes und gespeichertes Projekt wieder geladen werden.

Projekt speichern: Hier kann ein neu erstelltes bzw. geändertes Projekt gespeichert werden.

 

Gruppe - Erkennungsleistung:

Anzahl der zu lernenden Wörter: Hier wird die Anzahl der Wörter angegeben, die das Netz lernen soll.

Anzahl der Frequenzstützpunkte: Hier wird angegeben wieviel Frequenzstützpunkte die Diskrete-Fourier-Transformation aller 10 ms ermitteln soll.
                                                        Je höher die Anzahl, desto Differenzierter kann der Frequenzbereich abgedeckt werden. (Minimalwert ist 3)

zu lernende Wörter: Hier werden die zu lernenden Wörter durch Leerzeichen getrennt eingegeben.

 

Gruppe - Kohonen-Netz:

Anzahl der Neuronen in horizontaler Richtung: Hier wird die Breite der Kohonenkarte in Neuronen angegeben.

Anzahl der Neuronen in vertikaler Richtung: Hier wird die Tiefe der Kohonenkarte in Neuronen angegeben.

Die Anzahl der Eingabeneuronen ergibt sich automatisch aus der Anzahl der Frequenzstützpunkte minus 2.

 

Gruppe - Backpropagation-Netz:

Anzahl der versteckten Schichten: Hier wird die Anzahl der versteckten bzw. inneren Neuronenschichten des Backpropagation-Netz angegeben.

Anzahl von Neuronen pro Schicht: Hier wird die Anzahl der Neuronen jeder versteckten Schicht in ganzen Zahlen und durch Leerzeichen getrennt angegeben.
                                                          Begonnen wird mit der ersten Schicht nach der Eingabeschicht.

Die Anzahl der Eingabeneuronen ergibt sich automatisch aus der Anzahl der Ausgabeneuronen des Kohonennetz und die Anzahl der Ausgabeneuronen ergibt sich aus der Anzahl der gelernten Wörter.

 

(zum Inhalt)

 


 

Karteikarte - Netz trainieren

 

 

Gruppe - Trainingsdaten:

Anzahl der Muster pro Wort: Hier wird die Anzahl der aufgenommenen Wave-Dateien für jedes Wort eingegeben. (Bereich 1 bis 100)

Trainingsdaten laden: Hier wird das Verzeichnis ausgewählt in dem die Trainingsdaten als Wave-Datei gespeichert sind. Dazu muss eine Datei in dem Verzeichnis
                                     ausgewählt werden.
                                     Die geladenen Trainingsdaten werden sofort an das Kohonennetz übergeben.

Die Trainingsdaten müssen nach folgender Konvention alle im selben Verzeichnis gespeichert werden: name_xx.wav .
name: Die Bezeichnung für das Wort, genauso wie sie in der Karteikarte Projekt verwalten unter zu lernenden Wörter eingegeben wurde.
xx: Nummer des Wave-Musters für das Wort name beginnend mit 00 bis maximal 99.

 

Gruppe - Kohonen-Netz:

Gewicht-Untergrenze: Hier wird der minimale Wert für die Verbindungsgewichte der Neuronen angegeben.

Gewicht-Obergrenze: Hier wird der maximale Wert für die Verbindungsgewichte der Neuronen angegeben.

Gewichte initialisieren: Hier werden die Startwerte der Verbindungsgewichte zufällig gleichverteilt innerhalb des vorher festgelegten Bereiches
                                        von Gewicht-Untergrenze und Obergrenze erzeugt.
                                        Wurden die Werte für Gewicht-Unter- und -Obergrenze auf 0 gelassen, werden die Gewichte mit den Werten zufällig ausgewählter
                                        Trainingsvektoren initialisiert.

Lernrate: Hier wird der Wert für die Lernrate angegeben.

Anpassungsradius: Hier wird der Wert für den Anpassungsradius angegeben. Als maximaler Wert sollte die höchste Anzahl der Neuronen in horizontaler bzw.
                                 vertikaler Richtung angegeben werden.  Minimaler Wert ist 1, d.h. es werden nur die Verbindungsgewichte des Winnerneurons angepasst.

Lernschritte: Hier wird die Anzahl der Lernschritte angegeben.

Netz trainieren: Durch diesen Button wird der Lernvorgang aktiviert.

Lernstatus: Hier wird der Trainingsfortschritt des Kohonennetz angezeigt.

 

Gruppe - Backpropagation-Netz:

Gewicht-Untergrenze: Hier wird der minimale Wert für die Verbindungsgewichte der Neuronen angegeben.

Gewicht-Obergrenze: Hier wird der maximale Wert für die Verbindungsgewichte der Neuronen angegeben.

Gewichte initialisieren: Hier werden die Startwerte der Verbindungsgewichte zufällig gleichverteilt innerhalb des vorher festgelegten Bereiches
                                        von Gewicht-Untergrenze und Obergrenze erzeugt.

Lernrate: Hier wird der Wert für die Lernrate angegeben.

Momentum: Hier wird der Wert für das Momentum angegeben.

Lernschritte: Hier wird die Anzahl der Lernschritte angegeben.

Netz trainieren: Durch diesen Button wird der Lernvorgang aktiviert. Wenn neue Trainingsdaten geladen wurden oder wenn das Kohonennetz neu trainiert wurde,
                           werden die neuen Daten vorher dem Netz übergeben, ansonsten benutzt es die alten Daten.

Lernstatus: Hier wird der Trainingsfortschritt des Backpropagationnetz angezeigt.

 

(zum Inhalt)

 


 

Karteikarte - Erkennen

 

 

gelernte Wörter: Hier werden nochmal alle Wörter angezeigt die das Netz gelernt hat.

WAVE-Datei öffnen: Hier kann eine Wave-Datei ausgewählt werden, die von dem Netz erkannt werden soll.

geöffnete WAVE-Datei: Hier wird der Name der geöffneten Wave-Datei zur Kontrolle angezeigt.

Wort erkennen: Hier wird der Erkenn-Vorgang der Wave-Datei durch das Netz aktiviert. Das Ergebnis wird dann im Feld erkanntes Wort ausgegeben.
                            Zusätzlich wird die geöffnete Wave-Datei zur Kontrolle abgespielt.

erkanntes Wort: Hier wird das Wort angezeigt, das das Netz aus einer zuvor geöffneten Wave-Datei erkannt hat.

Ausgabe des Kohonennetz anzeigen: Wenn diese Checkbox ausgewählt ist, wird beim Erkennen des Wortes die Ausgabe des Kohonennetzes in einem externen
                                                              Fenster dargestellt. Inaktive Neuronen werden durch "O" markiert und aktive Neuronen durch "X".

Ausgabe des Backpropagationnetz anzeigen: Wenn diese Checkbox ausgewählt ist, wird beim Erkennen des Wortes die Ausgabe des Backpropagationnetzes in
                                                                           einem externen Fenster dargestellt. Inaktive Neuronen werden durch "O" markiert und aktive Neuronen durch "X".

 

(zum Inhalt)

 


Jens Fiedler, 23. November 2001