next up previous contents index
Next: Evaluierung Up: Freie Musiksammlung Previous: Freie Musiksammlung   Contents   Index


Training

Die insgesamt 127 Lieder haben eine Gesamtspielzeit von über 8 Stunden. Nach der Verarbeitung der Lieder durch XMMS verblieben 127 Dateien mit insgesamt 293 MB (Bzip2) zur weiteren Verarbeitung. Nach der Entfernung von stillen Passagen am Anfang und Ende der Datei werden die Lieder in die einzelnen Frequenzkanäle aufgesplittet und jeder fünfzehnte beginnend mit Kanal 1 ausgewählt. Das resultierte in 17 Dateien für jedes Lied, somit 2159 Dateien mit insgesamt 226 MB (Bzip2). Nach der Zerlegung in fünfsekundige Segmente und Auswahl jedes Zweiten erhält man 50575 Dateien, mit insgesamt 157 MB. Lagrange-Interpolation und FFT werden direkt hintereinander ausgeführt. Nach Verschiebung der Werte in den positiven Bereich und Normierung der Vektoren erhält man ein 263 MB großes Vektorfile. Durch die Zusammenfassung der 17 Frequenzbereiche pro Segment erhält man 2975 Vektoren, jeder Vektor mit 4352 Dimensionen.

Nach etwa einstündigem Training über insgesamt 14875 Iterationen einer $18 \times 18$ Karte, beginnend mit Lernrate $0.8$, erhält man die Segmentkarte. Aus der Segmentkarte wird mittels den in Kapitel [*] beschriebenen Verfahren ein neues Vektorfile zum Training der Musikstückkarte vorbereitet.

Durch die Dimension der Segmentkarte ergibt sich die Dimension des neuen Vektorfiles. Das Vektorfile der Musikstückkarte besteht aus 127 324-dimensionalen Vektoren und hat eine Größe von weniger als einem MB. Nach wenige Minuten dauerndem Training erhält man eine $10 \times10$ Karte - die Musikstückkarte.


next up previous contents index
Next: Evaluierung Up: Freie Musiksammlung Previous: Freie Musiksammlung   Contents   Index
Markus Fruehwirth
2001-03-30