next up previous contents index
Next: Evaluierung Up: Bekannte Musiksammlung Previous: Bekannte Musiksammlung   Contents   Index


Training

Nach der Verarbeitung der Lieder durch XMMS verblieben 230 Dateien mit insgesamt 460 MB (Bzip2)[*] zur weiteren Verarbeitung. Im ersten Schritt erfolgte die Entfernung von stillen Passagen am Anfang und Ende der Datei. Darauf folgend wurden die Lieder in die einzelnen Frequenzkanäle aufgesplittet und jeder fünfzehnte beginnend mit Kanal 1 ausgewählt. Das resultierte in 17 Dateien für jedes Lied, somit 3910 Dateien mit insgesamt 375 MB (Bzip2). Nach der Zerlegung in fünfsekundige Segmente und Auswahl jedes Zweiten erhält man 85374 Dateien, mit insgesamt 254 MB. Lagrange-Interpolation und FFT werden direkt hintereinander ausgeführt. Nach Verschiebung der Werte in den positiven Bereich und Normierung der Vektoren erhält man ein 444 MB großes Vektorfile. Durch die Zusammenfassung der 17 Frequenzbereiche pro Segment erhält man 5022 Vektoren, jeder Vektor mit 4352 Dimensionen.

Nach etwa zweistündigem Training[*] über insgesamt 15066 Iterationen einer $22 \times 22$ Karte, beginnend mit Lernrate $0.8$, erhält man die Segmentkarte. Aus der Segmentkarte wird mittels den in Kapitel [*] beschriebenen Verfahren ein neues Vektorfile zum Training der Musikstückkarte vorbereitet.

Durch die Dimension der Segmentkarte ergibt sich die Dimension des neuen Vektorfiles. Das Vektorfile der Musikstückkarte besteht aus 230 484-dimensionalen Vektoren und hat eine Größe von weniger als einem MB. Nach einem wenige Minuten dauerndem Training erhält man eine $10 \times10$ Karte - die Musikstückkarte.


next up previous contents index
Next: Evaluierung Up: Bekannte Musiksammlung Previous: Bekannte Musiksammlung   Contents   Index
Markus Fruehwirth
2001-03-30