next up previous contents index
Next: Vorverarbeitung Up: Feature Extraktion und Clusterung Previous: Feature Extraktion und Clusterung   Contents   Index


Signalextraktion

Wie schon in Kapitel [*] erwähnt, liegt Musik im so genannten PCM-Format am Computer vor. Doch dies ist eigentlich nur das Format, mit dem der Sound-Prozessor angesprochen wird. Musik ist, wie auch andere Programme und Daten, auf Festspeichermedien (z.B. Festplatten) gespeichert. Für Musik gibt es noch dazu eine ganze Fülle von Dateiformaten. Der erste Schritt des vorgestellten Algorithmus ist logischerweise das Öffnen der Datei. Leider legt dieser Schritt das ganze Verfahren auf ein einziges Dateiformat fest. Heutige Programme erledigen das Dateimanagement durch Auslagerung in Plugins. Plugins sind eigenständige Unterprogramme, die für autonome Aufgaben im Programm benutzt werden und mit dem Hauptprogramm durch wohl definierte Schnittstellen kommunizieren. Durch diesen modularen Aufbau können mehrere Dateiformate unterstützt werden und eine Erweiterung auf neue, andere Audiodateiformate ist einfach möglich. Der Aufwand für die Eigenentwicklung eines solchen Programms würde allerdings wenig Sinn machen, da fast jedes am PC laufende Abspielprogramm für Musikformate (engl: Mediaplayer)heute so aufgebaut ist. Da als Entwicklungsplattform Linux ausgewählt wurde, fiel die Wahl auf den inzwischen meist verwendeten Open-Source Mediaplayer XMMS. Nachdem Änderungen im Programmcode vorzunehmen sind, ist die Wahl von Open-Source Software, wo der Quellcode verändert werden darf, essentiell.

XMMS ist ein Mediaplayer unter dem X-Window System, das auf Unix Plattformen hauptsächlich in Verwendung ist. XMMS besteht aus Input-Plugins, die für das Öffnen der Dateien zuständig sind, Output-Plugins, die die Ausgabe auf den Sound-Prozessor bzw. auf andere Medien bewerkstelligen, und Visualization-Plugins, die zur Unterhaltung der Benutzer auf den Audiodaten beruhende visuelle Ausgaben auf dem Bildschirm produzieren. Um die PCM Werte zu erhalten wird die Ausgabe, bevor sie den Sound-Prozessor erreicht, abgefangen und in eine Datei umgeleitet.

Nachdem XMMS im Quellcode vorliegt und modular aufgebaut ist, kann der Datenstrom an vielen Stellen angezapft werden. Welche Stelle dafür ideal ist, wird nun analysiert.


next up previous contents index
Next: Vorverarbeitung Up: Feature Extraktion und Clusterung Previous: Feature Extraktion und Clusterung   Contents   Index
Markus Fruehwirth
2001-03-30