next up previous contents index
Next: Formalisierung Up: Automatische Analyse und Organisation Previous: Vorwort   Contents   Index


Motivation

Durch die stetig sinkenden Hardwarekosten sind Musik erzeugende und verarbeitende Geräte heute schon für eine breite Masse erschwinglich. Zur Einrichtung eines einfachen Tonstudios bedarf es weder allzu großer finanzieller Aufwendungen, noch detaillierter fachspezifischer Kenntnisse, da sachgerechte Hilfe durch elektronische Medien, wie das Internet, einfach verfügbar ist [#!TSM!#]. Die einfache Verfügbarkeit der Musik erzeugenden Geräte, sowie die Möglichkeit durch das Internet ein großes Publikum zu erreichen, führte dazu, dass immer mehr Interpreten und Komponisten, die keinem der großen Musik verkaufenden Konzerne (BMG, EMI, Warner, Sony,...) angehören, ihre Werke selbst der Öffentlichkeit zur Verfügung stellen. Abgesehen von den in den Medien derzeit viel zitierten illegalen Kopien durch das Urheberrecht geschützten bekannter Titeln, gibt es vor allem im Internet eine Vielzahl von Musikstücken, die ohne Leistung von Gebühren abgerufen werden dürfen (z.B. http://www.AudioGalaxy.comAudioGalaxy.com). Im Gegensatz zu berühmten Gruppen sind diese Interpreten meist wenig bekannt und in großen Sammlungen eher unterrepräsentiert. Da solche Gruppen in großen Musikstores (Virgin, Amadeus,...) meist nicht zu finden sind, muss man um die Stilrichtung einer Gruppe herauszufinden, entweder selbst ein Stück hören, oder sich auf die Empfehlung eines Dritten verlassen. Alle diese Ansätze beruhen darauf, dass irgendwann einmal eine manuelle Einteilung der Musikstücke erfolgte. Diese Einteilung basiert meist darauf, dass eine mehr oder weniger qualifizierte Fachkraft sich jedes einzelne Stück anhört, um es in ein vorher festgelegtes Gruppenschema einzuordnen. Problematisch dabei ist, dass es kaum objektive Gruppenbeschreibungen gibt. Selbst wenn Beschreibungen dieser Gruppen existieren, sind die Musikstücke, die dieser Definition exakt entsprechen, eher in der Minderheit. Durch diesen Missstand kann es sein, dass ein und dasselbe Stück einmal in einer bestimmten Gruppe $A$ und an einer anderen Stelle in einer anderen Gruppe $B$ gefunden wird. Diese Gruppen können verschieden heißen, dieselben Stücke beinhalten, oder tatsächlich zwei verschiedene Gruppen sein. Ein weiteres Problem entsteht, wenn ein Stück gar nicht in das vorgegebene Gruppenschema passt. Eine Möglichkeit wäre, es in die noch am ehesten passende Gruppe zu geben; eine andere besteht darin, eine Sammelgruppe für nicht ins Schema passende Stücke zu kreieren, und die Dritte führt zur Neuanlegung einer Gruppe. Keine dieser drei Ansätze ist ideal. Bei der ersten Möglichkeit passt das Stück nicht zu den anderen, die zweite Möglichkeit eröffnet eine Gruppe, die keinerlei Definition besitzt und deren Stücke keine Gemeinsamkeit besitzen, wobei hingegen bei der Dritten dann merkwürdige Mischformen entstehen könnten, wie etwa "`Pop Rock"' und "`Rock Pop"'[*]. Manche Organisationen (Libro) haben diesen Missstand bemerkt und versuchen daraus zu flüchten, indem sie eine einzige große Gruppe kreieren (Pop), in die alle Stücke fallen und innerhalb der ein einfaches Sortierkriterium herrscht (alphabetisch sortiert nach Name des Interpreten). Ohne Name des Interpreten wird man allerdings auch hier nicht fündig. Ein weiterer Ansatz zur Gruppierung besteht darin Genreeinteilungen nach Vorlieben anderer Benutzer aufzubauen. Manche Online Shops (z.B. Amazon) verfolgen die Bestellungen der Benutzer und präsentieren Listen mit Stücken, die andere Benutzer auch bestellt haben[*].

Zusammenfassend kann gesagt werden, dass manuelle Genreerkennung durch den personalintensiven Einsatz und dessen subjektive Ergebnisse keine optimale Lösung zur Gruppierung von Musikstücken ist. Ohne Genrekennung allerdings bleiben Gruppen, deren Name noch völlig unbekannt ist, einem größeren Publikum verschlossen.

Es gibt schon seit einiger Zeit maschinell unterstützte Versuche Musik nach ihrem "`Inhalt"' zu gruppieren, doch basieren fast jede dieser Ideen auf irgendwelchen Einschränkungen, die vor der Klassifizierung gemacht werden (Kapitel [*]). Was fehlt ist ein System, das ohne manuellen Eingriff Musik gruppiert. Ähnliche Musikstücke sollen zu Gruppen zusammengefasst werden und ähnliche Gruppen sollen beieinander liegen.

In dieser Arbeit wird ein Verfahren vorgestellt, das nach obigen Bedingungen arbeitet. Mittels eines ausgereiften Neuronalen Netzes, der SOM, werden Musikstücke zu ähnlich klingenden Gruppen zusammengefasst. Die SOM benötigt außer den Eingabewerten, die direkt aus der Musik erstellt werden, keine zusätzlichen Informationen und bildet die Ergebnisse in einer einfach zu verstehenden zweidimensionalen Tabelle - der Karte - ab. Ähnlich klingende Musikstücke werden visuell in benachbarten Regionen auf der Karte dargestellt, völlig konträr klingende Musikstücke liegen weiter auseinander. Während beispielsweise Klassik im unteren linken Eck der Karte zu finden ist, wird Disco-Musik in einem gänzlich anderen Bereich, z.B. oben rechts, zu finden sein. Durch diese Einteilung können alle oben beschriebenen Probleme gelöst werden. Weder eine mühsame händische Einteilung, noch eine subjektive Geschmacksrichtung, noch unbekannte Interpreten sind hier zu berücksichtigen.


next up previous contents index
Next: Formalisierung Up: Automatische Analyse und Organisation Previous: Vorwort   Contents   Index
Markus Fruehwirth
2001-03-30