Eine unaufhaltsame Dynamik – wird KI-Musik ein unüberschaubares Meer von Inhalten erzeugen?

Mann am Strand, der die Wellen ignoriert Foto: Tyler Milligan / Unsplash

Die Vorstellung, Maschinen könnten eigenständig Musik komponieren, wird nicht nur in Fachkreisen, sondern inzwischen auch in der breiten Öffentlichkeit diskutiert. Die Schlagzeilen werden nicht müde, viel versprechende technologische Entwicklungen in diesem Bereich zu propagieren. Aber was bedeutet das für die musikalisch Kreativen und für das Publikum, das nach Musik sucht, die ihm wirklich etwas bedeutet?

Jochen Gutsch

Musik als Kunstform eignet sich prinzipiell für den Einsatz von KI. Da den meisten Bestandteilen einer Komposition numerische Werte zugeordnet werden können, kann Musik zerlegt und in eine mathematische „Sprache“ übersetzt werden, die der Computer nicht nur verstehen, sondern auch sprechen kann. Das wiederum bedeutet, dass ein Programm, sobald es eine Reihe von Regeln erlernt hat, dieser Logik entsprechend mögliche Kompositionen von Grund auf neu berechnen kann – egal, ob es sich um einen Popsong mit drei Akkorden oder eine Oper in drei Akten handelt.

Wenn wir Musik als Sammlung von Klängen von unterschiedlicher Höhe, Dynamik und Textur definieren, die zu einer rhythmischen und harmonischen Struktur verknüpft werden, können wir Komponist*innen als Organisator*innen oder Ingenieure betrachten, die diese Bestandteile in Beziehung zueinander setzen, ihre Charakteristika festlegen, Stimmen zuweisen und Anweisungen für die Ausführenden hinzufügen. Abhängig von Geschmack, Bestrebungen, Nachfrage, Zielpublikum oder Anweisungen des Auftraggebers fällt der/die Komponist*in gestützt auf umfassende kreative und/oder technische Fähigkeiten eine Reihe von Entscheidungen – und in den meisten Fällen nutzt er/sie bereits heute hochentwickelte Computersoftware.

Es ist also anzunehmen, dass die Bedeutung von KI wachsen wird, da sie Komponist*innen zunehmend bei den eher technischen Aufgaben in der Schöpfung von Musik helfen kann. Aber wenn Maschinen vollkommen neue Musik erzeugen sollen und wenn die Ergebnisse ihrer Berechnungen für menschliche Ohren wie Musik klingen sollen, brauchen sie einen klaren Bezugsrahmen, in dem sie arbeiten können – ohne einen solchen Rahmen werden ihre Kompositionen wie eine willkürliche Ansammlung von Sounds klingen. Diese Bezugsrahmen können entweder manuell festgelegt oder aus einem großen Reservoir vorhandener Kompositionen zusammengefügt werden. Hier wird klar, wie wichtig menschliche Anleitung, Bezugspunkte, Betreuung und andere quasi-kuratorische Eingriffe sind. Der Mensch muss klare Anweisungen und Ziele definieren, von denen die Maschine ausgehen kann – selbst wenn die Maschine die Musik von diesem Punkt an eigenständig erzeugen soll. Das konfrontiert uns mit einem Dilemma: Wenn wir die Maschine beauftragen, Originalmusik zu schaffen, ihr jedoch nicht erlauben, sich außerhalb der von uns festgelegten Parameter zu bewegen, wie kann sie dann wirklich innovativ sein?
 


Unkonventionelles Denken


Viele Künstler sehen ihre unter anderem Aufgabe darin, die Grenzen ihrer Kunstform auszuloten oder zu übertreten, und Verstöße gegen die Norm werden oft als schöpferischer Akt betrachtet.. Andrerseits verliert das Publikum schnell das Interesse, wenn sich Künstler zu weit von den Konventionen entfernen. Es ist nicht leicht, den Punkt zu finden, an dem eine musikalische Komposition die Zuhörer fordert und sie zugleich einbindet und ihre Aufmerksamkeit wach hält. Zu den Faktoren, die darüber entscheiden, ob ein gutes Gleichgewicht erreicht wird, zählen künstlerische Vision, kreative Intuition und historischer Kontext.
Zwei der bekanntesten Beispiele für Kompositionen, Konventionen durchbrochen haben, sind Werke von John Cage. 4’33” ist eine Anweisung an Musiker, überhaupt keine Noten zu spielen, und eine Interpretation von As Slow As Possible wird derzeit über einen Zeitraum von 639 Jahren von einer automatisierten Kirchenorgel in einer deutschen Kleinstadt gespielt. Mit diesen Werken verstieß Cage gegen jene Art von Regeln, welche eine KI brauchen würde, um Musik zu erzeugen - und er bekam viele Lorbeeren für diese Art von Experimenten.

Es gibt ungezählte Beispiele für derart radikale Arbeiten, und dieselbe Logik gilt auch auf einer einfacheren Ebene. In kreativen Prozessen sind oft Aussage wie diese zu hören: „Eigentlich macht das kompositionstechnisch keinen Sinn, aber es fühlt sich richtig an … also lass uns das so machen.” Dies sind die magischen Momente, in denen unsere Intuition das Kommando übernimmt. Und in diesen Momente können Weichen gestellt werden, an denen die Spreu vom Weizen getrennt wird – hier werden Ideen, die uns emotional ansprechen von solchen unterschieden, die uns ungerührt lassen. Und oft sind wir nicht einmal imstande zu analysieren, warum eine Lösung „funktioniert“, während eine andere aufgegeben wird: Wir spüren es zwar mit Sicherheit, aber wir können es kaum anderen Menschen erklären – geschweige denn einer Maschine. Screenshot der Bloom-App Die Bloom-App kann ihre eigene Musik generieren: Die Punkte stellen Noten dar, die von der App gespielt werden. Bloom wurde 2008 von Brian Eno & Peter Chilvers auf den Markt gebracht. | © Bloom, Brian Eno & Peter Chilvers

Wo der Zauber nicht nötig ist


Unter Ausschluss maschineller Intuition und unter Einbezug der Bedingung eines vom Menschen gestalteten Rahmensdürfen wir annehmen, dass KI-generierte Musik ihre Stärken weder in emotionalen noch in exzentrisch innovativen Schöpfungen haben wird. Aber Musik kann eine Vielzahl von Funktionen erfüllen, und nicht für alle werden erfinderische, berührende oder inspirierende Kompositionen benötigt. So kann Musik kann Musik zum Beispiel Hintergrund für eine andere Aktivität geeignet sein; oder sie kann einfach unterhalten, ohne uns auf einer tieferen intellektuellen, sozialen oder emotionalen Ebene ansprechen zu müssen. In diesem Bereich kann KI viel leisten – vor allem, wenn eine Urheberschaft ausdrücklich unerwünscht ist, um das Zahlen von Lizenzgebühren zu umgehen. Gibt man der KI gut definierte Ziele vor, so kann man sie beauftragen, eine unbegrenzte Zahl neuer Werke zu schaffen, die sehr gut geeignet sind, die spezifische Funktion zu erfüllen, für die sie bestimmt sind. Tatsächlich geschieht das bereits.

Der Ambient-Pionier Brian Eno arbeitet seit Jahrzehnten an „generativer Musik“. Unter Anderem hat sein Team mehrere Apps entwickelt, die entweder von Menschen gespielt oder sich selbst überlassen werden können. Im zweiten Fall übernimmt die KI das Kommando und erzeugt einen endlosen Strom ständig wechselnder Ambient-Musik. Dank einiger gut gewählter Parameter klingt das Ergebnis immer so, als wäre es von Eno ‚kuratiert‘ worden. Diese Musik soll den Zuhörer weder überraschen noch stören: Sie steht in der Tradition der Philosophie von Eric Satie, der bereits 1917 den berühmten Begriff Furniture Music prägte und erklärte, Zuhörer sollten seine Stücke zwar „hören, aber nicht anhören”.

Da Musikaufnahmen mittlerweile überwiegend online veröffentlicht und konsumiert werden, haben Menschen bereits heute Zugang zu einer unvorstellbaren Menge an Musik. Diesen Luxus verdanken wir dem Internet. Aber in der Online-Welt werden wir bereits mit einer größeren Zahl von Stimuli überhäuft, als viele von uns bewältigen können. Die Produktion von immer mehr computergeneriertem Material wird diesen Ozean noch weiter anschwellen lassen, was es uns noch schwerer machen wird, uns in der Masse von Angeboten zurechtzufinden. Ob ein endlos wachsendes Angebot an Musik wünschenswert ist, ist fragwürdig. Angesichts einer unbegrenzten Menge an Inhalten besteht die Gefahr, dass sie an Bedeutung für uns verlieren, was wiederum dazu führen könnte, dass sich so mancher entscheiden wird, digitalen Archiven, Plattformen und Diensten vollkommen den Rücken zu kehren. Hinterlandt spielt Musik von Jochen Gutsch in Sydney Der Autor (am Klavier) nutzt seit Jahren Software zum Komponieren und Produzieren von Musik, zieht für Auftritte aber ein rein akustisches Ensemble von klassisch ausgebildeten Musikern vor | © Katelyn-Jane Dunn / Mit freundlicher Genehmigung: City Recital Hall

Wo der Zauber weiterhin wirkt


Musik ist vor allem eine Sprache, in der wir Menschen miteinander kommunizieren können. Wir haben sie erfunden und entwickelt, und wir haben sie mit nuanciertem Ausdruck, emotionaler Subtilität und einer Vielzahl kultureller, sozialer, historischer und politischer Codes und Kontexte versehen. Die von Musik vermittelten Inhalte sind so reichhaltig, dass ihr oft die Fähigkeit zugesprochen wird, Dinge zu sagen, die mit Worten nicht auszudrücken sind.

Wir verwenden seit jeher Werkzeuge, die uns dabei helfen, Musik zu schaffen und zu musizieren: Stimmen und Musikinstrumente, Notation und Druck, Aufnahme und Wiedergabe, Synthesizer und Computer – und jetzt KI und neuronale Netze. Aber während diese Werkzeuge weiter verfeinert werden, ändert sich nichts Grundlegendes an dem Platz, den die Musik in unserem Leben einnimmt. Das sehr menschliche Bestreben, das ihr zugrunde liegt, ist nicht ersetzt worden.

Die Begeisterung über die Fortschritte im Bereich von KI–generierter Musik wächst, aber dasselbe gilt für die Sorge, das Kräfteverhältnis könne sich zugunsten der Maschine verschieben, so dass der Mensch schließlich von einer eigenständig operierenden Kreativ-KI an den Rand gedrängt würde. Ich habe weiterhin die Hoffnung, dass Mensch und Maschine keine Widersacher in einem Wettbewerb um die Aufmerksamkeit des Publikums in der wunderbaren Welt der Musik sein werden. Letzten Endes pflegen die Zuhörer*innen ihren individuellen Geschmack: Selbst wenn uns Algorithmen uns seit Jahren mit Vorschlägen und Empfehlungen überhäufen, entscheiden wir am Ende selbst, welche Musik uns wirklich etwas bedeutet.

Artikelvorschläge

API-Error