Künstliche Intelligenz und Musik
Köpfe, Maschinen und Zentralisierung: Warum Musiker jetzt künstliche Intelligenz hacken müssen

Minds, Machines, and Centralisation — © Splitshire, Colourbox

Peter Kirn, Direktor des CTM Hacklabs, führt in diesem Artikel in das Thema der Vereinnahmung von Musik und Hörgewohnheiten durch eine zentralisierte Industrie ein, und bezeichnet „Muzak“ als Vorreiter für den Einsatz künstlicher Intelligenz zum Zweck einer „vorprogrammierten Kultur“.
Des Weiteren erörtert er effektive Strategien für alle, die Entscheidungsfreiheit und Ungewissheit bevorzugen, um auf die von Tag zu Tag präsenter werdenden Technologien zu reagieren und mit ihnen zu interagieren.

Von Peter Kirn

Mittlerweile existiert sie nicht mehr, aber „Muzak" (eine Firma, die Hintergrundmusik produzierte) war einmal allgegenwärtig. Das Management sorgte dafür, dass ihr Musikprodukt omnipräsent, aufdringlich und sogar für den Zweck der Verhaltensbeeinflussung konzipiert war - und so wurde das Wort „Muzak" zum Synonym für alles, was an der industriellen Kultur verhasst war.

So anachronistisch, wie dies heutzutage erscheinen mag, war Muzak dennoch ein Zeichen dafür, wie die Technologien der Telekommunikation den kulturellen Konsum einmal prägen würden. Muzak mag für seinen wiedererkennbaren Sound bekannt sein, aber auch seine Übertragungsmethode ist bemerkenswert. Fast einhundert Jahre vor Spotify hatte der Gründer von Muzak, Generalmajor George Owen Squier, die Idee, Musik über Kabel zu verbreiten - Telefonkabel, um genau zu sein –, was letztlich nicht allzu weit von heutigen Methoden entfernt ist. Das Patent, das er für seine "elektrische Signaltechnik" erhielt, beinhaltete keine Musik oder sonstige tonale Inhalte. Aber der Generalmajor war der erste erfolgreiche Unternehmensgründer, der in der Praxis bewies, dass der elektronische Musikvertrieb die Zukunft war, eine, die den Radiosendern die Macht entzog und den Übertragungsfirmen zusätzliche Macht über Inhalte zusprach. (Squier hat sich auch den – inzwischen verhassten – Markennamen "Muzak" ausgedacht.)

Was wir als konventionelle Musikindustrie kennen, hat seine Wurzeln in Pianola Rollen, dann in Jukeboxen und schließlich in Radiosendern und physikalischen Medien. Im Vergleich dazu war Muzak grundverschieden, da es die gesamte Struktur umging: Playlists wurden von einem unsichtbaren, zentralisierten Unternehmen ausgewählt und überall eingespeist. Muzak war in Kaufhaus-Aufzügen zu hören (daher der Ausdruck "Fahrstuhlmusik"). Es gab Lautsprecher, die in Topfpflanzen versteckt waren. Das Weiße Haus und die NASA waren zeitweise Abonnenten von Muzak. Stille wurde durch vorprogrammierte Musik ersetzt.

Moderner Fahrstuhl mit Musik | © Colourbox

Das Unternehmen steigerte seinen Bekanntheitsgrad durch die Einführung eines als „Stimulus Progression" vermarkteten Verfahrens, ein pseudowissenschaftliches Produkt zur Steigerung der Arbeitsproduktivität. „Stimulus Progression" gleicht konzeptionell den heute gängigen App-Verhaltensschleifen und Nutzungsstimulierungen, dazu gedacht, Konsum und Aktivität anzuregen, oder um z.B. die Anzahl an Werbeklicks und App-Swipes zu erhöhen.

Irgendwann hatte die Hintergrund- Muzak allerdings ausgedudelt, die Stimulus Progression war ebenfalls längst entzaubert – Kunden zogen lizensierte Musik der Hintergrundmusik vor, und neue Konkurrenten eroberten den Markt.

Aber was ist mit der Idee eines homogenisierten, vorprogrammierten Kulturkonzeptes, das durch ein Kabel übertragen wird und die Manipulation von Verhalten zum Ziel hat? Diese Idee scheint ein Comeback zu erleben.

Automatisierung und Macht

"Künstliche" oder maschinelle Intelligenz konzentriert sich zurzeit auf einen bestimmten Bereich: die Verwendung von selbstlernenden Algorithmen zur Verarbeitung großer Datenmengen – eine Notwendigkeit unserer Zeit. Dies ist insbesondere für einige der großen technischen Akteure nützlich, welche über die Ausstattung und die Kompetenzen in den Bereichen verfügen, die das maschinelle Lernen bevorzugt: viele Server, erstklassige Rechenanalytiker und große Datensätze.

Diese Verlagerung wird sich zwingend auswirken: Radio impliziert ein begrenztes Programm; ein begrenztes Programm impliziert menschliche Selektoren – nämlich den DJ. Die Natur des Internets – offen zu sein für alle Arten von Kultur – bedeutet zwangsläufig auch einen großen Umfang. Es wird demnach unvermeidbar werden, Maschinen mit in den Prozess des Aussortierens einzubeziehen, weil das Angebot des Internets schlichtweg zu umfangreich ist.

Diese Verschiebung birgt Gefahren in sich. Erstens führt die Bequemlichkeit der Benutzer zu einer Bereitschaft, sich Präferenzen diktieren zu lassen, anstatt selbst zu wählen. Zweitens verfolgen die auswählenden Unternehmen eigene Pläne und Interessen. Insgesamt gesehen könnte dies in einer stärkeren Normierung und Homogenisierung resultieren, und es besteht die Gefahr der Marginalisierung von Andersdenkenden, Menschen mit schwacher Kaufkraft oder solchen, deren Lebensart nicht in Einklang mit jener der einflussreichen oder wohlhabenden Klassen zu bringen ist.

Wenn es also dem Traum eines Internets als globaler Musikcommunity in der Praxis an tatsächlicher Vielfalt zu mangeln scheint, findet sich hier ein eine mögliche Begründung dafür.

Gleichzeitig sollte es uns bekannt vorkommen: das Aufkommen der Aufzeichnungs- und Sendemedien brachte Ähnliches mit sich, nämlich schreckliche Bubblegum-Musik und eine enorme kulturelle Aneignung. Aber anstelle von Hitparaden und Labelchefs haben wir jetzt halt Algorithmen und firmeneigene Programmeditoren - und dieselben Probleme wie Bestechung und Beseitigung jeglicher abweichender Meinungen.

Neu sind allerdings Feedbackschleifen in Echtzeit zwischen Benutzeraktionen und der zuvor automatisch programmierten Auswahl (und vielleicht sogar bald der Produktion). Squier's „Stimulus Progression“ konnte die Daten, die vom Hörer ausgingen, nicht überprüfen – die heutigen Online-Tools jedoch schon. Bestehende Verzerrungen könnten so fast zeitgleich korrigiert oder verstärkt werden – oder eine Kombination aus beidem.

Auf jeden Fall ist dies eine sehr grundlegende Entwicklung. Beim letztjährigen CTM-Hacklab untersuchte Jason Rentfrow (Cambridge University), inwiefern musikalische Vorlieben etwas über die Persönlichkeit und das politische Denken aussagen können. Diese Untersuchung war perfekt getimt; ihre Präsentation fiel in die gleiche Woche wie Trumps Inauguration. Und dessen Wahlkampfteam hatte verschiedene Social-Media-Analysen zur Feststellung optimaler Wähleransprache und -manipulation durchgeführt.

Musikkonsum, genau wie jeder andere Konsum von Information und Kultur, ist nicht mehr von den Daten zu trennen, die während des Konsums generiert werden, und ebenso wenig von der weiteren Verwendung dieser Daten. Skepsis ist geraten gegenüber zentralisierten Datenmonopolen und der Nutzung dieser Daten, und es muss Bewusstsein herrschen über die Veränderungen, die diese Art von Algorithmen mit sich bringen; wie sie Entscheidungsfreiheit und die Medien neu gestalten. Die Suche nach Strategien zur Wiedererlangung von Selbstbestimmung und Kontrolle gehört mittlerweile zu den Herausforderungen dieser Zeit.

Auch wenn der passive Medienkonsum für Unternehmen wertvoll erscheinen mag, könnten sie feststellen, dass dieser stark zurückgeht. Shoppen auf Amazon, das Finden von Dates auf Tinder, das Schauen von Filmen und Serien auf Netflix und zunehmend auch Musikhören sind Aktivitäten, die algorithmische Empfehlungen begünstigen. Wenn die Benutzer nun aber nur diesen automatisierten Empfehlungen folgen, kreisen die Vorschläge zunehmend um sich selbst – die vorprogrammierten Tools verlieren ihren Wert. Die User sind mit einem unsichtbaren, wachsenden Schutthaufen konfrontiert, bestehend aus den eigenen Verlaufsgeschichten und denen ihrer unmittelbaren Umwelt. (Jemand, der Tinder-Dates aufgegeben hat oder schon einmal zu Freunden gegangen ist, weil er sich einfach nicht für die nächste TV-Show zum Binge-Watchen entscheiden konnte, weiß wovon ich spreche.)

Menschliche Empfehlungen, gleichermaßen von Experten wie von Freunden, haben offensichtlich einen hohen sozialen Wert. Aber es gibt noch einen dritten Weg: Maschinen sollten dazu verwendet werden, die Menschen zu verbessern anstatt sie zu verschlechtern, und die Tools sollten für vielfältige Einsatzmöglichkeiten offen sein statt nur einer Automatisierung von Prozessen zu dienen.

In anderen Kontexten profitiert die Musikbranche bereits von der Leistungsfähigkeit des Daten-Trainings. Durch die Anwendung von maschinellem Lernen zur Identifizierung menschlicher Gesten hat Rebecca Fiebrink einen neuen Weg gefunden, um gestische Schnittstellen für Musik intelligenter und zugänglicher zu machen. In Fällen, in denen die traditionellen digitalen Signalprozessor-Tools begrenzt sind, nutzen Audiosoftware-Unternehmen nun maschinelles Lernen als neuen Ansatz, um Soundmaterial zu beeinflussen. Das Wesentliche dabei ist, dass diese Tools in der aktiven Gestaltung bedeutsam werden und nicht im passiven Konsum.

Künstliche Intelligenz zurück in Anwenderhand

Die Techniken des maschinellen Lernens werden als Tools weiter ausgebaut werden, um die Nutzung der von den großen datengewinnenden Unternehmen gewonnenen Ressourcen zu verbessern - vom Erz bis zum Endprodukt. Es geht letztlich darum, wie diese Unternehmen ihre User sehen, und um deren Eigenwahrnehmung.

Dem kann man sich nicht einfach verweigern – diese Tools werden die Welt mit oder ohne Beteiligung der User prägen. Außerdem verlangt der Umfang der vorhandenen Daten ihre Verwendung. Was man jedoch tun kann, ist die Funktionsweise dieser Tools besser zu erlernen, zu verstehen und somit eigene Handlungsfähigkeit wiederherzustellen.

Wenn die Menschen darüber aufgeklärt wären, was diese Technologien sind und wie sie funktionieren, können sie besser fundierte Entscheidungen für ihr eigenes Leben und im größeren gesellschaftlichen Zusammenhang treffen. Sie könnten diese Tools auch eigenhändig korrekt oder missbräuchlich nutzen ohne dass magische Unternehmensprodukte dies für sie tun.

Der Missbrauch dieser Tools selbst hat einen besonderen Wert. Musik und Kunst sind Bereiche, in denen diese Techniken neue Erkenntnisse bringen können. Es gibt einen guten Grund, warum Google genau in diese Bereiche investiert hat – denn Künstler können sehr oft Möglichkeiten ausloten und kreatives Potenzial finden. Künstler geben den Weg vor.

Auch die Öffentlichkeit scheint auf Ecken, Kanten und Fehler zu reagieren. Als der Forscher Joseph Weizenbaum in den 60er Jahren versuchte, mit seinem Programm ELIZA mittels eines groben Sprachmusters einen Psychotherapeuten zu parodieren, wurde er davon überrascht, das die Benutzer tatsächlich begannen, dem Programm ihre dunkelsten Geheimnisse zu offenbaren und sich ein therapeutische Empathie einzubilden, die gar nicht vorhanden war. Der Einsatz sogenannter Markov-Ketten als vorhersagendes Texttool – eigentlich entwickelt, um Datenreihen mittels der Eintrittswahrscheinlichkeit ihrer Elemente vorherzusagen und nicht um Sprache zu generieren – hat zu äußerst merkwürdigen Poesie-Blüten geführt. Als Googles Stiltransfertechnik auf eine Datenbank von Hundebildern angewendet wurde, gingen die bizarren, unnatürlichen Resultate, in denen Fotos zu Hunden verzerrt wurden, viral. Seitdem hat Google wesentlich raffiniertere Techniken entwickelt, um realistische malerische Effekte anzuwenden und... nun, es scheint, dass diese neuen Techniken nur einen Bruchteil des Interesses der verzerrten Hundebilder geweckt haben.

Vielleicht ist aber noch Grundlegenderes am Werk. Unternehmenskulturen benötigen Berechenbarkeit und zentrale Werte. Der Künstler tut genau das Gegenteil und arbeitet mit Überraschungen. Es liegt also im Interesse der Künstler, dass diese Technologien sabotiert werden können. Muzak repräsentiert das, was mit Ästhetik passiert, wenn sich zentralisierte Kontrolle und Unternehmenswerte durchsetzen - aber es ist ebenso die große und öffentliche Entrüstung, die zur Vorsicht ermahnt. Überraschung und das Prinzip der Wahlmöglichkeiten sind daher nicht nur als abstrakte Konzepte, sondern auch als echte persönliche Präferenzen vorzuziehen.

Wir hatten einmal befürchtet, dass Robotik Arbeitsplätze vernichten würde; und tatsächlich leitet sich diese Bezeichnung aus dem Wort für Sklave ab (ins Leben gerufen vom technischen Künstler Joseph Čapek, dessen Bruder, der Schriftstellers Karel Čapek, es in seinem Werk R.U.R. – Rossum’s Universal Robots in die Welt der Literatur einführte). Doch am Ende hat Robotertechnologie die menschlichen Fähigkeiten erweitert. Sie hat die Menschen bis in den Weltraum gebracht und durch (die Programmiersprache für Kinder) Logo und seine Turtle-Grafik geführt, und hat sogar Generationen von Kindern Mathematik, Geometrie, Logik und kreatives Denken mittels Code gelehrt.

Das maschinelle Lernen steht anscheinend vor einer ähnlichen Weggabelung. Unternehmensführungen und passiv Medien konsumierenden Nutzern kommen diese Systeme zugute, da sie trägen Konsum begünstigen und Nutzungsdaten generieren. Der Missbrauch der Programme durch gezieltes Zerlegen und wieder Zusammensetzen, und zwar nicht als universal einsetzbare Tools, sondern als eine präzise Zusammenstellung von Techniken zur Lösung spezifischer Probleme, bietet weitere begrüßenswerte Möglichkeiten zur Nebennutzung an. Zuletzt war Muzak nichts anderes als ein Wunschtraum. Was die Leute wollten, war Musik - und Entscheidungsfreiheit. Diese Entscheidungen werden aber nicht automatisch getroffen. Vielleicht müssen wir sie hacken.

Künstliche Intelligenz und Musik Köpfe, Maschinen und Zentralisierung: Warum Musiker jetzt künstliche Intelligenz hacken müssen

Automatisierung und Macht

Künstliche Intelligenz zurück in Anwenderhand

Künstliche Intelligenz und Musik
Köpfe, Maschinen und Zentralisierung: Warum Musiker jetzt künstliche Intelligenz hacken müssen