Menü

Musik im Horizont Künstlicher Intelligenz Wer spielt die Töne?

Inwiefern erweitern digitale und KI-Technologien den künstlerischen Horizont der Musik? Was können sie für Fragen der Urheberschaft und Verteilungsgerechtigkeit bedeuten?

Mit sogenannten »Deep Learning«-Prozessen, bei denen mehrere neuronale Netze hintereinandergeschaltet werden, kann eine Künstliche Intelligenz lernen, Muster wie typische Ton- und Harmoniefolgen, aber auch größere Struktur- und Stilmerkmale von Musiken tiefer und detaillierter zu erkennen sowie Varianten daraus zu bilden. Bei einem musikalischen Experiment des chinesischen Huawei-Konzerns 2019 in London sollte eine solche selbstlernende, mit über 90 Werken von Franz Schubert trainierte KI dessen Unvollendete Symphonie vollenden.

Was ist Kunst?

Für das Schuberts Musik bloß nachahmende Ergebnis wurden die von der KI vorgeschlagenen Varianten noch von einem Komponisten selektiert, modifiziert und strukturiert. Ebenfalls im Jahr 2019 entwickelte die Avantgarde-Pop-Künstlerin Holly Herndon für ihr Album Proto eine KI mit dem Namen Spawn, trainierte diese mitihrer eigenen Stimme und ließ sie damit den Godmother genannten Song in einem ebenfalls antrainierten Musikstil generieren. Dem mithilfe einer KI aus Audio-Fragmenten von John Lennon komplettierten und clever als letzter Song der Beatles vermarkteten Titel Now and Then, gelang es 2023 sogar, die Spitze der Charts zu erreichen.

Gerade unter kommerziellen Gesichtspunkten scheint die Bedeutung zu wachsen, dass eine KI ihr Ausgangsmaterial für Simulationen nutzt, also etwa auch die Stimme eines toten Stars wie Elvis Presley Lieder singen lässt, die er zu Lebzeiten nie in seinem Repertoire hatte. Bei dem Material, mit denen solche KIs gefüttert werden, entsteht ein neuer, komplexer Bedarf an verwertungsrechtlichen Regelungen – und das sowohl hinsichtlich der Komponisten, Textdichter oder Verlage, als auch bezüglich der aufführenden Musiker, die im Pop-Bereich etwa bei einer Band wie den Beatles oftmals in beiden Rollen sind. Im Zuge solcher KI-Quantensprünge brachte der dänische Fachanwalt Peter Schonning während der 11. Internationalen Urheberrechtskonferenz im November 2023 in Berlin eine Anpassung nicht nur des Urheberrechts, sondern auch der Definition eines künstlerischen Produkts in die Diskussion.

Sollte ein durch KI generiertes Bild als Reproduktion definiert werden?

Ob man nicht zum Beispiel ein durch KI generiertes Bild dann als Reproduktion definieren sollte, wenn es überwiegend den Vorbildern ähnlich sieht, mit denen die KI geschult wurde. Ein solches Bild wäre dann rechtlich wie eine mediale Vervielfältigung zu behandeln. Es ließe sich fragen, ob Analoges auch für ein klingendes KI-Produkt etwa im Stil eines bestimmten Komponisten oder eines Songs der Beatles gelten könnte, wenn darin die fürs Training der KI genutzten Partituren oder verwerteten Audios noch deutlich und über weite Strecken zu erkennen sind. Und wäre auch der umgekehrte Fall denkbar, dass ein KI-Musikprodukt ähnlich wie eine Collage oder ein Mix dann als eigenständiges Werk gelten würde, je weniger Trainingsmaterial darin identifizierbar ist und je mehr künstlerische Umwandlung oder Neu-Kontextualisierung es darin gibt? Im Ende 2023 ausgehandelten AI Act, dem großen EU-Regelwerk zur KI, wird bei KI-generierten Werken grundsätzlich die Einhaltung des EU-Urheberrechts gefordert sowie eine detaillierte Transparenz der Daten, mit denen die KI gefüttert wurde – wobei die konkrete Umsetzung noch der Klärung bedarf. Derzeit nutzen die Tech-Unternehmen die von der EU kostenlos erlaubte Praxis des »data mining«, um das Internet nach Text-, Bild- und Audiomaterial zu durchsuchen und ihren KIs damit den nötigen Lernstoff zu liefern.

Die Herausforderung scheint groß, eine internationale Verteilungsgerechtigkeit zu gewährleisten, ohne die Entfaltung eines neuen künstlerischen Formenreichtums zu behindern. Wie kann im Zeitalter der Künstlichen Intelligenz eine Regulierung des grenzüberschreitend freien Spiels der digitalen Klänge sinnvoll umgesetzt werden? Passt die säuberliche Trennung im Gefüge herkömmlichen Urheberrechts zwischen Werk, Bearbeitung, Interpretation und Aufführung noch zu einer digitalen und KI-unterstützen Musikpraxis?

Die Musikindustrie warnt vor einer Bedrohung durch KI.

Inzwischen mehren sich die Stimmen, die vor einer Bedrohung generativer KI für die Musikindustrie warnen, so wie im Frühjahr 2024 in einem offenen Brief von mehr als 200 Popstars. Als bedroht werden darin die Identität, die Werke und der Lebensunterhalt der Musiker gesehen. Auch eine Studie der deutschen Verwertungsgesellschaft GEMA warnte etwa zeitgleich vor dem Risiko verminderter Einkünfte durch von KI generierte Musik für 27 Prozent aller Urheber.

Kunst ohne Können

Und es gibt bereits Pläne für die Weiterentwicklung generativer KI-Musik-Tools, die das Musikmachen für alle, die Erstellung eigener Songs durch noch intuitivere Eingabeformen als Text-Prompts ermöglichen soll. Als Entwicklungsziel sehen die Macher des global erfolgreich verbreiteten Musiktools Suno AI weniger einen Musikautomaten als vielmehr ein universelles Musikinstrument, das ohne besonderes Können oder Wissen einsetzbar ist. Jeder soll damit in die Lage versetzt werden, Musik nicht bloß zu konsumieren, sondern nach seinen eigenen Vorstellungen und Bedürfnissen auch zu erzeugen.

Bisher wirkt Suno AI zwar noch sehr formatiert und standardisiert, sowohl was die Eingabemöglichkeiten betrifft als auch bei den klingenden Resultaten dieser Eingaben. Aber schon jetzt zeigt das Tool einen deutlichen Zuwachs an Gestaltungsmöglichkeiten bei gleichzeitiger Erleichterung der Bedienung. Mit einfachen Sprachbefehlen können die Nutzerinnen ihre gewünschten Musikformen oder Veränderungen vorhandener Audios beschreiben, die dann gleich in mehreren Varianten realisiert werden. Verstärkt sich mit solchen KI-Tools die Bildung musikalischer Bubbles bzw. Echokammern noch oder entstehen eher neue Formen musikalischen Ausdrucks unabhängig vom Bildungsstand? Was die Nutzung des darin versammelten Materials betrifft, stellt sich wieder die Frage, ab wann die Transformation von Bestehendem mit Ausnahme des bloßen Kopierens oder Plagiierens, also das Variieren, Vermischen oder Weiterentwickeln von zuvor Gehörtem, als als verwertungsrechtlich relevant oder als charakteristisch für jedes Musikmachen bewertet werden kann?

Eine andere Perspektive auf KI

In seinem Anfang 2024 erschienenen Buch Literary Theory for Robots nimmt Dennis Yi Tenen, Software-Entwickler und Literaturwissenschaftler an der New Yorker Columbia-Universität, eine veränderte Perspektive auf die sogenannte Künstliche Intelligenz ein, in der er vor allem ein soziales, kollektives und kulturelles Phänomen sieht. Er verortet KI unter Werkzeugen wie Wörterbüchern oder Textverarbeitungsprogrammen, die den Akt des Schreibens, Denkens und Kommunizierens immer schon begleitet haben und das Resultat jahrhundertelanger gemeinsamer menschlicher Anstrengungen und Kenntnisse sind.

»Für die digitale Zukunft sind geistig-kulturelle Kompetenzen von besonderer Bedeutung.«

Für die Zukunft unserer digitalen Erweiterungen seien daher geistig-kulturelle Kompetenzen von besonderer Bedeutung, um mit guten Inhalten bessere Roboter zu erziehen. Als weitere Stufe einer künstlerisch-musikalischen KI-Evolution wären aus dieser Perspektive vielleicht sogar »physische« Musik-Roboter vorstellbar, die auch mit physischen Daten trainiert würden. Lernmaterial wäre für die KI solcher, zum Beispiel Geige spielender Roboter dann nicht nur die gesamte Violinliteratur inklusive ihrer medial zugänglichen Interpretationen, sondern das spielerische Können würde ihnen zudem noch körperlich von konkreten Personen auf realen Instrumenten beigebracht.

Roboter-Virtuosen statt Stargeigerin

Auf der Basis des so Erlernten könnten die Roboter-Virtuosen selbstständig und im besten Fall noch untereinander vernetzt ihre musikalische und spieltechnische Kompetenz weiter perfektionieren. Dieses mithilfe ihrer Roboter-KI erworbene Wissen und Können würde nicht nur in die Fähigkeit münden, Geigenliteratur im Stil bestimmter Violinvirtuosen zu interpretieren, die diese vielleicht nie zuvor gespielt haben, sondern auch in die Erzeugung neuartiger Interpretationsversionen etwa der Solo-Partiten von Johann Sebastian Bach aus der Vermischung verschiedener Stile. Darüber hinaus könnten die Geige spielenden Roboter von pädagogisch erfolgreichen Stargeigerinnen für den Einsatz als Geigenlehrer geschult werden und deren Interpretationskunst über ihren Tod hinaus einer unbegrenzten Zahl von Studierenden vermitteln.

Was die rechtliche Seite dieser Vision betrifft, würden relevante schöpferische Anteile wahrscheinlich nicht nur in den Kompositionen und ihren medial oder physisch vermittelten Interpretationen gesehen werden, mit denen die Roboter-KI gelernt hat. Da Computerprogramme in der EU ebenfalls unter das Urheberrecht fallen, kämen auch diejenigen in den Blick, die den Roboter programmierten, die Algorithmen entwickelten und seine kreativen Parameter festlegten.

Jenseits des KI-Bereichs wären zudem Patente bei den technischen Erfindungen vorstellbar, wie den beim Roboterbau zum Einsatz kommenden Materialien oder der Konstruktion seiner Motorik – etwa für die beim Geigenspiel so wichtige Beweglichkeit und Sensitivität der Finger. Einen besonderen Weg in Richtung gemeinsamer künstlerischer Prozesse von Mensch und Maschine geht schon heute das KI-Kooperationsprojekt Spirio der Technischen Hochschule und der Hochschule für Musik in Nürnberg. Die hierfür eingesetzte Künstliche Intelligenz steuert einen selbstspielenden Konzertflügel und erzeugt im Dialog etwa mit einem Jazz-Saxophonisten musikalisch originelle Ergebnisse.

Selbstspielender Konzertflügel meets Jazz-Saxophonist.

Auch hier wird es rechtlichen Regelungsbedarf geben, etwa was das Lernmaterial der KI sowie die mit ihr interagierenden Musikerinnen betrifft. Allerdings eröffnen sich, wenn menschliche und künstliche Kreativität live zusammenspielen, noch einmal ganz eigene ästhetische Horizonte und Resonanzen. Beim Spirio-Projekt improvisieren Mensch und Maschine miteinander, beeinflussen sich im Verlauf wechselseitig und lassen dabei überraschend neue Töne entstehen.

Kommentare (0)

Keine Kommentare gefunden!

Neuen Kommentar schreiben

Nach oben