Dieser Artikel ist Teil der Artikelreihe „Künstliche Intelligenz”.
Mittlerweile hat künstliche Intelligenz als einst reine Theorie aus der Mathematik auch künstlerische Anwendungsgebiete erreicht: Sie komponiert, malt oder schreibt den achten Band der Harry-Potter-Reihe. Gibt es eigentlich ein Urheberrecht an Romanen, Gemälden oder von Musik, die eine künstliche Intelligenz (eigenständig) geschaffen hat? Und sind Lern- und Schaffensprozesse künstlicher Intelligenz rechtlich unbedenklich?
Auch in Zeiten der digitalen Transformation mag sich Fankultur noch eher an echten Stars aufhängen. Dennoch: Mit kreativen Inhalten wie Musik, Bildern oder Geschichten, die von einer künstlichen Intelligenz (kurz: KI) geschaffen werden, werden wir es vermutlich häufiger zu tun bekommen. Der KI-Song im Stil der Beatles wirkt noch etwas holzschnittartig. Doch schon heute wird Musik von J. S. Bach, die er selbst nie komponiert hat, sondern die allein aus der Reproduktion seines Gesamtwerkes stammen, für einen echten Bach gehalten, und selbst für die ExpertInnen im Podcast „Switched on pop“ ist es ziemlich knifflig, im Blindtest Mensch von Maschine zu unterscheiden.
Damit künstliche Intelligenzen Werke schaffen können, setzen sie die Theorie des maschinellen Lernens um. Eine KI „lernt“ anhand von Beispielen – den Trainingsdaten. Ein solcher Datensatz enthält zum Beispiel Musik wie das Gesamtwerk von Bach, Texte oder digitalisierte Gemälde.
Der Trainingsdatensatz wird beim Einspeisen einem Optimierungsprozess unterzogen: In einem Soll-Ist-Vergleich auf den Trainingsdaten wird zwischen Eingabedaten und erwünschten Ergebnisdaten auf generelle Konzepte, Muster oder Regeln geschlossen. Die Stärke bzw. Priorität einer Regel wird anhand ihrer Häufigkeit implizit im Datensatz festgelegt. Implizit bedeutet, dass die Regeln im Modell der KI verbleiben und sich nicht extrahieren – also explizit abbilden – lassen: Verwendet Van Gogh einen bestimmten Blauton in einem Großteil seiner Werke, so würde auch das generierte Gemälde Nuancen dieses Blaus aufweisen. Schreibt J.K. Rowling bestimmte Kapitel aus der Ich-Perspektive, wirkt sich dies auch auf die Regeln und die spätere Textgenerierung aus. Ein explizites „Regelwerk“ über Blau-Nuancen oder Erzählperspektiven wird aber nicht ausgegeben.
Maschinelles Lernen erkennt Muster und schafft Regeln
Im nächsten Schritt wird das selbstständige Lernen auf Basis des Datensatzes meist mit Positiv- und Negativ-Beispielen durch sogenanntes Labeln gesteuert, sodass die Label das gewünschte Ergebnis schon vorgeben (überwachtes Lernen/supervised machine learning). Dabei werden Daten mit Attributen versehen: Wenn eine Bilderkennung auf Pferde trainiert wird, etikettiert man die Pferdebilder von vornherein mit „Pferd”. Ähnlich könnte eine Programmiererin das Feedback von Kunstkennern und -kritikern einbinden, die die Nähe des später generierten Werks am Original bewerten. So wird das Ergebnis des generierten Werkes noch verfeinert.
KI-Musik: Von FlowMachines und anderen Maschinenkomponisten
In der Musik wird KI vermehrt zum Generieren von Klangmustern und Tonfolgen genutzt. Jüngste Hörbeispiele KI-komponierter Musik wären das Album „Hello World“ oder „I AM AI“ von Taryn Southern. Vereinzelt wird die künstliche Intelligenz aber auch nur als Hilfe, Counterpart oder eigenes Instrument mittels eigens geschriebener Programme genutzt – so geschehen bei Olafur Arnalds. Schaut man unter die Oberfläche von „Hello World“, kann man die Nutzung von FlowMachines als Kompositionshilfe ausmachen – einem KI-Kompositionsprogramm von Sony, das auch den vermeintlichen Beatles-Song „Daddy‘s Car“ komponiert hat.
Die in der Software enthaltene KI wurde mit im Vorfeld mit Musik-Datensätzen aus diversen Genres und Jahrzehnten genährt und hat diese auf charakteristische Tonfolgen, Melodien und ähnliche Merkmale untersucht. So werden auch hier implizite Regeln für das Generieren neuer Tonfolgen und Parameter wie Dauer, Höhe, Lautstärke und Klangfarbe einbezogen. Wählt man nun im Programm das Genre und die gewünschte Tonart aus, generiert das Programm einen ersten Entwurf. Dieser ist bei FlowMachines anpassbar und kann auch partiell neu generiert werden. Damit wirkt das Kompositionstool wie ein Ideenspeicher, der auf Vergangenes zurückgreift und existierende Melodien assoziativ erweitert und entwickelt. Ähnlich funktionierende Programme sind NSynth von Magenta oder Aiva Technologies. Auch sie analysieren Samples und Musik-Datenbanken und ordnen Töne oder Melodien neu an.
Malen im Stile Rembrandts
In der Malerei bilden (digitalisierte) Gemälde einer bestimmten Epoche bzw. Stils oder eines bestimmten Malers den Trainingsdaten für das maschinelle Lernen. Wichtig ist also auch hier, dass sie einer Gruppe oder einem Überbegriff zugeordnet werden können.
Analysiert man die Gemälde von Van Gogh oder Rembrandt, finden sich Übereinstimmungen in Farbauftrag und -ton, typische Motive oder Anordnung von Licht und Schatten in den Werken (nicht unbedingt malerübergreifend). Die Schaffensmetamorphose ist ebenfalls relevant, um ein Bild des „jüngeren“ oder „älteren“ Rembrandt zu erzeugen. Sind die Merkmale ausgemacht, können implizit Regeln für die Generierung neuer Werke gebildet werden. Das heißt jedoch nicht, dass die KI nun ohne weiteren Schritt einen Rembrandt malen könnte. Die aus den originalen Rembrandt-Bildern erlernten Regeln müssen auf einen anderen Datensatz angewendet werden – erfordern also zum Beispiel ein eigenes digitales Bild zum automatisierten Bearbeiten im typischen Stil des Malers. Eine Beispielsanwendung ist „deepart.io”: Dort kann man ein Foto importieren und in ein Kunstwerk von Dalí oder einem Maler seiner Wahl umwandeln lassen.
KI-Texte
Mit den entsprechenden Trainingsdaten kann eine KI sogar Romane schreiben. Für Fans von Harry Potter gibt es die Möglichkeit, nach Band 7 die Geschichte mit Hilfe einer KI weiter zu erzählen – auf Basis der Bände 1-7. Die Apps „Botnik“ und „predictive writer“ geben diese Möglichkeit ohne Vorkenntnisse. Dabei kommt auch Klamauk wie „Harry Potter und der Stein auf dem Boden“ heraus, „geschrieben” mit dem Datensatz des ersten Harry-Potter-Buches.
Die Welt KI-geschaffener Werke ist also sehr vielfältig. Doch ist das KI-Geschaffene (urheber)rechtlich geschützt? Ist also die Kontrolle über Kopie, Sendung, Verbreitung, Veränderung und wirtschaftliche Ausbeute möglich? Oder ist all das genannte Material rechtefrei?
Unterscheiden muss man den Schutz von KI-Geschaffenem vom Schutz „der KI selbst”, also von Programmcode und Trainingsergebnissen. Zumindest Programme zum Trainieren und Ausführen trainierter Netze können unter urheberrechtlichen Softwareschutz fallen (siehe Ehinger/Stiemerling in CR 2018, 761). Vermutlich werden beim Schutz von Trainingsergebnissen aber Geheimhaltung und Geschäftsgeheimnisse relevanter sein als das Urheberrecht. Wir möchten diesen Aspekt hier aber ausklammern und uns auf den Output konzentrieren, also die KI-Kunst.
Das Geschaffene sind unter anderem Bilder, Texte und Musik. Bei all diesen Werkkategorien greift urheberrechtlicher Schutz, wenn es sich um persönliche geistige Schöpfungen handelt, § 2 Abs. 2 UrhG. Bei den meisten rechtlichen Auseinandersetzungen über den Schutz eines Textes, einer Melodie oder einer Zeichnung (oder Fragmenten daraus) wird darüber gestritten, ob das Werk originell genug ist und sich vom „bloßen Handwerk“, dem „Alltäglichen“ abhebt. Gerade in Plagiatsprozessen wird immer wieder minuziös untersucht, ob Text- und Musikfragmente, Fotomotive oder Romanfiguren vor der Übernahme anderer geschützt sind.
Die KI-geschaffenen Werke mögen zwar teils hölzern wirken. Aber was wir dort schon hören, lesen und sehen können, würde ein Urheberrechtler in aller Regel als ausreichend originell bewerten. Es steht eine andere Grundfrage des Urheberrechts im Raum: Kann eine KI überhaupt Schöpferin von Werken sein?
Nur Menschen sind SchöpferInnen
Klar ist: Das deutsche (und das kontinentaleuropäische) Urheberrecht erkennen die Maschine als Schöpferin von Werken nicht an. Werke schaffen kann nur ein Mensch, denn Werke müssen etwas persönlich Geschaffenes sein. Das Urheberrecht ist traditionell stark am Persönlichkeitsrecht aufgehängt (droit d‘auteur): Mein Roman, mein Lied, meine Zeichnung sind Ausdruck meines Wesens, das in meiner Einzigartigkeit und in meiner Lebenssituation Wörter, Töne und Pinselstriche einmalig auswählt und variiert. Als UrheberIn steht es mir neben der wirtschaftlichen Kontrolle übers Werk zu, dass ich entscheiden kann, wann und wie es in die Öffentlichkeit geht (§ 12 UrhG), ob und wie mein Name daran steht (§ 13 UrhG) und dass es nicht entstellt wird (§ 14 UrhG).
„Urheber ist der Schöpfer des Werkes.”
An der Anforderung „Mensch als Schöpfer” kommt man also nicht vorbei.
Wer nun einen Werk-Erzeugen-Button drückt und die Maschine das „neue“ Beatles-Album oder einen Harry Potter-Nachfolger erzeugt, schafft allein durch diesen Akt kein Werk – auch dann nicht, wenn in das Antrainieren der KI viel Arbeit geflossen ist. Und für den schöpferischen Beitrag des Menschen genügt der Knopfdruck allein nicht. Was den Werkschutz betrifft, wäre es urheberrechtlich erst mal gemeinfrei – jede/r dürfte also kopieren, aufführen, verändern.
Fremde, schon bestehende Rechte im Generierten
KI-Werke können allerdings fremdes, seinerseits geschütztes Material enthalten: zum Beispiel, wenn per KI aus einem Fotomotiv eine Malerei generiert wird – und das Fotomotiv so individuell ist, dass sein Schutz auch noch in der „Malerei“ steckt.
Dasselbe gilt, wenn fremde Aufnahmen oder geschützte Handlungsverläufe und Romanfiguren enthalten sind, die unverändert oder unfrei bearbeitet übernommen werden. Wer diese Werke dann zugänglich macht, haftet dafür nach den etablierten Zurechnungsregeln. Dasselbe gilt für Melodien, Soundschnipsel oder Textfragmente. KI-generierte Werke sollten also nicht bedenkenlos ohne Plagiatskontrolle ins Netz gestellt werden.
Wenn man von fremden Rechten spricht, ist die Frage, wo man die Grenze zieht. So sind Ideen, Stilrichtungen und Genres nicht Gegenstand des Urheberrechts und dürfen daher frei übernommen werden. Die schwierige Grenze liegt da, wo die Trainingswerke verblassen.
Ob nun ein Album einer KI-Madonna, das zwar keine Kompositionen und keine echten Tonaufnahmen von ihr verwendet, sondern „nur“ klingt wie sie und dabei täuschend echt wirkt, erlaubt veröffentlicht und vermarktet werden darf, ist nicht nur eine Frage des Urheberrechts. Möglicherweise macht man sich hier geschützte verwertbare Teile ihres Persönlichkeitsrechts und ihres wettbewerbsrechtlichen Leistungsschutzes als Star zu Eigen – was sie oder er übers Schadensersatz-, Bereicherungs- und Wettbewerbsrecht untersagen und abschöpfen kann.
Würde man Schutz der KI-Werke bejahen, stellte sich die Frage, wem Rechteinhaberschaft und Nutzungsrechte am KI-geschaffenen Werk zufallen würden. Denn schließlich hat eine Maschine keine Rechtspersönlichkeit. Ansetzen könnte man hier beim Investitionsschutz, der keine Schöpferperson voraussetzt, sondern Hersteller eines Immaterialguts schützt, die dafür Investitionen getätigt haben. Das Datenbankschutzrecht aus §§ 87a ff. UrhG ist ein solches Schutzrecht. Es belohnt Investitionen in Sammlungs- und Strukturierungsleistungen von „unabhängigen Elementen“ in einer Datenbank. Vollkopien dieser Datenbanken und wesentliche Entnahmen daraus sind dann erlaubnispflichtig. Der Datenbankschutz passt aber für (KI-)Werke nicht, weil Songs, Texte, Bilder etc. nicht aus unabhängigen Elementen bestehen, die einzeln zugänglich sind (vgl. auch Hetmank/Lauber-Rönsberg in GRUR 2017, 574, 579).
Wem gebührt der Wert?
Doch es existiert noch ein weiterer Ansatz: der Schutz der Ausbeute der KI. So geht in der Diskussion um ein Dateneigentum die Idee um, wertvolle Informationen ähnlich wie Erzeugnisse nach §§ 99, 100 BGB oder sonstige Rechte nach § 823 Abs. 1 BGB zu schützen.
Die eigentliche Frage ist nicht, wer der Urheber ist, sondern wem der Wert des Bildes gebührt. Relevant sind neben dem UrhG auch Rechtsfragen rund um §§ 99/100 und §812 ff. BGB. Bislang gibt es dazu m.W. keine höchstrichterliche Rechtsprechung. https://t.co/uXlvSvMTvR
— Simon Assion (@sas_assion) 6. Januar 2019
Demnach könnte man ein KI-Werk als Rechtsfrucht bzw. das Erzeugnis der Rechte aus dem Code/aus dem KI-Modell sehen: Wer ein Softwareurheberrecht oder das Geschäftsgeheimnis innehat, würde der Ertrag zustehen, der sich mit den KI-Werken erzielen lässt. Dieser Ansatz würde nicht zum selben Schutz führen wie ein Werkurheberrecht. Aber zumindest könnte sich nach diesem Ansatz der „Erzeuger“ die wirtschaftliche Ausbeute aus den Werken über das Bereicherungsrecht zurückholen und Gewinne für sich abschöpfen. Das ist alles hoch umstritten – hier ist noch nichts abschließend geklärt.
Übrigens behandelt das britische Recht computer-generated works: SchöpferIn ist die Person by whom the arrangements necessary for the creation of the work are undertaken (Section 9(3) des Copyright, Design and Patents Act). Eine AnwenderIn oder ProgrammiererIn hat dort das Urheberrecht inne.
Tatsächlich wird in vieles, was KI-generiert ist, noch einmal kreativ eingegriffen. Das führt uns zur Schnittstelle zwischen maschinenkreativer Schöpfung und menschengesteuerter Maschine.
Dass mit Photoshop oder einer Audio-Workstation geschaffene Illustrationen oder Musik geschützt sein können, ist unumstritten – sofern der Mensch die Maschine steuert, also bloß als Hilfsmittel einsetzt. Wenn die Musik-App zum Beispiel ein Harmoniegerüst vorschlägt, weil es Harmonielehre versteht, schafft ein Werk, wer (als Mensch) darüber eine Melodie komponiert. Und der menschengedichtete Text über einem maschinengeschaffenen Song (so bei „Daddy’s Car”) ist natürlich schutzfähig, schon weil der Text ein eigenes Werk ist.
Setzt aber der Mensch einen Schaffensprozess lediglich in Gang, bei dem allein die Maschine die Kunst beherrscht, wendet also allein die Maschine das Gelernte an und ist aus Bedienersicht das konkrete Werk zufällig, ist die Maschine kein bloßes Hilfsmittel mehr. Gibt der Mensch nur Stilrichtungen vor – Ideen und Stile sind ja nicht geschützt –, kommt kein Werkschutz in Frage.
Doch wie grenzt man hier bei Mensch-Maschinen-Hybriden ab? Die Hürde zur persönlichen geistigen Schöpfung kann ein solcher Hybrid nehmen,
Es fragt sich noch, wer von außen bei einem fertigen Werk die Anteile von Mensch und Maschine noch voneinander abgrenzen kann. Genauer Einsatzgrad von KI und der Grad des menschlichen Beitrags werden vermutlich oft ein Geheimnis bleiben. So ist es auch bei dem erwähnten Album von Skygge und der Einbindung von FlowMachines: Welche Teile nur generiert, welche dagegen abgeändert wurden, ist trotz der „Aufklärungsvideos“ nicht ersichtlich und nur schwer hörbar. Sollte diese Prämisse des Menschen als Werkschöpfer bald bröckeln, geriete auch die Verwertungspraxis ins Wanken – in der nur vergütet werden muss, was schutzfähig ist.
Schließlich sollte die Frage im Auge behalten werden, ob eine Maschine grenzenlos „inspiriert“ werden darf. Denn die Maschine muss immerhin mit Datensätzen gefüttert werden, um trainiert zu werden – darunter geschützte Texte, Bilder und Musik. Hier kann es auf verschiedenen Ebenen zu Vervielfältigungen (§ 16 UrhG) kommen, wenn Material digitalisiert, in die Lern-Datenbank eingespeist und in andere Formate überführt wird.
Für eine Kopieerlaubnis im Vorfeld zum Erkenntnisgewinn kommt die neue Text und Data-Mining-Schranke (TDM) ins Spiel: Nach § 60d UrhG darf eine „Vielzahl von Werken“ (sogenanntes Ursprungsmaterial) automatisiert und systematisch vervielfältigt werden, um daraus „insbesondere durch Normalisierung, Strukturierung und Kategorisierung ein auszuwertendes Korpus zu erstellen“. Privilegiert ist der Zweck der automatisierten Auswertung für die wissenschaftliche Forschung. Die TDM-Schranke zielt auf den Erkenntnisgewinn aus großen Datenbeständen ab – Muster, um Regeln zu bilden, sind ein Anwendungsfall, und damit durchaus die kunstlernende KI. Man darf hier also alle geschützten Werke einer Malerin vervielfältigen, um mit einer Big Data-Analyse ihren Stil daraus zu destillieren. Für Kopien zum Zweck dieser Lernprozesse passt die Schranke ganz gut. Nur: Auf § 60d UrhG darf sich nur die nicht-kommerzielle Forschung stützen. Alles andere muss gesondert lizenziert werden – wofür gezielte Lizenzierungsmodelle bei Massenanalysen unerlässlich sind.
Von einer generellen Inspirationserlaubnis für KI kann man also im Urheberrecht nicht sprechen.
Eine KI kann nach geltendem Recht keine Schöpferin von Werken sein. Allerdings ist die Diskussion noch nicht erschöpft. Und zwischen Maschinen- und Menschengeschaffenem ist viel Raum für Zwischentöne.
Wir danken Prof. Dr. Harald Sack (Professor am Karlsruher Institut für Technologie (KIT) und Bereichsleiter für Information Service Engineering bei FIZ Karlsruhe – Leibniz-Institut für Informationsinformationsinfrastruktur) für die freundliche Unterstützung zum technischen Hintergrund.
Fabian Rack ist Mitglied bei Telemedicus, Rechtsanwalt bei Nolte Pustejovsky Rechtsanwälte in Freiburg und Wissenschaftlicher Mitarbeiter bei FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur (Prof. Dr. Franziska Boehm).
Oliver Vettermann ist Wissenschaftlicher Mitarbeiter am Lehrstuhl Prof. Gersdorf, Universität Leipzig und forscht an einem interdisziplinären, vom BMBF geförderten Projekt zur effektiven Information nach einem digitalen Identitätsdiebstahl bei FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur.