Out-Law News Lesedauer: 3 Min.
08 Oct 2024, 7:41 am
Als eines der ersten Gerichte in Europa hat das Landgericht Hamburg darüber entschieden, inwieweit die Urheberrechtsschranke des Text & Data Minings im Kontext des Trainierens von KI-Systemen Anwendung finden kann. Im Ergebnis sprechen sich die Richter für eine Anwendbarkeit der Schranke aus.
Das LG Hamburg hat in seinem jüngst ergangenen Urteil zugunsten von LAION, einer Non-Profit Organisation mit Sitz in Hamburg, welche sich der Entwicklung von Datasets, Code und Machine Learning Modellen verschrieben hat, entschieden, dass es keiner Einwilligung der Urhebers bedarf, um mittels urheberrechtlich geschützter Inhalte Datensets zu erstellen, die dann zum Trainieren von Künstlicher Intelligenz (KI) genutzt werden sollen. Konkret hatte der Fotograf Robert Kneschke geklagt, dessen Fotografien im Zuge eines Scrapings von dessen Website vervielfältigt und anschließend zur Erstellung des besagten Datensets genutzt worden waren.
Die Richter vertreten in ihrer Entscheidung die Auffassung, dass die Erstellung eines solchen Datensets unter Paragraph 60d des Gesetzes über Urheberrecht und verwandte Schutzrechte (UrhG) fallen. Nach dieser Norm sind Vervielfältigungen zum Zwecke des Text & Data Minings (TDM) im Kontext wissenschaftlicher Forschung unter bestimmten Voraussetzungen zulässig. Die Regelung basiert auf Artikel 3 der DSM Copyright Richtlinie der EU.
Dr. Nils Rauer, MJI
Rechtsanwalt, Partner
Das Gericht befasste sich mit Rechtsfragen, die angesichts aktueller Entwicklungen im Bereich der generativen KI in der Welt des Urheberrechts heiß umstritten sind – Fragen, die wahrscheinlich auch in anderen Rechtsstreitigkeiten von Bedeutung sein werden.
Dr. Nils Rauer, Experte für Urheberrecht bei Pinsent Masons, zufolge, sind die Ausführungen des LG Hamburg zur generellen Anwendbarkeit der TDM-Schranke gut nachvollziehbar und überzeugend. Dabei betont er, dass das Gericht in seinem Urteil nur zu einem Teilaspekt der Materie Stellung nehmen konnte, namentlich der Erstellung solcher Datensets.
„In dem zu entscheidenden Fall ging es maßgeblich um den Vorgang des Scrapings und dem anschließenden Verwenden der Werkkopie zum Zwecke der Erstellung einer Datenbank. Nicht Gegenstand der Entscheidung ist das Trainieren der KI selbst oder die Verwendung des KI-Tools zur generativen Erschaffung neuer Inhalte“, so Nils Rauer. „Gleichwohl lassen die Ausführungen der Richter weitergehende Schlussfolgerungen zu, so etwa zum generellen Verhältnis der unionsrechtlich harmonisierten TDM-Schranke und dem Training von KI-Systemen.“
Die mündliche Verhandlung und das anschließende Urteil wurden seit längerem mit Spannung erwartet. Das Verfahren hatte von Beginn an, also seit Einreichung der Klage Ende April 2023, reges Interesse geweckt. Die Nutzung proprietär geschützter Daten im Zuge der Entwicklung von KI-Modellen ist vielerorts heftig umstritten und hat unter anderem in den Vereinigten Staaten und in Großbritannien bereits vermehrt zu Klagen der Rechteinhaber geführt. Allein Entscheidungen sind bislang noch kaum ergangen.
Die Hamburger Richter blicken zuerst auf die Norm des Paragraphen 44a UrhG. Die Norm erlaubt vorübergehende Vervielfältigungshandlungen, die flüchtig oder von begleitender Natur und integraler und wesentlicher Bestandteil eines technischen Verfahrens sind. Zudem dürfen die Handlungen ausschließlich dazu dienen, entweder eine Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder eine rechtmäßige Nutzung von urheberrechtlich geschützten Werken zu ermöglichen, und keine eigenständige wirtschaftliche Bedeutung haben. Das Scraping von Inhalten zum Zwecke der Erstellung von Datensets ist jedoch, so die Richter überzeugend, weder flüchtig noch begleitend. Dies gilt auch in Ansehung der späteren Löschung der in Rede stehenden Inhalte.
Die zweite und dritte Erlaubnisnorm, welche das Gericht in den Blick nehmen, basieren auf einer Aktualisierung des europäischen Urheberrechts aus dem Jahr 2019. Seinerzeit trat die DSM Copyright Richtlinie in Kraft. Artikel 4 der Richtlinie sieht einen allgemeinen TDM-Erlaubnistatbestand vor. Es gelten jedoch maßgebliche Einschränkungen. Zum einen dürfen Vervielfältigungen nur so lange aufbewahrt werden, wie es für die Zwecke des Schutzes erforderlich ist, zum anderen ist die Schranke an die Bedingung geknüpft, dass die Rechteinhaber kein Opt-Out in maschinenlesbarer Weise erklärt haben. Artikel der der Richtlinie, der Text & Data Mining zum Zwecke der wissenschaftlichen Forschung erlaubt, sieht einen solchen Opt-out Vorbehalt nicht vor.
„Es ist hervorzuheben“, so Anna-Lena Kempf, Urheberrechtsexpertin im Team von Nils Rauer, „dass das LG Hamburg der in der Literatur bisweilen vertretenen Ansicht, die TDM-Schranken könnten schon dem Grunde nach nicht im Kontext des Trainierens von KI-Tools Anwendung finden, eine klare Absage erteilt. Dies ist zu begrüßen.“ Denn auch der europäische Gesetzgeber habe bei der Formulierung der neuen KI-Verordnung klar zum Ausdruck gebracht, dass die bestehenden TDM-Schranken anwendbar sein sollten. Artikel 53 der KI-Verordnung zeige dies sehr eindeutig. Auch der Drei-Stufen-Test führe nicht dazu, dass besagte Schrankenregelungen einer teleologischen Reduktion unterzogen werden müssten.
Im vorliegenden Fall hatte der Rechteinhaber allerdings in den der Website zugrundeliegenden AGB ein Opt-out erklärt. Die Richter wenden sich daher in ihrer Entscheidung der Frage zu, ob eine solche in „einfacher Sprache“ gehaltene Erklärung als maschinenlesbar im Sinne des Gesetzes anzusehen ist. Im Ergebnis wird dies bejaht. Dies geschieht unter Hinweis darauf, dass moderne KI-Systeme ohne weiteres in der Lage seien, eine in einfacher Sprache gehaltene Erklärung zu lesen und zu deuten. Man könne daher vom Rechteinhaber nicht verlangen, sei Opt-out in einer bestimmten weise zu kodieren, um eine Maschinen-Lesbarkeit sicherzustellen.
Allerdings kann sich LAION nach Ansicht des Gerichts auf Paragraph 60d UrhG stützen, also auf die TDM-Schranke, die für den Wissenschaftsbereich gilt. Die Richter stufen LAION als eine Forschungseinrichtung ein. Auch habe die konkrete Erstellung des in Rede stehenden Datensets wissenschaftlichen Forschungszwecken gedient. Es sei um wissenschaftlichen Erkenntnisgewinn gegangen. Dass eine solche Zielsetzung auch im vorliegenden Fall bestanden habe, könne bejaht werden. Dafür genüge es bereits, dass der Datensatz – unstreitig – kostenfrei veröffentlicht und damit gerade (auch) auf dem Gebiet künstlicher neuronaler Netze Forschenden zur Verfügung gestellt wurde, so das Gericht.
„Im Ergebnis eröffnen die Richter damit Entwicklern von KI-Systemen, auch ohne die individuelle Autorisierung durch einzelne Rechteinhaber Datensets zu erstellen, die dann genutzt werden können, um Künstliche Intelligenz zu trainieren. Rein faktisch wäre es problematisch, Trainingsdaten von hinreichender Qualität und Quantität zu generieren, wenn dies von der Erlaubnis des jeweiligen Urhebers oder Rechteinhabers im Einzelfall abhängen würde“, schlussfolgert Nils Rauer.