Darf man KI mit fremden Daten trainieren?
Webcrawler laden jede Sekunde Daten aus dem Internet herunter. Diese Daten werden dann sortiert, veredelt, gelabelt – und zum KI-Training verwendet. Das Erstaunliche: Das deutsche Recht bietet in §§ 44b, 60b UrhG weitreichende Möglichkeiten, fremde Daten legal zum KI-Training zu verwenden. Das betrifft auch Paywall-Inhalte und vergütungspflichtige Datenbanken.
Etwas anderes gilt, wenn sich die Rechtsinhaber ausnahmsweise die „Nutzung zum Text und Data Mining“ vorbehalten haben. Bei online zugänglichen Werken muss ein solcher Nutzungsvorbehalt in maschinenlesbarer Form erfolgen. Spannend sind Anweisungen über AGB, Impressum, robots.txt sowie das TDM Reservation Protocols – hier kommt es auf die konkrete Gestaltung im Einzelfall an. In der Praxis wird jedoch von den meisten Websites und Medien keinen wirksamen Nutzungsvorbehalt erklärt. Wir zeigen Ihnen den Goldstandard zum Umgang mit geistigem Eigentum im KI-Kontext.
Wem gehören KI und Prompts?
Im Prinzip kann an Trainingsdaten, trainiertem KI-System (Gewichte und Schwellenwerte) und Input (Prompts) geistiges Eigentum bestehen. Dazu muss der konkrete Fall die gesetzlichen Schutzvoraussetzungen erfüllen. Zudem kommt ein Schutz durch das Geschäftsgeheimnisgesetz (GeschGehG) in Betracht, soweit angemessene Geheimhaltungsmaßnahmen getroffen wurden.
Viele AI Provider lassen sich ein Recht zur Weiterverwendung aller zur Verfügung gestellten Daten einräumen. Die KI-Nutzung „bezahlt“ man dann mit Trainings- oder Produktivdaten. Vor allem wenn Cloud-Tools als Arbeitserleichterung eingesetzt werden, droht ein (unbemerkter) Abfluss sensibler Unternehmensdaten auf fremde Server und an fremde Unternehmen. Unerlässlich zum Schutz von Geschäftsgeheimnissen ist eine vertragliche Absicherung in der Leistungsbeziehung (insb. durch NDAs). Daneben benötigen Unternehmen adäquate AI-Policy für die internen Mitarbeitenden. Denn der effektive Schutz von IP und Geschäftsgeheimnissen entscheidet sich auch auf der Anwendungsebene.
Die von der Europäischen Kommission am 28.09.2022 vorgeschlagene KI-Haftungsrichtlinie sieht weitreichende Auskunftsansprüche etwaiger KI-Geschädigter vor. Es droht daher eine Ausforschung von Geschäftsgeheimnissen.
Wem gehören KI-Ergebnisse?
Urheberrechtlicher Schutz kann nach Art. 2 Abs. 2 UrhG nur an persönlichen geistigen Schöpfungen entstehen. Wird ein Inhalt überwiegend durch KI erzeugt, fehlt es hieran regelmäßig. Dann sind die Erzeugnisse im urheberrechtlichen Sinne gemeinfrei. Sie können also von jedermann frei genutzt und kopiert werden, wenn nicht besondere Tatbestände vorliegen – wie im Geschäftsgeheimnisgesetz.
Haftungsfalle 1: Wer in Verträgen ein exklusives Nutzungsrecht verspricht und gemeinfreie KI-Ergebnisse abliefert, leistet mangelhaft. Developer sind gut beraten, die Entstehung von geistigem Eigentum durch wohldosierte KI-Verwendung abzusichern. Und durch AI Guidelines zu dokumentieren.
Haftungsfalle 2: Wenn die KI bereits existierende Werke (unbemerkt) reproduziert, kann der KI-Output Schutzrechte Dritter verletzen. Insbesondere bei homogenen Trainingsdaten kann das passieren. Zur Reduzierung dieses Risikos sind Schutzmaßnahmen zu überlegen, wie etwa der automatisierte Abgleich im Sinne einer Output-Control.
Aitava hilft Ihnen, KI-Ergebnisse effizient abzusichern und Haftungsfallen zu meiden. Wir verstehen uns als Enabler.