Der Streit zwischen Innovation und geistigem Eigentum entbrennt erneut, wobei Apple im Mittelpunkt der Aufmerksamkeit steht: Zwei Autoren behaupten, das Unternehmen trainierte einen Teil seiner KI mit Büchern aus PiratenbibliothekenDie Kontroverse weist direkt darauf hin, wie Daten in großen Sprachmodellen gesammelt und verwendet werden.
In dem Fall, der vor einem Bundesgericht in Kalifornien eingereicht wurde, wird argumentiert, dass Trainingsdatensätze ohne Genehmigung oder Entschädigung. Die Autoren behaupten, dass dieses Material zur Verbesserung der mit Apple Intelligence und den vom Unternehmen veröffentlichten Modellen verbundenen Funktionen beigetragen hätte.
Was wird Apple vorgeworfen?

In der von den Schriftstellern Grady Hendrix und Jennifer Roberson eingereichten Klage wird behauptet, dass Apple kopierte und verwendete urheberrechtlich geschützte Bücher Nicht lizenziert um ihre Systeme zu optimieren. Sie fordern, den Fall als Sammelklage zuzulassen, um weiteren Autoren die Möglichkeit zu geben, sich mit ähnlichen Klagen anzuschließen.
Dem Dokument zufolge hätte sich das Unternehmen auf Materialien verlassen, die seine Sprachmodelle speisen, einschließlich Varianten des OpenELM-Projekts, die generiert hätten ein technologischer und kommerzieller Vorteil aus geschützten Werken ohne Zustimmung ihrer Eigentümer.
Die Kläger behaupten, dass ihre Titel in den fraglichen Datensätzen vorkommen und dass Apple Er hat weder um Erlaubnis gebeten noch eine Entschädigung angeboten, obwohl die Nutzung dieser Werke zur Leistung der KI-Systeme des Unternehmens beigetragen hätte.
Books3, RedPajama und die sogenannten Schattenbibliotheken
Einer der Dreh- und Angelpunkte des Falles ist Books3, eine Gruppe, die digitalisierte Bücher zusammenstellt, die laut Anklage aus Schattenbibliotheken o nicht autorisierte BibliothekenDie Beschwerde verknüpft dieses Material mit Daten, die zum Trainieren von Modellen verwendet werden, die mit Apple in Verbindung stehen.
Das Dokument verweist auch auf die Tatsache, dass die technischen Berichte des Unternehmens Quellen zitieren wie Roter Pyjama, ein Projekt, das wiederum Books3 zu seinen Quellen zählt. Basierend auf dieser Kette behaupten die Autoren, dass ihre Arbeiten in das Training der Modelle eingeflossen sind.
Für Autoren ist diese angebliche Verwendung von Raubkopien untergräbt Kontrolle und wirtschaftlichen Wert seiner Kreationen und stärkt gleichzeitig Technologien, die dann als branchenspezifische Fortschritte präsentiert werden.
Was die Kläger fordern
Neben der Zertifizierung als kollektive Maßnahme fordern die Autoren Rechts- und Schadensersatzsowie die Rückerstattung aller Vorteile, die aus einer nicht autorisierten Nutzung ihrer Werke gezogen wurden.
Die Klage fordert außerdem, weitreichende Vorsorgemaßnahmen, einschließlich der Vernichtung von Modellen und Trainingssätzen, die die Bücher der Klägerklasse enthalten, unter Berufung auf 17 USC §503(b), zusammen mit dem Verbot ähnlichen Verhaltens in der Zukunft.
Stand des Verfahrens und mögliche Auswirkungen
Der Fall wird im Northern District of California bearbeitet und derzeit hat keine öffentlichen Kommentare abgegeben Die Kläger, Einwohner von New York und Arizona, bestehen hinsichtlich der Vorwürfe darauf, dass ihre Werke in den zitierten Datensätzen enthalten seien.
Wenn die Resolution erfolgreich ist, könnte sie die Branche dazu bewegen, Vereinbarung von Lizenzen, Vergütungen oder einem höheren Maß an Transparenz auf die Daten, die beim KI-Training verwendet werden. Parallel dazu wird die rechtliche Debatte über die Grenzen der angemessenen Nutzung weiterhin entscheidend sein, um das Ausmaß der Ausnahme bei Trainingsmodellen zu bestimmen.
Angesichts der aktuellen Lage liegt der Fokus auf der Frage, ob das Gericht den Zusammenhang zwischen Bücher3, Apple-Modelle und die Werke der Autoren; und gegebenenfalls, welche Abhilfemaßnahmen sie vorsieht. Das Ergebnis wird die Beziehung zwischen Entwicklern und großen Technologieplattformen im Bereich der Ausbildung im Bereich künstliche Intelligenz bestimmen.