EN

Az Anthropic több tízmillió dollárt költött egyedi könyvadatbázis összeállítására a Claude AI betanításához

Az Anthropic több tízmillió dollárt költött egyedi könyvadatbázis összeállítására a Claude AI betanításához
Source: Getty Images For Unsplash+

Az Anthropic saját bevallása szerint több tízmillió dollárt fordított egy egyedi, szkennelt könyvekből álló adatbázis létrehozására, amelyet a Claude AI betanításához használt fel. A Bartz kontra Anthropic ügyben folyó jogi eljárás során 2025. június 9-én derült fény arra, hogy az Anthropic egy olyan tulajdonosi összetételű könyvgyűjteményt hozott létre, amelyet saját maga gyűjtött, szkennelt és állított össze – ez a gyűjtemény a vállalat állítása szerint egyetlen más AI cégnél sem érhető el a világon.

Az ügy hátterében az áll, hogy miközben William Alsup bíró a 2025. június 23-i ítéletében a méltányos használat (fair use) kérdésében részben az Anthropic javára döntött, élesen elkülönítette a könyvek AI betanítási célú felhasználását azok beszerzési és tárolási módjától. Alsup bíró rendkívül transzformatívnak minősítette a könyvek LLM betanítási célú felhasználását, ugyanakkor elutasította az Anthropic azon védelmét, miszerint méltányos használat lenne a több mint hétmillió kalóz könyv beszerzése és hosszú távú tárolása. A bíróság különbséget tett a jogszerűen vásárolt, majd digitalizált könyvek között – amit méltányos használatnak ítélt –, és a kalózoldalakról letöltött könyvek között, amely utóbbit egyértelműen jogsértőnek minősített.

A Bartz kontra Anthropic ügy precedensértékű lehet az AI szerzői jog területén, hiszen keretet adhat arra vonatkozóan, hogy a bírák, szabályozók és vállalatok hogyan közelítsék meg a szerzői jogi megfelelést ezen a gyorsan fejlődő területen. Bár Alsup bíró döntése nem kötelező érvényű Kalifornia Északi Kerületén kívül, hatással lehet más, hasonló ügyekre, például a New York-i Déli Kerületben konszolidált, OpenAI elleni perekre. A döntés egyértelművé teszi, hogy a szerzői jogilag védett művek megszerzési és kezelési módja legalább olyan fontos, mint azok végső felhasználása.

Források:

1.

Bartz v. Anthropic parties fight over production of datasets spreadsheet and books dataset outside of inspection environment. Anthropic reveals it spent tens of millions of dollars to compile its own scanned books dataset.
As Judge Alsup is deliberating over Anthropic’s motion for summary judgment on fair use, the parties continue to fight over discovery. One of the more fascinating discovery disputes relates t…

2.

Bartz v. Anthropic: Early Look at Copyright Claims and Generative AI | JD Supra
On June 23, 2025, Senior Judge William Alsup of the Northern District of California issued a highly anticipated summary judgment opinion in Bartz v.…

3.

Landmark Ruling on AI Copyright: Fair Use vs. Infringement in Bartz v. Anthropic | ArentFox Schiff
In one of the first substantive decisions analyzing whether the use of copyrighted works to train large language models (LLMs) for generative artificial intelligence (AI) services is infringing or a fair use, Judge William Alsup issued a split decision in his summary judgment order. See Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417 (N.D. Cal. Aug 19, 2024).