Som The New York Times tidigare rapporterat står Meta inför en grupptalan väckt av fem stora bokförlag och en författare för påståenden om att företaget ”engagerade i ett av de största upphovsrättsbrotten i historien” när de tränade sin Llama AI-modell. McMillan, McGraw-Hill, Elsevier, Hachette, Cengage och författaren Scott Turow hävdar i sin rättegång att Meta ”upprepade gånger kopierat” deras böcker och tidskriftsartiklar utan deras tillåtelse.
Stämningen anklagar Meta för att avsiktligt rippa upphovsrättsskyddade verk från ”ökända piratsidor” som LibGen, Anna’s Archive, Sci-Hub och Sci-Mag och mata in det materialet i sina AI-modeller. Den hävdar också att Meta tränade Llama med hjälp av information i Common Crawl-datauppsättningen, som sägs vara ”fylld med obehöriga kopior av upphovsrättsskyddade verk.” Som ett resultat av detta, ”matar Llama ut ordagrant, eller nästan ordagrant, ersätter” för upphovsrättsskyddat material.
Till exempel, när den presenteras med två korta meningar från den 9:e upplagan av Cengages bästsäljande lärobok Calculus: Early Transcendentals av James Stewart, börjar lamaen reproducera resten av avsnittet ord för ord.
En grupp författare stämde också Anthropic för upphovsrättsintrång. En federal domare har beslutat att utbildning av en AI-modell med lagligt köpta böcker utan tillstånd anses vara rimlig användning, men har tillåtit Anthropic att gå vidare med en grupptalan mot författare över ”miljoner” av påstådda piratkopierade titlar. Förra året gick Anthropic med på att betala skribenter 1,5 miljarder dollar i en grupptalan.
Turow och en grupp förläggare stämmer Meta på skadestånd och ber domstolen att beordra den att stoppa dess påstådda olagliga verksamhet. De ber också domstolen att kräva att företaget tillhandahåller en lista över böcker, tidningsartiklar och andra verk som används för att träna Llama AI-modellen.
”AI driver radikal innovation, produktivitet och kreativitet för individer och företag, och domstolar har med rätta funnit att träning av AI med upphovsrättsskyddat material kan utgöra skälig användning”, sa Metas talesperson Dave Arnold i ett e-postmeddelande till The Verge. ”Vi kommer kraftfullt att bekämpa denna rättegång.”
