Cum fură Meta și OpenAI de la comedianți, ca să-și antreneze modelele de limbaj AI: cum se revoltă artiștii

de: Ozana Mazilu
11 07. 2023

Sarah Silverman dă în judecată OpenAI și Meta pentru încălcarea drepturilor de autor. Comedianta susține că companiile nu i-au obținut consimțământul înainte de a-i folosi munca pentru a-și instrui LLM-urile.

Comedianta și autoarea Sarah Silverman, alături de Christopher Golden și Richard Kadrey, au depus niște plângeri împotriva OpenAI și Meta, conform Gizmodo. Grupul susține că firmele și-au instruit modelele lingvistice mari pe materiale protejate prin drepturi de autor, inclusiv lucrări pe care le-au publicat, fără a obține consimțământul.

Meta și OpenAI trebuie să dea socoteală în instanță

Plângerile se concentrează pe seturile de date OpenAI și Meta despre care se presupune că le-au folosit pentru a instrui ChatGPT și LLaMA. În cazul OpenAI, în timp ce setul de date „Books1” se conformează aproximativ cu dimensiunea Proiectului Gutenberg – un binecunoscut depozit de cărți fără drepturi de autor – avocații reclamanților susțin că setul de date „Books2” este prea mare pentru a fi derivat din orice altă parte, decât așa-numitele „biblioteci în umbră” de materiale protejate prin drepturi de autor disponibile ilegal, cum ar fi Library Genesis și Sci-Hub.

„Pirații” pot accesa aceste materiale prin descărcări directe, dar poate mai util pentru cei care generează modele de limbaj mari, multe biblioteci din umbră făcând și material scris disponibil în pachete torrent. Procesul lui Silverman implică un schimb între avocații comediantei și ChatGPT. Echipa juridică a lui Silverman a cerut chatbot-ului să rezume The Bedwetter, un memoriu pe care l-a publicat în 2010. Chatbot-ul nu numai că a reușit să schițeze părți întregi ale cărții, dar unele pasaje pe care le-a transmis par să fi fost reproduse textual.

Silverman, Golden și Kadrey nu sunt primii autori care dau în judecată OpenAI pentru încălcarea drepturilor de autor. De fapt, compania se confruntă cu o serie de provocări legale, cu privire la modul în care a procedat la instruirea ChatGPT. Numai în iunie, compania a primit două plângeri separate. Una este o acțiune colectivă amplă care susține că OpenAI a încălcat legile federale și de stat privind confidențialitatea, prin eliminarea datelor pentru a instrui modelele mari de limbaj, din spatele ChatGPT și DALL-E.