Cum se antrenează ChatGPT și DALL-E, de fapt. Ce susține OpenAI, compania „mamă”
New York Times susține că i s-ar fi folosit conținutul în timpul minițiosului proces de antrenare al ChatGPT, de la OpenAI.
Vezi și: Schimbarea de la ChatGPT care îți face viața mai ușoară. Ce este nou la cel mai popular serviciu AI
Cum explică OpenAI
OpenAI și unul dintre cei mai importanți investitori ai săi, Microsoft, au fost numiți pârâți în proces, iar OpenAI a ripostat.
Conform raportului The Guardian, într-o submisie către Comitetul pentru Comunicare și Selectare Digitală al Camerei Lorzilor, OpenAI susține că este imposibil să antrenezi un model de AI fără a folosi conținut protejat de drepturi de autor.
„Noi credem că instrumentele de AI sunt la ele acasă atunci când încorporează și reprezintă întreaga diversitate și amploare a inteligenței și experienței umane.
Pentru a face acest lucru, tehnologiile de AI actuale necesită o cantitate mare de date de antrenament și computație, deoarece modelele analizează și învață modele și concepte care rezultă din trilioane de cuvinte și imagini.
Modelele mari de limbaj ale OpenAI, inclusiv modelele care alimentează ChatGPT, sunt dezvoltate folosind trei surse principale de date de antrenament.
(1) informații disponibile public pe internet, (2) informații pe care le licențiem de la terțe părți și (3) informații pe care utilizatorii noștri sau trainerii noștri umani le furnizează.
Deoarece drepturile de autor acoperă astăzi practic orice fel de expresie umană – inclusiv postări de blog, fotografii, postări pe forum, bucăți de cod software și documente guvernamentale – ar fi imposibil să antrenăm modelele de AI de top ale zilelor noastre fără a folosi materiale protejate de drepturi de autor.
Limitarea datelor de antrenament la cărți și desene din domeniul public create acum mai bine de un secol ar putea genera un experiment interesant, dar nu ar oferi sisteme de AI care să satisfacă nevoile cetățenilor de astăzi”, se arată în comunicatul OpenAI.
ChatGPT și DALL-E, sub lupa instanței
OpenAI a publicat inclusiv un articol ca răspuns la acțiunea în instanță a New York Times, afirmând că acțiunea în instanță este fără temei.
„Chiar dacă nu suntem de acord cu afirmațiile din acțiunea în instanță a New York Times, o vedem ca pe o oportunitate de a clarifica afacerea noastră, intenția noastră și modul în care ne construim tehnologia”, explică compania de tehnologie AI.
„Cu toate acestea, dreptul legal este mai puțin important pentru noi decât să fim cetățeni responsabili. Am condus industria de AI în oferirea unui proces simplu de renunțare pentru editori (pe care The New York Times l-a adoptat în august 2023) pentru a împiedica instrumentele noastre să acceseze site-urile lor”, continuă OpenAI.