Provocările industriei AI în contextul dreptului de autor
Industria AI se confruntă cu o problemă semnificativă legată de datele utilizate pentru antrenarea modelelor, în special după acordul de 1,5 miliarde de dolari încheiat de Anthropic pentru drepturi de autor. Există aproximativ 40 de cazuri pendinte care solicită despăgubiri pentru utilizarea neautorizată a datelor, inclusiv un proces împotriva Midjourney pentru crearea de imagini cu Superman.
Introducerea sistemului de licențiere RSL
Fără un sistem de licențiere, companiile de AI riscă să se confrunte cu un val de procese pentru drepturi de autor, ceea ce ar putea afecta negativ industria. În acest context, un grup de tehnologi și editori web a lansat un sistem numit Real Simple Licensing (RSL), care ar putea permite licențierea datelor la scară largă, cu sprijinul unor mari publicații precum Reddit, Quora și Yahoo.
Obiectivele RSL
Eckart Walther, co-fondator al RSL și co-creator al standardului RSS, a declarat că scopul este crearea unui sistem de licențiere a datelor de antrenare care să funcționeze pe internet. „Trebuie să avem acorduri de licențiere lizibile de mașini pentru internet”, a spus Walther. RSL reprezintă prima încercare de a stabili o infrastructură tehnică și legală care să faciliteze acest lucru.
Aspectele tehnice și legale ale RSL
Din punct de vedere tehnic, Protocolul RSL stabilește termeni specifici de licențiere pe care un editor îi poate stabili pentru conținutul său. Participanții vor include termenii în fișierul „robots.txt” într-un format predefinit, facilitând identificarea datelor care se supun anumitor termeni. Legal, RSL a creat o organizație de licențiere colectivă, RSL Collective, care va negocia termenii și va colecta redevențe, similar cu ASCAP pentru muzicieni sau MPLC pentru filme.
Participanți și colaborări
Printre editorii web care au aderat la colectiv se numără Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis și altele. De asemenea, companii precum Fastly, Quora și Adweek susțin standardul, chiar dacă nu fac parte din colectiv.
Provocări în determinarea redevențelor
Una dintre provocările majore este determinarea momentului în care trebuie plătite redevențele pentru un anumit set de date utilizate în antrenarea modelelor AI. Spre deosebire de muzică, unde este simplu de urmărit utilizarea, modelele AI ridică dificultăți unice. Aceasta este mai ușor de realizat pentru produse precum Google’s AI Search Abstracts, care utilizează date în timp real și mențin o atribuire strictă pentru fiecare fapt.
Perspectivele de viitor pentru RSL
RSL își propune să rezolve aceste probleme, iar co-fondatorul Doug Leeds consideră că companiile AI vor reuși să gestioneze dificultățile. „Nu trebuie să fie perfect. Trebuie doar să fie suficient de bun pentru a obține plăți pentru toți”, a afirmat acesta.
Adopția sistemului de licențiere
Întrebarea principală rămâne dacă companiile AI vor adopta acest sistem. Deși există companii care plătesc pentru date, web-ul a fost văzut tradițional ca o sursă de date ieftine. Cu seturi de date precum Common Crawl deja disponibile, va fi o provocare să se obțină redevențe din date pe care laboratoarele sunt obișnuite să le acceseze gratuit.
Concluzie
Implementarea sistemului RSL ar putea marca un pas crucial în reglementarea utilizării datelor în industria AI, oferind un cadru clar pentru licențiere și protecția drepturilor de autor, esențial pentru viitorul sustenabil al sectorului.