Apple, Nvidia şi alte companii au folosit transcrierile clipurilor de pe YouTube, fără permisiune, pentru a-şi antrena sistemele de inteligenţă artificială, arată o investigaţie, citată de News.ro.
Mai multe mari companii care dezvoltă tehnologii AI, printre care Apple, Nvidia şi Anthropic, şi-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube, conform investigaţiei realizate de Proof News.
Companiile au ajuns în posesia datelor prin intermediul unui nonprofit, numit EleutherAI, care a preluat transcrierile a peste 48.000 de canale de YouTube.
Asta s-a întâmplat fără a avea vreun fel de permisiune din partea creatorilor de conţinut şi fără a-i compensa pe aceştia în vreun fel.
Setul de date folosit de aceste companii nu conţine imagini sau filmările propriu-zise, dar include transcrierile şi subtitrările clipurilor postate de unii dintre cei mai importanţi creatori, precum Marques Brownlee şi MrBeast.
Companiile de IA evită să fie transparente în privinţa datelor pe care le folosesc pentru a-şi antrena modelele lingvistice. Unele dintre acestea, însă, recunosc tacit că preiau toate textele pe care le găsesc gratuit pe internet.
În plus, proprietarii textelor nu sunt compensaţi în niciun fel, cu excepţia câtorva înţelegeri făcute cu unele dintre marile publicaţii americane.