Le+AI+stanno+riempiendo+di+spazzatura+Internet+%7C+C%26%238217%3B%C3%A8+un%26%238217%3Bunica+soluzione+per+evitare+il+collasso
player
/tech/550318-ia-dilagano-ma-consumano-se-stesse.html/amp/
Tech

Le AI stanno riempiendo di spazzatura Internet | C’è un’unica soluzione per evitare il collasso

Inutili allarmismi a parte, nessuno può negare che l’Internet stia venendo letteralmente invaso dalle IA, dalle fake news fasulle generate automaticamente, alle SEO Heist che fanno spam di contenuti senza controllo. Insomma, l’idea di un Internet dominato dalle Intelligenze Artificiali non è solo una possibilità, ma ormai una realtà.

L’Uroboro delle IA, addestrate su contenuti generati

“Entra Spazzatura, Esce Spazzatura” probabilmente diventerà il motto dei Large Language Models

La grande diffusione dei contenuti generati da IA sta portando ad un problema che, in molti, non avrebbero potuto prevedere, legato alla stessa natura delle IA: per funzionare a dovere, i cosiddetti Large Language Models (o LLM in breve) vengono istruiti raccogliendo grandi masse di dati da Internet, in modo che questi possano essere elaborati e permettere agli LLM di imparare a produrne di nuovi. Mettendo da parte le ovvie implicazioni etiche di copiare, spesso senza alcun tipo di consenso, contenuti creati da artisti e scrittori; cosa succede se la gran parte dei contenuti su internet provengono già da IA?

Più i contenuti generati da Ia si diffondono su Internet, più è alta la probabilità che un LLM raccolga anche questi contenuti e li includa nel suo repertorio “educativo”, andando con ogni iterazione a “sporcare” sempre di più i risultati con dati-spazzatura, perdendo dunque in qualità, precisione e diversità dei contenuti generati.

Il crollo della qualità dei suddetti contenuti è però un fenomeno più subdolo e, come dimostrano recenti studi, la situazione potrebbe ancora peggiorare. In un recente studio della Johannes Gutenberg University di Magonza, in Germania, “Questi loop di addestramento di auto-consumo migliorano inizialmente sia la qualità che la diversità. Dopo però poche generazioni gli output inevitabilmente degenerano per diversità. Abbiamo determinato che il ritmo di degenerazione dipenda dalla proporzione tra dati reali e dati generati.”

Altre due ricerche accademiche pubblicate nel 2023 sull’argomento, concordano essenzialmente con quanto determinato dagli studiosi tedeschi: i ricercatori delle università di Oxford, Cambridge, dell’Imperial College di Londra, dell’Università di Toronto e di quella di Edimburgo affermano infatti che “l’uso di contenuti generati nel training dei modelli causa difetti irreversibili nei suddetti modelli”, causando il cosiddetto “collasso del modello”.

Forse però, non tutto è perduto. Nella battaglia tra le sempre più affamate IA, in cerca di nuovi contenuti creati da umani per evitare questa sorta di auto-cannibalismo digitale, ed i creativi umani che tentano di proteggere il loro lavoro, sembra che i secondi stiano facendo sempre maggiori passi avanti: a partire dalla denuncia del New York Times contro Microsoft e OpenAI, accusati di violazione di copyright, passando per gli innovativi tool come Nightshade, che promettono di “avvelenare” le IA se dovessero rubare le immagini trattate, l’idea è quella di rendere quanto più difficile possibile la vita alle IA. Possiamo immaginare, poi, che il “collasso dei modelli” possa portare ad una naturale diminuzione dell’uso stesso delle IA, quando il senso di novità sarà “concluso” e il pubblico non troverà più così tanto utile i contenuti dalla qualità così bassa.

This post was published on 30 Gennaio 2024 15:00

Gaetano Rilievo

Storyteller, Giocatore e appasionato di Forklore e Leggende, non mi sono più staccato dal mio PC dalla prima partita di Age of Mythology. Nel tempo libero adoro tirare dadi a venti facce, collezionare strani oggetti e ovviamente proseguire le infine run dei titoli che cadono sotto le mie grinfie.

Pubblicato da

Recent Posts

The Sims 4 si arricchisce con un kit che porterà i giocatori in fondo al mare… insieme a SpongeBob!

Una nuova espansione di The Sims 4 è stata presentata: ti permetterà di scendere in…

TikTok è finito ancora una volta nei guai: parte una indagine nazionale

Chi l'avrebbe mai detto che prima della fine dell'anno avremmo di nuovo parlato di TikTok…

Il gioco Italiano del momento non ha pace: dopo Steam è stato bannato anche da Epic Games e Humble Store (e questa situazione fa schifo)

Non finisce l'incubo di HORSES: dopo Steam, anche altre due importanti piattaforme bandiscono l'horror italiano...…

The Forsaken Hollows, il nuovo DLC di Nightreign è appena uscito e già in sconto insieme ai giochi della saga

Vuoi recuperare le avventure nell'universo di Elden Ring? DLC, spin-off ed espansioni del gioco sono…

Bomba iPad: costa meno oggi che durante il Black Friday, venduti 200 pezzi in una mattinata

Il momento perfetto per acquistare un iPad nuovo di zecca è finalmente arrivato: uno sconto…

Come vedere Zootropolis 2 in streaming comodamente a casa: tutte le info

Zootropolis 2 è uno dei sequel Disney più attesi e sta arrivando al cinema. Ma…