Google sta compiendo gli stessi errori di OpenAi: citata in giudizio per furto di dati con Bard

nuova denuncia contro google bard

Uno studio legale californiano ha intentato una class action contro Google per aver “segretamente rubato” grandi quantità di dati dal web

Da quando le IA più sviluppate hanno fatto capolino nella vita di tutti i giorni, in particolare con l’esplosione mediatica di ChatGPT, la domanda principale che si pongono i principali Paesi al mondo è una soltanto: siamo sicuri sia legale?

Dalle violazioni della privacy al rischio per la proprietà intellettuale sono tanti gli aspetti che potrebbero destare preoccupazione. Problemi che avevano portato il Garante della Privacy italiano a chiudere il bot di OpenAI per oltre un mese. Eppure, non è solo in Italia che vengono sollevate queste perplessità.

Gli avvocati contro Google

Lo studio legale Clarkson cita in giudizio il gigante tecnologico per negligenza, violazione della privacy, furto, violazione del copyright e profitto da dati personali ottenuti illegalmente.

logo di google bard su uno smartphone

Google ha preso tutte le nostre informazioni personali e professionali, i nostri lavori creativi e scritti in copia, le nostre fotografie e persino le nostre e-mail – praticamente la totalità della nostra impronta digitale – e le sta usando per costruire prodotti commerciali di intelligenza artificiale (AI) come “Bard” Si legge nella denuncia, depositata l’11 luglio nel Distretto settentrionale della California.

L’azione legale arriva dopo che la scorsa settimana Google ha silenziosamente aggiornato la sua politica sulla privacy, affermando che qualsiasi informazione pubblica può essere utilizzata per addestrare i suoi prodotti di intelligenza artificiale come Bard.

Liberi di rubare?

Google sta essenzialmente affermando che tutto ciò che viene pubblicato sul web è lecito, ma lo studio legale ritiene che si tratti di una massiccia violazione della privacy, in quanto i dati vengono prelevati senza compenso o consenso per l’esplicito scopo di addestrare i modelli di intelligenza artificiale.

La causa sostiene che Google, un’azienda multimiliardaria con oltre un miliardo di utenti in tutto il mondo, sta mettendo gli utenti in una posizione “insostenibile”:

O usare Internet e consegnare tutte le vostre informazioni personali e protette da copyright agli insaziabili modelli di IA di Google – o evitare completamente Internet

Logo sede Google

In una dichiarazione rilasciata a Reuters, il consigliere generale di Google Halimah DeLaine Prado ha definito le accuse “prive di fondamento”, affermando che “utilizziamo dati provenienti da fonti pubbliche – come le informazioni pubblicate sul web aperto e i set di dati pubblici – per addestrare i modelli di intelligenza artificiale alla base di servizi come Google Translate, in modo responsabile e in linea con i nostri principi di intelligenza artificiale“.

Ci sono i precedenti

Recentemente, Clarkson ha intentato un’azione legale collettiva simile contro OpenAI, la società che ha creato ChatGPT, per “furto e appropriazione indebita di dati personali”, utilizzando lo stesso tipo di operazione di data-scraping. I modelli linguistici di grandi dimensioni necessitano di enormi quantità di dati per addestrare i chatbot AI e renderli conversativi e intelligenti. Sia Bard che ChatGPT si basano su modelli linguistici di grandi dimensioni per funzionare, il che ha sollevato preoccupazioni sull’uso di dati privati e sulla violazione del copyright.

La causa più recente afferma che Google si è appropriata di serie di dati come Common Crawl, un’organizzazione senza scopo di lucro che rende i suoi dati gratuiti per scopi di ricerca e istruzione, nonché di dati provenienti da siti come Medium e Kickstarter. Google utilizza anche i propri dati provenienti da Gmail e Google Search per alimentare i propri modelli. Tra gli altri dati raccolti vi sono opere protette da copyright, come gli e-book delle biblioteche digitali e persino i siti web di pirateria, che l’azienda utilizza senza risarcire artisti e autori.

La chiave della causa di Clarkson è la questione del pubblico dominio. Ma “disponibile al pubblico” non ha mai significato libero utilizzo per qualsiasi scopo”, si legge nella denuncia. Sì, alcuni dati sono disponibili per l’acquisto, ma dipende dal contesto di utilizzo e dal consenso degli utenti. Sì, gli utenti acconsentono alle politiche sulla privacy quando pubblicano contenuti sul web, ma hanno il diritto di sapere se vengono utilizzati altrove.

In altre parole, Clarkson afferma: “Google deve capire, una volta per tutte: non possiede Internet”.