OpenAI apre le porte del nuovo DALL-E | Come accedere al nuovo generatore di immagini

il nuovo dall e3

Il mondo delle intelligenze artificiali è in continua espansione, ed è difficile alle volte sondare cosa stia cambiando, o quali nuovi sviluppi o aggiornamenti vengono divulgati al comune utente. OpenAI ha da brevissimo annunciato nuovi importanti sviluppi per l’IA di image generation proprietaria, DALL-E.

Cosa cambierà in DALL-E?

DALL-E 3 riesce a creare sempre scorci suggestivi

OpenAI ha deciso, negli ultimi giorni, di allargare finalmente il bacino di utenza per il suo ultimo generatore text-to-image. Sin da Giovedì scorso, l’azienda ha deciso di dare ai clienti ChatGPT Plus ed Enterprise l’accesso al nuovo modello DALL-E 3, utilizzabile all’interno della stessa app di ChatGPT. OpenAI dichiara infatti di aver preparato delle nuove misure di mitigazione della sicurezza che rendono il nuovo modello prossimo ad un rilascio generale.

DALL-E 3 era stato annunciato già circa un mese fa, e OpenAI aveva già mostrato in cosa il nuovo modello differiva dal predecessore DALL-E 2, arrivando anche a superare la vecchia versione in alcuni cruciali aspetti. Il nuovo modello utilizza ChatGPT per permettere agli utenti di scrivere prompt più lunghi e descrittivi visivamente, in modo da espandere la gamma di immagini generabili tramite DALL-E 3.

E non è tutto qui! Se volete provare con mano il nuovo DALL-E 3 niente paura, potete approfittare della collaborazione tra OpenAI e Microsoft. Il nuovo modello text-to-image è stato infatti aggiunto a Bing Chat e Bing Image Creator, rendendo la piattaforma Microsoft la prima ad introdurre il nuovo modello al grande pubblico, paradossalmente prima ancora di ChatGPT. 

DALL-E 3 sembra riudcire ad aderire quasi perfettamente ai prompt suggeriti.

C’è da dire che non è tutto oro quel che luccica. Le nuove “misure di sicurezza” potrebbero non essere al livello desiderato, visti i malfunzionamenti recenti della moderazione, che hanno visto utenti generare immagini in cui si vedevano personaggi tra i più disparati, da Spongebob a Kirby, pilotare un aereo in direzione del World Trade Center

Le controversie verso i generatori text-to-image come Midjourney, Stable Diffusion, e altre iterazioni di DALL-E non si sono effettivamente mai fermate: dalla poco etica pratica dello “scraping”, in cui i modelli IA vengono addestrati anche con immagini acquisite senza il consenso dei creatori, alla generazione di immagini molto poco piacevoli come nudi non consenzienti e rappresentazioni negative di figure pubbliche o particolari etnie. Recentemente anche l’impatto ambientale di addestrare e mantenere online un modello IA è diventato uno dei punti caldi di discussione sul futuro di questo tipo di tecnologie.

OpenAI ha promesso, in quest’ottica, di star prendendo molto sul serio l’abuso del suo modello DALL-E, e per questo sta preparando dei sistemi di sicurezza più stringenti, arrivando anche a rende pubblici, tramite un apposito sito, i dati di ricerca che hanno portato all’evoluzione di DALL-E. L’azienda afferma infatti che il nuovo sistema “limiterà la probabilità che il modello generi contenuto nello stile di artisti ancora in vita, immagini di figure pubbliche, e aiuterà a migliorare la rappresentazione demografica nelle immagini generate.” Infine, per aumentare il livello di trasparenza del modello IA, OpenAI ha creato un proprio “classificatore di provenienza” interno, che afferma sia capace di stimare al 99% della precisione se un’immagine sia stata effettivamente generata con DALL-E 3; resterà da vedere come questo classificatore potrà essere manipolato ed aggirato, come già accaduto a sistemi simili.