Finalmente "leggibili": le immagini di ChatGPT fanno un salto di qualità
Da OpenAI arriva Images 2.0, un nuovo modello ChatGPT che migliora la leggibilità del testo nelle immagini e crea contenuti più coerenti e complessi
Crei un’immagine con l’intelligenza artificiale e le scritte sopra riportate sono tutte confuse, incomprensibili. Per fortuna da oggi cambia tutto: OpenAI, l’azienda creatrice del chatbot, ha rilasciato un nuovo modello per ChatGPT, Images 2.0, progettato proprio per migliorare la resa del testo all’interno delle immagini.
Vediamo come funziona ora l’AI con il nuovo modello, come usarlo e quando sarà disponibile.
- Come funziona ora ChatGPT con le immagini?
- Cosa si può fare con Images 2.0
- Alcuni esempi con il nuovo modello
- Quando sarà disponibile
Come funziona ora ChatGPT con le immagini?
Solo due anni fa non era possibile utilizzare modelli di immagini con scritte totalmente corrette. Il più delle volte anzi occorreva modificare manualmente il risultato, usando programmi di editing appositi, anche a pagamento.
Oggi la situazione cambia del tutto con ChatGPT Images 2.0. Un modello dotato di “capacità di pensiero”, a detta della stessa OpenAI, e dunque di saper svolgere ricerche sul web, generare più immagini a partire da un singolo prompt e soprattutto rivedere e correggere autonomamente i propri output.
Tutte migliorie che permettono all’AI di produrre contenuti visivi più strutturati e utilizzabili, come materiali di marketing in formati diversi o fumetti articolati su più vignette, mantenendo una maggiore coerenza tra testo e immagine. Inoltre, precisa la società, il modello ha una comprensione più accurata del rendering di lingue con caratteri non latini, come giapponese, coreano, hindi e bengalese.
Secondo quanto riportato da TechCrunch, resta però una limitazione importante: i dati di addestramento del modello si fermano a dicembre 2025. Il che potrebbe influire sulla precisione delle risposte e sulla capacità del sistema di rappresentare correttamente eventi o riferimenti molto recenti.
Cosa si può fare con Images 2.0
Praticamente più di quanto si poteva prima. Grazie alla capacità di attingere a informazioni online e di integrarle in modo coerente con il prompt, ChatGPT Images 2.0 permette oggi di realizzare immagini molto più complesse e strutturate rispetto a prima.
Si possono così creare materiali visivi adatti a contesti estremamente diversi: dai dépliant per campagne di marketing ai fumetti articolati su più vignette, passando per tabelloni informativi e infografiche.
In pratica, il modello si dimostra particolarmente efficace nel gestire elementi che in passato risultavano critici per le AI generative: testo di piccole dimensioni, icone, componenti tipiche delle interfacce utente, composizioni dense e vincoli stilistici molto precisi. Il tutto con una qualità che può arrivare fino alla risoluzione 2K, secondo quanto dichiarato dalla stessa OpenAI.
Alcuni esempi con il nuovo modello
Vediamo come funziona il nuovo modello con qualche esempio, tipo un’infografica sull’evoluzione dell’intelligenza artificiale negli ultimi anni.
Per valutare tutte le sue funzionalità (reazione di immagini, testo e ricerca online), abbiamo provato con un prompt molto semplice: Crea un’infografica che racconta in modo sintetico l’evoluzione dei modelli IA negli ultimi 5 anni, con tanto di date di pubblicazione.
Qui il risultato:

Non mancano gli errori di tipo concettuale (le date in particolare), e nel complesso il testo è abbastanza semplificato ma ha senso vista la necessità di sintetizzare diversi aspetti di ogni modello.
Riproviamo con lo stesso prompt. Ecco il nuovo output da ChatGPT:
Un po’ più elaborato, e grazie allo spazio extra dovuto dal formato verticale ChatGPT ha aggiunto altri dettagli nell’infografica. Decisamente un risultato migliore rispetto a prima.
Quando sarà disponibile
Tutti gli utenti di ChatGPT e Codex potranno accedere a Images 2.0 già da ieri martedì 21 aprile. Come in altri casi, gli utenti a pagamento avranno la possibilità di generare output più avanzati.
OpenAI metterà inoltre a disposizione l’API gpt-image-2, con un modello di pricing variabile in base alla qualità e alla risoluzione delle immagini prodotte.
FAQ
È il nuovo modello di OpenAI pensato per migliorare la resa del testo nelle immagini, correggere autonomamente gli output e produrre immagini più coerenti.
Gestisce ancora meglio testi piccoli, icone e composizioni dense, inoltre offre maggiore coerenza tra testo e immagine, nonché un supporto migliore per le lingue non latine.
Dépliant, fumetti su più vignette, infografiche e materiali marketing con layout complessi e vincoli stilistici precisi.
Gli utenti di ChatGPT e Codex possono accedervi dal 21 aprile; OpenAI offrirà anche l'API gpt-image-2 con pricing variabile.




















