OpenAI ha lanciato il nuovo GPT Image 1.5, il nuovo modello AI per la generazione di immagini e per l’editing fotografico, pronto a sfidare Gemini Nano Banana

In Sintesi

GPT Image 1.5 è un modello AI per l’editing e la creazione di immagini in ChatGPT, nato per sfidare apertamente Gemini Nano Banana.

Per facilitare l’uso, OpenAI ha introdotto uno spazio dedicato con filtri e suggerimenti che rendono l’editing fotografico ancora più semplice e intuitivo.

L’editing fotografico è un sistema che richiede competenze tecniche avanzate, strumenti specializzati e un investimento significativo di tempo. Fin dai primi tentativi di fotoritocco digitale, dunque, la modifica delle foto è rimasta un’attività riservata a professionisti esperti.

Oggi, questo paradigma è destinato a cambiare radicalmente e con l’arrivo dell’intelligenza artificiale, modificare una foto è diventato molto più semplice. Tra le novità più interessanti, GPT Image 1.5 lanciato da OpenAI che, sfidando apertamente Gemini Nano Banana, sta lanciando nuove tecnologie di manipolazione dell’immagine che rendono il processo ancora più intuitivo.

Cosa può fare GPT Image 1.5

Uno degli elementi distintivi di GPT Image 1.5 è la sua architettura multimodale nativa. A differenza dei precedenti sistemi di OpenAI, basati su modelli separati per il testo e la generazione visiva, il nuovo modello elabora linguaggio e immagini all’interno della stessa rete neurale.

In questo approccio, parole e pixel vengono trattati come unità equivalenti di informazione (i cosiddetti token) che il sistema può interpretare e completare. Questo sistema consente l’applicazione di modifiche visive con maggiore coerenza, elaborando simultaneamente il contenuto semantico della richiesta e le caratteristiche dell’immagine di partenza.

In poche parole, GPT Image 1.5 permette agli utenti di interagire con una fotografia in modo iterativo e dialogico. È possibile chiedere la rimozione o l’aggiunta di elementi, la modifica di pose, prospettive e stili visivi, oppure l’adattamento dell’abbigliamento di una persona, mantenendo una continuità visiva anche attraverso più revisioni successive.

Per semplificare ulteriormente il processo di editing, OpenAI ha introdotto uno spazio dedicato alla creazione e modifica delle immagini, accessibile dalla barra laterale di ChatGPT. Qui sono disponibili filtri predefiniti e suggerimenti di prompt che offrono un ambiente più adatto alle esigenze dell’editing visivo che favorisce un utilizzo più strutturato delle funzionalità di generazione delle immagini.

I limiti del nuovo modello di OpenAI

Sul blog ufficiale, OpenAI ha riconosciuto che il modello presenta ancora limitazioni, in particolare nel supporto a determinati stili grafici e nella rappresentazione accurata di contenuti scientifici. L’azienda ritiene tuttavia che questi aspetti miglioreranno nel tempo, definendo il pretto come “ancora in fase iniziale” e aggiungendo che, in tempi ragionevolmente brevi, la generazione e l’editing di immagini diventeranno ancora più accurati e accessibili.

Tuttavia, non mancano dei dubbi su questa tecnologia e la continua riduzione delle barriere all’editing fotografico realistico potrebbe rendere strumenti del genere pericolosi veicoli di manipolazione visiva. Anche qui OpenAI ha confermato di aver inserito all’interno di GPT Image 1.5 tutta una serie di sistemi di sicurezza che, ad esempio, limitano la produzione di contenuti sessualmente espliciti e di tutto ciò che viene ritenuto inappropriato.

Al solito, bisognerà vedere l’effettiva efficacia di queste “restrizioni” e se questo modello di intelligenza artificiale sarà davvero in grado di garantire il livello di sicurezza promesso o meno.