Attivo nel mondo dell’editoria sin dal 2011, giornalista dal 2019, ha lavorato per il web e per la carta stampata occupandosi di musica, cultura, lifestyle e tecnologia.

Google

In Sintesi

Gemini di Google si aggiorna con un nuovo modello AI per le immagini, chiamato Gemini 2.5 Flash Image.

Il tool consente agli utenti di modificare facilmente le immagini tramite prompt testuali scritti con linguaggio naturale.

Google sta aggiornando Gemini con una novità significativa: un nuovo modello di intelligenza artificiale dedicato alle immagini, chiamato Gemini 2.5 Flash Image. Una novità interessante, che rappresenta anche una mossa strategica per l’azienda di Mountain View che gli consente di competere con altri strumenti AI per l’editing di immagini, come quelli di OpenAI ad esempio.

Cosa sappiamo di Gemini 2.5 Flash Image

Il modello Gemini 2.5 Flash Image è progettato per modificare le immagini permettendo all’utente di utilizzare solo istruzioni in linguaggio naturale. Inoltre, a differenza di molti strumenti concorrenti, che spesso producono risultati “distorti” o poco accurati, il nuovo modello di Big G eccelle nel mantenere la coerenza di volti, animali e altri dettagli.

Il tool ha già destato attenzione del grande pubblico e degli addetti ai lavori, facendo la sua comparsa sulla piattaforma di valutazione crowdsourcing LMArena con lo pseudonimo “nano-banana“, ottenendo parecchie critiche positive

Non è un segreto che il settore degli editor di immagini basati sull’intelligenza artificiale è diventato un “terreno di gioco” cruciale per le grandi aziende tecnologiche e l’introduzione del generatore di immagini nativo di GPT-4o da parte di OpenAI, ad esempio, ha portato a un’enorme crescita nell’utilizzo di ChatGPT.

Per competere con l’azienda di Sam Altman, anche Meta ha annunciato una partnership con la startup Midjourney per integrare i suoi modelli di intelligenza artificiale.

E per competere con la concorrenza Google non poteva essere da meno, puntando tutto su Gemini 2.5 Flash Image che porta a bordo di Gemini funzionalità avanzate che possano colmare il divario con gli altri attori del settore e conquistare gli utenti.

Per questo motivo il nuovo tool per l’editing AI è stato progettato appositamente per casi d’uso consumer, garantendo ai consumatori un modello con una “conoscenza del mondo” superiore, che permetta loro di combinare più riferimenti in un unico prompt per creare un rendering coerente e di qualità

Considerando le passate difficoltà con i suoi generatori di immagini, che avevano prodotto contenuti storicamente inaccurati, lato sicurezza, Google ha implementato nuove misure di sicurezza per limitare ciò che gli utenti possono creare.

L’azienda di Mountain View afferma di aver trovato un equilibrio migliore, garantendo agli utenti il controllo creativo pur vietando la generazione di immagini inappropriate o esplicite, al contrario di altri concorrenti come Grok di xAI.

Oltre a questo è importante ricordare che Google applica filigrane visive e identificatori nei metadati per aiutare a distinguere le immagini generate dall’intelligenza artificiale.

Quando arriva Gemini 2.5 Flash Image

Gemini 2.5 Flash Image è già disponibile sia per gli sviluppatori che per gli utenti comuni.

Lato sviluppatori, questi possono utilizzare il tool tramite API di Gemini, Google AI Studio e Vertex AI, al costo di 0,039 dollari per immagine generata. Per gli utenti consumer, invece,, il modello è disponibile gratuitamente tramite Gemini.