In sintesi

L’app Gemini ora consente di generare video AI fornendo immagini di riferimento, riducendo la necessità di prompt lunghi e dettagliati.

Le immagini aiutano Veo a mantenere coerenza di personaggi e ambienti; l’aggiornamento arriverà a breve per gli utenti AI Plus, Pro e Ultra.

Fin dal suo debutto, Veo 3 ha stupito per la sua capacità di generare rapidamente video AI quasi indistinguibili da quelli veri. Era chiaro però che si trattava solo di un punto di partenza, e non certo di arrivo. Le tecnologie su cui si basa l’intelligenza artificiale continuano a migliorare, rendendo in questo caso specifico la creazione di video sempre più veloce ed efficiente. Lo dimostra il più recente aggiornamento introdotto da Google per l’app Gemini, che ha appunto l’obiettivo di implementare la generazione video con Veo a partire da immagini.

Qual è l’ultimo aggiornamento di Veo sull’app Gemini

Come accennato, la novità appena distribuita sull’app Gemini permette di creare video AI in modo più semplice. Nelle versioni precedenti era necessario inserire prompt lunghi e dettagliati, così da ottenere un risultato più soddisfacente e coerente dal punto di vista visivo.

All’utente veniva consigliato di scrivere una descrizione complessa e accurata: non “uno studio polveroso con una libreria”, ma piuttosto “uno studio con arredamento in legno classico ed elegante, e una parente occupata da una grande libreria colma di volumi antichi e polverosi. La stanza è in penombra e un raggio di luce filtra da una finestra socchiusa”.

Cosa cambia adesso? Invece di dilungarsi in queste descrizioni testuali dettagliate, l’utente può inserire alcune immagini che Veo deve usare come riferimento. Potrebbero essere immagini di oggetti, personaggi, stili creativi, ambientazioni… Il punto è che il modello AI può utilizzare questi “ingredienti” al posto delle descrizioni testuali complesse per generare il risultato richiesto.

Perché dare delle foto come riferimento creativo a Veo

Poter utilizzare le immagini invece delle descrizioni testuali ha alcuni vantaggi, come ha mostrato Google presentando questa novità. Ad esempio, se viene fornita a Veo la fotografia di un certo personaggio, per il modello AI è più semplice inserirlo in un’ambientazione mantenendolo sempre ben riconoscibile, ovvero facendo in modo che per tutta la durata del video restino invariati i tratti del volto o l’aspetto fisico in generale.

Allo stesso modo, fornire al modello l’immagine-riferimento di una certa ambientazione aiuta Veo a mantenere questo sfondo coerente dal punto di vista visivo per tutta la durata del video. Combinando prompt testuali e “ingredienti visivi”, la creazione di video AI diventa in definitiva più snella, efficace e semplice.

Facendo un altro esempio, si potrebbe descrivere testualmente l’ambientazione desiderata e fornire immagini da tenere come riferimento per creare il protagonista della scena e per impostare lo stile giusto (illuminazione dell’ambiente, texture, scala colori, ecc.).

Come utilizzare gli aggiornamenti di Veo sull’app Gemini

La novità si inserisce in un più ampio aggiornamento delle funzioni di Veo. La versione 3.1 infatti aveva già introdotto nuove funzionalità, tra cui una migliore gestione di luci, ombre e audio sempre allo scopo di generare video AI ancora più realistici.

L’aggiornamento di Veo sull’app Gemini è attualmente in fase di rollout e sarà disponibile nel corso delle prossime settimane per gli iscritti ai piani Google AI Plus, Pro e Ultra.