Libero
SMART EVOLUTION

Google presenta Gemini 2.5 Computer Use: l'AI naviga online come un umano

Google presenta Gemini 2.5 Computer Use, un nuovo modello AI in grado di navigare come un essere umano, interagendo in modo completo con il web

Pubblicato:

gemini-computer-use Google

In sintesi

  • Google presenta Gemini 2.5 Computer Use, un nuovo modello di intelligenza artificiale capace di navigare autonomamente sul web e interagire con i siti come farebbe un utente umano, senza ricorrere ad API.
  • Disponibile in anteprima su Google AI Studio e Vertex AI, il modello rappresenta un passo decisivo verso agenti AI sempre più autonomi, in grado di operare online in modo completo e naturale.

Google rafforza ancora il suo ecosistema di funzioni legate all’utilizzo dell’intelligenza artificiale. L’azienda ha presentato Gemini 2.5 Computer Use, un nuovo modello AI in grado di navigare in rete in autonomia, andando anche a interagire con i siti web.

Si tratta di un’aggiunta molto importante per la gamma di servizi AI di Google, soprattutto nell’ottica di sviluppare agenti AI capaci di muoversi in ambienti digitali realizzati per essere utilizzati da essere umani.

In sostanza, Gemini 2.5 Computer Use punta a replicare il comportamento di utente umano durante la navigazione web, senza la necessità di ricorrere ad API. Andiamo a scoprire tutti i dettagli in merito.

Google presenta un modello AI rivoluzionario

Per il suo funzionamento, Gemini 2.5 Computer Use utilizza una serie di capacità avanzate come la comprensione visiva, per identificare gli elementi di un sito web, e il ragionamento contestuale, per valutare le azioni da compiere.

In questo modo, l’AI può interagire con vari elementi web, anche in caso di presenza di soluzioni grafiche complesse. L’obiettivo è consentire a un agente AI di operare online come se fosse seduto davanti a uno schermo.

Gemini 2.5 Computer Use è in grado di “muoversi” all’interno del browser, senza accedere al sistema operativo, ed è già ottimizzato per compiere diverse azioni, dalla digitazione del testo alla pressione di pulsanti e fino all’apertura di finestre web.

Come si usa Gemini 2.5 Computer Use

Per il momento, Gemini 2.5 Computer Use è disponibile in una versione di anteprima accessibile pubblicamente tramite le API Gemini su Google AI Studio e Vertex AI e può essere provato subito in una demo disponibile su Browserbase.

Si tratta, chiaramente, del primo passo di un programma più ambizioso. Google vuole arricchire il suo modello AI, rendendo sempre più in grado di operare in completa autonomia, navigando in rete come farebbe un essere umano e interagendo in modo più completo con i siti web.

La strada per il completamento dello sviluppo è ancora lunga. In futuro, però, l’azienda potrebbe integrare il suo nuovo modello in vari servizi, rendendolo disponibile sia a livello di API che come funzionalità aggiuntiva, ad esempio, per l’assistente Gemini.

I margini di crescita sono tanti. Google non ha intenzione di fermare lo sviluppo dei suoi servizi AI e continua a lavorare per implementare soluzioni sempre più complete e avanzate. Il debutto di Gemini 2.5 Computer Use segna un vero e proprio punto di svolta.