Google ha presentato Gemini Robotics 1.5 e Gemini Robotics-ER 1.5, due modelli di nuova generazione che rivoluzioneranno per sempre il mondo della robotica AI

In Sintesi

Google ha lanciato Gemini Robotics 1.5 e Robotics-ER 1.5, modelli AI che consentono ai robot di osservare, ragionare, pianificare e adattarsi a scenari complessi.

L’obiettivo dell’azienda di Mountain View è quello di portare queste tecnologie nella vita quotidiana degli utenti affiancandoli a casa e sul lavoro.

Google ha presentato Gemini Robotics 1.5 e Gemini Robotics-ER 1.5, due modelli di nuova generazione che ridefiniscono i confini della robotica. Non si tratta più di semplici esecutori di comandi, questi sistemi sono progettati per osservare, ragionare, pianificare e adattarsi in modo dinamico a scenari complessi, aprendo la strada a una forma di intelligenza artificiale inserita all’interno di robot capaci di integrarsi pienamente nella vita quotidiana.

Che cosa cambia con Gemini Robotics

Gemini Robotics 1.5 si basa su un modello Vision-Language-Action (VLA), ed è in grado di tradurre immagini e istruzioni scritte in azioni fisiche coordinate. Il robot, prima di muoversi, è in grado di elaborare i passaggi necessari e addirittura spiegare con linguaggio naturale le scelte effettuate, introducendo un livello di trasparenza e “consapevolezza” mai visto prima.

Il modello Gemini Robotics-ER 1.5, invece, è un sistema Vision-Language (VLM) focalizzato sulla pianificazione strategica. Può formulare soluzioni articolate, consultare strumenti esterni come Google Search e generare piani dettagliati per completare attività che richiedono più fasi e informazioni contestuali.

Nei primi test effettuati da Google i due modelli hanno mostrato prestazioni eccellenti in compiti che richiedono ragionamento spaziale e capacità deduttiva. Il video condiviso dal colosso della tecnologia, ad esempio, mostra questi automi alle prese con lo smistamento dei rifiuti: un’attività che implica la combinazione di conoscenze contestuali (dei piani locali per la raccolta differenziata, ad esempio), pianificazione multilivello e coordinazione fisica.

Uno degli aspetti più interessanti di questa tecnologia è l’abilità di apprendere su diverse piattaforme robotiche. In pratica, un movimento acquisito da un modello può essere trasferito ad altre macchine, riducendo i tempi di addestramento e ampliando il ventaglio di scenari applicativi.

Infine, sul piano della sicurezza Gemini Robotics 1.5 e Gemini Robotics-ER 1.5 includono sistemi di ragionamento semantico avanzato, meccanismi anti-collisione e linee guida di interazione sicura con gli esseri umani. Inoltre, grazie all’aggiornamento del benchmark ASIMOV, gli sviluppatori possono valutare in modo più accurato i livelli di protezione, sia sul piano semantico che fisico.

Insomma, secondo Google, i robot alimentati da questi modelli AI sono totalmente sicuri e pronti ad affiancare l’uomo in qualsiasi compito, senza che corra alcun pericolo.

Google getta le basi per la robotica del futuro

Con il lancio di questi modelli, Google compie un passo decisivo verso lo sviluppo di agenti AI capaci di operare nel mondo reale in modo logico e autonomo, andando oltre i tradizionali sistemi reattivi.

L’obiettivo è chiaro: costruire macchine basate sul perfetto incontro di robotica avanza e l’AI di Gemini, in grado di collaborare con l’uomo nella vita domestica e lavorativa, fornendo un supporto versatile e sempre più integrato nelle attività quotidiane.

Come provare questi due modelli? Al momento Gemini Robotics-ER 1.5 è accessibile tramite l’API Gemini su Google AI Studio, mentre Gemini Robotics 1.5 è riservato a una cerchia ristretta di partner selezionati.