Attivo nel mondo dell’editoria sin dal 2011, giornalista dal 2019, ha lavorato per il web e per la carta stampata occupandosi di musica, cultura, lifestyle e tecnologia.

L’AI sta cambiando e i modelli linguistici di grandi dimensioni si spostano verso l’idea di modelli mondiali, una tecnologia in grado di comprendere la realtà

In Sintesi

l settore dell’AI sta spostando l’attenzione dagli LLM, che eccellono nella manipolazione del testo e della conoscenza, ai modelli mondiali, progettati per comprendere e simulare la realtà fisica.

I modelli mondiali apprendono la fisica e le dinamiche ambientali analizzando video, simulazioni e dati multisensoriali, senza istruzioni esplicite, prevedendo l’evoluzione dello spazio e degli eventi.

Il settore dell’intelligenza artificiale sta cambiando direzione e, dopo l’ascesa dei modelli linguistici di grandi dimensioni, si guarda ora ai cosiddetti modelli mondiali, dei sistemi progettati per comprendere e simulare la realtà fisica.

Una svolta cruciale per costruire un’AI capace di operare in contesti concreti, dalla robotica ai videogiochi, fino all’automazione industriale. Il concetto alla base di tutto è creare uno strumento che sappia agire fisicamente e non soltanto manipolare testi, superando un limite strutturale degli attuali LLM, che oggi eccellono nella gestione della conoscenza ma non nella gestione della realtà.

Come funzionano i modelli mondiali

Negli ultimi mesi, alcun dei nomi più influenti del settore hanno messo l’idea dei modelli mondiali al centro delle proprie strategie. Fei-Fei Li, tra i massimi esperti mondiali di visione artificiale, ha annunciato il primo modello commerciale della linea, Marble, un progetto pensato per sviluppare una tecnologia capace di interpretare ambiente e dinamiche fisiche con un livello di realismo inedito.

Anche sul fronte corporate, la corsa è già iniziata. Google e Meta stanno sperimentando modelli mondiali sia per migliorare i propri robot e sia per rendere più accurati i modelli video di nuova generazione. OpenAI, invece, ha lasciato intendere che la progressione verso video sempre più realistici potrebbe rappresentare un passaggio obbligato verso la costruzione di un vero modello mondiale.

Secondo gli esperti, dunque, entro pochi anni “nessuno sano di mente userebbe LLM del tipo che abbiamo oggi”, con i modelli mondiali diventeranno il paradigma dominante del settore dell’AI. Una dichiarazione che riflette una convinzione crescente nel settore: i modelli attuali, pur impressionanti, non possiedono una comprensione intrinseca delle leggi fisiche né la capacità di ragionare su causa ed effetto.

Questi sistemi, infatti, apprendono osservando il comportamento della realtà. Utilizzano video, simulazioni, dati tridimensionali e input multisensoriali per costruire una rappresentazione interna della fisica dell’ambiente. Non ricevono istruzioni esplicite sulla gravità o sulla permanenza degli oggetti: imparano da soli, analizzando enormi quantità di esperienze visive e spaziali.

A differenza degli LLM attuali, che si limitano a prevedere la parola successiva, i modelli mondiali prevedono l’evoluzione dello spazio e degli eventi, un po’ come si sposta un oggetto, esaminando come cambia una scena nel tempo. Una capacità che apre la strada a robot più autonomi, videogiochi più realistici e sistemi previsionali più accurati.

I prossimi passi dell’evoluzione dell’AI

La direzione verso cui si sta muovendo l’intelligenza artificiale è chiara: i modelli mondiali stanno guadagnando attenzione, fondi e risorse. Resta da capire se il settore riuscirà a farli evolvere con la rapidità degli attuali LLM, che in pochi anni hanno trasformato l’intera industria tecnologica.

Per scoprirlo, bisognerà attendere ancora qualche anno, quando la tecnologia sarà sufficientemente matura. Quel che è certo è che, per la prima volta, l’AI prova davvero a capire come funziona il mondo e questa potrebbe essere la svolta più importante di tutte, che realmente porterà questa tecnologia un passo più avanti nella comprensione della realtà.