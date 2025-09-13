Attivo nel mondo dell’editoria sin dal 2011, giornalista dal 2019, ha lavorato per il web e per la carta stampata occupandosi di musica, cultura, lifestyle e tecnologia.

Alibaba ha presentato Qwen3-Next, un notevole passo avanti rispetto al passato, confermando il grande potenziale cinese nella corsa all’intelligenza artificiale

Mamun_Sheikh/Shutterstock

Alibaba Group Holding ha annunciato ufficialmente la pubblicazione open source del suo nuovo modello di intelligenza artificiale, basato sulla architettura Qwen3-Next. Questo nuovo LLM si distingue dal precedente per un notevole incremento di potenza computazionale a fronte di un costo di addestramento ridotto a circa un decimo.

Il modello è stato rilasciato su piattaforme come GitHub e Hugging Face, confermando la volontà del colosso cinese della tecnologia di incentivare la nascita di un ecosistema open source, nell’ottica di una collaborazione tra sviluppatori per accelerare l’adozione delle tecnologie AI a livello globale.

Cosa sappiamo di Qwen3-Next

Secondo quando riferito dal team di sviluppo Qwen, l’enorme miglioramento delle prestazioni del nuovo modello deriva dall’uso di tecniche innovative, introdotte per massimizzare la capacità di calcolo e ridurre al minimo i costi energetici e infrastrutturali.

Fra le principali innovazioni usate del modello ci sono:

Hybrid Attention , una tecnica che semplifica l’elaborazione di sequenze testuali lunghe, aumentando la velocità di esecuzione

, una tecnica che semplifica l’elaborazione di sequenze testuali lunghe, aumentando la velocità di esecuzione Architettura MoE ( Mixture of Experts ), che suddivide il modello in sottoreti specializzate attivate selettivamente per gestire specifici compiti per ridurre il consumo complessivo di risorse senza compromettere la qualità delle risposte

( ), che suddivide il modello in sottoreti specializzate attivate selettivamente per gestire specifici compiti per ridurre il consumo complessivo di risorse senza compromettere la qualità delle risposte Previsione multi-token , che consente di generare più unità testuali contemporaneamente, migliorando l’efficienza nella produzione di output

, che consente di generare più unità testuali contemporaneamente, migliorando l’efficienza nella produzione di output Ottimizzazioni nel training, delle modifiche che rafforzano la stabilità del modello durante l’addestramento, riducendo errori e dispersioni di calcolo

Entrando nello specifico, il modello Qwen3-Next-80B-A3B ha 80 miliardi di parametri e si presenta come il successore diretto del Qwen3-32B. Secondo le dichiarazioni ufficiali, il nuovo modello è in grado di completare determinati compiti dieci volte più velocemente del predecessore, mantenendo un costo di addestramento pari a circa il 10% di quello richiesto in precedenza.

Secondo Alibaba Cloud, le prestazioni del nuovo modello sono comparabili a quelle del suo attuale modello top di gamma, il Qwen3-235B-A22B, ma con un’implementazione molto più efficiente, ottimizzata per funzionare anche su hardware di fascia consumer.

Infine un ulteriore dettaglio da sottolineare è la piena compatibilità della famiglia Qwen3 con MLX, il framework di machine learning di Apple. Questa integrazione consente di addestrare ed eseguire i modelli Qwen direttamente su dispositivi consumer come iPhone e MacBook, ampliando le possibilità di utilizzo in scenari quotidiani.

La strategia di Alibaba nella corsa all’AI

L’approccio open source adottato da Alibaba riflette una strategia più ampia delle aziende tecnologiche cinesi, che stanno diventando sempre più competitive nella corsa all’intelligenza artificiale.

Oltretutto, rendendo disponibili i propri modelli per la comunità globale di sviluppatori, il colosso della tecnologia punta a consolidare la propria posizione all’interno del più vasto ecosistema AI open source, “sfruttando” le competenze della collettività per far progredire questa tecnologia e cercando in tutti i modi di rafforzare la competitività nei confronti degli Stati Uniti.

Una strategia che, naturalmente, riaccende i vecchi contrasti tra oriente e occidente che, oggi, non riguardano più armamenti e territori ma hanno come solo scopo il superamento tecnologico dell’altra fazione.