L’intelligenza artificiale accelera: OpenAI, Google e la spinta dei modelli open source

OpenAI, Google e la Cina ridisegnano il panorama dell’AI con nuovi strumenti visuali e modelli open source che aprono la strada a un ecosistema più accessibile.

Immagine generata con intelligenza artificiale
Immagine generata con intelligenza artificiale
Condividi:
4 min di lettura

Dal nuovo Agent Builder ai modelli cinesi fino a Gemini 3 ecco una panoramica dei cambiamenti che stanno ridefinendo l’AI.

La corsa globale all’intelligenza artificiale entra in una nuova fase in cui strumenti visuali, modelli open source e innovazioni multimodali ridisegnano il modo in cui costruiamo e usiamo l’AI.

Il mondo dell’intelligenza artificiale sta vivendo una trasformazione simultanea su più fronti. OpenAI si prepara a lanciare Agent Builder, una piattaforma visuale per creare flussi di lavoro basati su agenti; in Cina emergono modelli open source come Qwen 3 VL, GLM-4.6 e DeepSeek V3.2 exp, che sfidano i giganti occidentali sul piano dell’efficienza; mentre Google, con Gemini 3, punta a spingersi oltre nella generazione di interfacce e contenuti vettoriali.
Questi tre movimenti, diversi per strategia ma uniti da una stessa direzione, indicano il prossimo passo dell’AI, quello di definire integrazione, accessibilità e potenza distribuita.

In arrivo il 6 ottobre, Agent Builder è la nuova scommessa di OpenAI per trasformare le proprie API in un ambiente integrato e intuitivo.
La piattaforma, mostrata in anteprima da Testing Catalog, si basa su un canvas visivo dove gli utenti collegano nodi — come Agent, File Search o User Approval — per costruire automazioni intelligenti senza scrivere codice. Ogni nodo può essere configurato con parametri specifici, dal modello linguistico al formato d’output, e gli agenti possono disporre di memoria persistente, mantenendo il contesto tra le esecuzioni.

L’obiettivo è chiaro: ridurre la distanza tra sviluppo e progettazione, rendendo possibile creare agenti che pensano e agiscono in modo coordinato, direttamente dentro l’ecosistema OpenAI.
Ma la sfida è anche strategica: entrare in un territorio oggi dominato da piattaforme come N8N e Zapier, che offrono già migliaia di integrazioni e una community open source attivissima. OpenAI dovrà dunque bilanciare controllo proprietario e apertura, due valori oggi cruciali per guadagnare fiducia tra sviluppatori e aziende.

Parallelamente, il fronte asiatico mostra una crescita impressionante. In Cina, una nuova ondata di modelli open source sta dimostrando che efficienza e performance possono coesistere.
Qwen 3 VL, di Alibaba, è un modello multimodale con 30 miliardi di parametri (3 miliardi attivi) capace di gestire testo, immagini e video, con funzioni integrate di riconoscimento visivo e OCR. Nei benchmark si avvicina a GPT-4o e Claude 3.5 Sonnet, con ottimi risultati nell’analisi di documenti e video frame.

GLM-4.6, sviluppato alla Tsinghua University, eccelle nel reasoning su contesti lunghi e nel coding, posizionandosi come la migliore alternativa open source ai modelli di Anthropic.
Infine, DeepSeek V3.2 exp spicca per la sua efficienza e grazie a un sistema di sparse attention, riduce del 50% i costi computazionali mantenendo prestazioni simili al modello Terminus. I costi di utilizzo, tra 0,007 e 0,028 dollari per milione di token in input, lo rendono uno degli strumenti più economici del settore.

Insieme, questi modelli segnano un cambio di paradigma: l’AI non è più dominio esclusivo dei colossi occidentali, ma un terreno di innovazione aperto, scalabile e competitivo.

Gemini 3: l’ambizione di Google oltre il testo

Sul fronte occidentale, tutte le attenzioni convergono su Gemini 3, il nuovo modello multimodale di Google, atteso per il 9 ottobre in occasione di un evento di Google Cloud.
Secondo le anteprime pubblicate da Testing Catalog, la versione “Pro” del modello si distingue per la capacità di generare file vettoriali (SVG) complessi e interfacce utente realistiche, partendo da semplici prompt testuali. In alcuni test, Gemini 3 ha prodotto un robot 3D dettagliato e una pagina web completa con design coerente, prestazioni superiori a quelle di Claude 4.5 Sonnet.

Google sta inoltre introducendo una nuova funzione in AI Studio, chiamata MyStuff, che permetterà di creare e salvare progetti AI personalizzati. Un passo che rafforza la visione di Gemini come piattaforma di costruzione, non solo di generazione.

Un settore che cambia volto

Dalle piattaforme proprietarie di OpenAI ai modelli open source cinesi, fino all’ambizione di Google, il quadro è chiaro: l’AI sta diventando più visuale, modulare e collaborativa.
La tendenza dominante è quella della democratizzazione dello sviluppo, dove la potenza dei modelli è accompagnata da strumenti che ne semplificano l’uso.
Tuttavia, restano interrogativi cruciali: il rischio di chiusura degli ecosistemi proprietari, la frammentazione delle soluzioni open source e la sostenibilità dei costi energetici.

Nei prossimi mesi, la vera sfida sarà trovare un equilibrio tra potenza centralizzata e innovazione distribuita, in un panorama dove l’AI non è più solo una tecnologia, ma un linguaggio universale in costruzione.

Tag: