OpenAI starebbe lavorando all’integrazione del suo generatore di video basato su intelligenza artificiale, chiamato Sora, direttamente all’interno di ChatGPT. La notizia, diffusa il 10 marzo da Reuters e riportata dal sito The Information, suggerisce che l’azienda stia pianificando di ampliare le funzionalità multimodali della sua piattaforma conversazionale nel prossimo futuro. Sora è una delle principali innovazioni di OpenAI nel campo delle tecnologie multimodali. Questo sistema permette di creare brevi video a partire da descrizioni testuali ed è pensato per competere con strumenti simili sviluppati da aziende come Meta e Google.
Mentre i modelli di IA che si concentrano sulla generazione testuale sono già ampiamente utilizzati in contesti domestici e professionali, la generazione automatica di immagini e video rappresenta un nuovo orizzonte tecnologico con un potenziale trasformativo significativo. Lanciato come applicazione autonoma nel settembre 2025, Sora consente agli utenti di creare e condividere video generati dall’intelligenza artificiale, utilizzando anche elementi protetti da copyright. L’app ricorda il funzionamento dei social network grazie a flussi condivisibili. Nonostante il possibile inserimento in ChatGPT, secondo The Information, la versione indipendente di Sora rimarrà disponibile per gli utenti.
Reuters ha specificato di non aver potuto verificare autonomamente le informazioni pubblicate, mentre OpenAI, contattata per un commento al di fuori dell’orario lavorativo, non ha fornito una risposta immediata. Se integrato in ChatGPT, Sora permetterebbe agli utenti di generare contenuti video direttamente durante una conversazione con il chatbot, eliminando la necessità di passare da un’applicazione all’altra. Questo cambiamento potrebbe agevolare l’uso, offrendo un’esperienza ancora più completa e integrata per la creazione di contenuti generativi, siano essi testuali, visivi o video. Secondo le fonti riportate, questa integrazione si inserisce nella strategia di OpenAI di potenziare le capacità multimodali del suo sistema principale, puntando ad ampliarne l’accessibilità. La generazione automatica di video sta diventando rapidamente un settore competitivo nel mondo dell’IA, con molte aziende che sviluppano strumenti capaci di trasformare prompt testuali in sequenze video brevi. La mossa potrebbe quindi rafforzare la posizione di OpenAI in un mercato in forte crescita.
Questa strategia viene definita come un approccio di "building in the open", fondato sul rilascio pubblico delle tecnologie e sul loro miglioramento continuo grazie all'utilizzo pratico da parte degli utenti. Una prospettiva condivisa anche dall'ex dirigente di OpenAI Zack Kass, il quale ha presentato questo metodo come un'alternativa allo sviluppo interamente riservato o alla decisione di non distribuire i prodotti.
La società sta investendo parallelamente nell’ampliamento delle capacità multimodali del chatbot. Di recente, OpenAI ha introdotto nuove visualizzazioni interattive per gli utenti di ChatGPT, progettate per fornire risposte più dettagliate ed efficaci, specialmente nelle aree della matematica e delle scienze. L’implementazione di Sora potrebbe inoltre avere ricadute economiche significative, considerando che i modelli avanzati di generazione video richiedono elevate risorse computazionali. Stime aziendali indicano che OpenAI potrebbe affrontare costi complessivi pari a circa 225 miliardi di dollari per l’esecuzione dei suoi modelli entro il 2030.
Tuttavia, tali spese potrebbero essere mitigate se ChatGPT continuasse a mantenere il suo predominio nel mercato globale dei chatbot. Un’opzione interessante riguarda la possibilità di monetizzare direttamente la generazione video. Attualmente, l’infrastruttura API di OpenAI include modelli tariffari basati su chiamate singole o sull’uso di token consumati. In un’ottica futura, è plausibile ipotizzare l’introduzione di schemi di pagamento specifici per i servizi di video generati, benché non siano ancora disponibili dettagli sulle modalità di pricing relative a Sora all’interno di ChatGPT. Un altro vantaggio derivante dall’accesso a contenuti video generati dall’intelligenza artificiale potrebbe riguardare la creazione di dati sintetici utili per l’addestramento di nuovi modelli. Questo approccio consentirebbe ai materiali generati dall’IA di alimentare un ciclo virtuoso, contribuendo al perfezionamento e all’evoluzione di sistemi sempre più avanzati.
Il lancio dell’app autonoma Sora, presentata da alcuni analisti come una piattaforma video simile a TikTok, aveva inizialmente attirato grande attenzione. Disponibile in una prima fase solo tramite inviti, l’app era rapidamente diventata virale, conquistando le prime posizioni nella classifica dell’App Store di Apple. Tuttavia, la competizione nel settore si è rapidamente intensificata, con l’introduzione di nuovi strumenti di generazione video sviluppati da aziende rivali come Vibes di Meta e Veo 3 di Google.
Nonostante il successo iniziale, l’utilizzo della tecnologia introdotta da Sora ha sollevato alcune preoccupazioni. Sono emersi casi in cui utenti hanno realizzato deepfake o contenuti che aggiravano i sistemi di sicurezza ideati per prevenirne l’uso improprio. Una possibile integrazione di queste funzionalità in ChatGPT potrebbe incrementare ulteriormente il numero di persone in grado di accedere a tali strumenti, amplificando quindi anche i problemi legati alla moderazione dei contenuti. Nel corso dell’ultimo anno, Sora ha affrontato cambiamenti significativi. OpenAI, che è alla base dello sviluppo dell’app, ha ricevuto un investimento di un miliardo di dollari da Disney all’interno di un accordo che include anche la licenza per l’utilizzo dei celebri personaggi della compagnia d’intrattenimento da parte degli utenti di ChatGPT e Sora. Questo accordo è stato raggiunto nonostante le critiche che avevano puntato il dito contro il modello della piattaforma, accusato di aver generato deepfake di figure storiche e contenuti considerati lesivi dei diritti di proprietà intellettuale nell’ambito del cinema.