Copyright e intelligenza artificiale tra tutela e rischio plagio

Dalle cause contro OpenAI ai dubbi sugli output generati dai chatbot, il dibattito sul diritto d’autore.

Copyright e intelligenza artificiale tra tutela e rischio plagio
Condividi:
7 min di lettura

L’evoluzione dell’intelligenza artificiale generativa sta ridefinendo il rapporto tra tecnologia e diritto d’autore, aprendo nuove questioni legali sulla proprietà dei contenuti digitali, sull’utilizzo delle opere per l’addestramento degli algoritmi e sulla tutela degli output prodotti con il supporto dell’AI. L’aumento dell’impiego di sistemi capaci di creare testi, immagini, video e audio ha già prodotto contenziosi internazionali, modifiche legislative e nuovi orientamenti giuridici destinati ad avere effetti significativi sul settore creativo e sull’economia digitale.

Le prime controversie nate attorno all’AI si sono concentrate soprattutto sull’utilizzo di materiali protetti da copyright nei processi di training dei modelli generativi. Editori, artisti e aziende hanno contestato il caricamento di opere nei dataset di addestramento senza autorizzazione né compensazione economica. Secondo Lucia Maggi, avvocata del Foro di Milano, il mercato si starebbe progressivamente orientando verso sistemi di licenza e accordi economici tra i titolari dei diritti e le società che sviluppano intelligenza artificiale, nel tentativo di regolamentare un settore cresciuto rapidamente e privo inizialmente di regole condivise.

Tra le cause più rilevanti figura quella avviata dal New York Times contro OpenAI e Microsoft. Il quotidiano statunitense sostiene che milioni di articoli siano stati utilizzati senza consenso per addestrare ChatGPT. Nel marzo 2025 il giudice federale Sidney Stein ha respinto la richiesta di archiviazione presentata da OpenAI, consentendo la prosecuzione del procedimento sulle accuse principali di violazione del copyright. La difesa della società si fonda sul principio del fair use, sostenendo che l’uso dei contenuti a fini di addestramento abbia natura trasformativa. Il New York Times contesta invece che la riproduzione del proprio materiale giornalistico possa rientrare in questa categoria.

Il procedimento ha assunto anche una dimensione legata alla tutela della privacy. Nel maggio 2025 un’ordinanza ha imposto a OpenAI la conservazione dei log delle conversazioni di ChatGPT, misura che coinvolge oltre 400 milioni di utenti. Successivamente, il New York Times ha richiesto l’accesso a circa 20 milioni di conversazioni private, aprendo un confronto anche sul trattamento dei dati personali.

Accanto alle dispute sull’uso dei contenuti per il training degli algoritmi, stanno aumentando le questioni legate alla protezione delle opere realizzate con il supporto dell’intelligenza artificiale. In Italia la legge 132/2025, entrata in vigore il 10 ottobre 2025, ha modificato la normativa sul diritto d’autore stabilendo che le opere create con strumenti di AI possono essere protette soltanto quando rappresentano il risultato del lavoro intellettuale umano.

La normativa italiana conferma quindi il principio secondo cui il contributo creativo della persona deve prevalere rispetto all’attività svolta dalla macchina. Secondo Lucia Maggi, tuttavia, la principale criticità riguarda proprio la valutazione concreta del peso dell’intervento umano, poiché la legge non stabilisce criteri quantitativi precisi. Per questo motivo, l’analisi dovrà essere effettuata singolarmente per ogni caso.

Il dibattito riguarda soprattutto le AI generative, cioè quei sistemi capaci di produrre autonomamente contenuti originali. In Italia, invece, la Corte di Cassazione ha affrontato indirettamente il tema in una controversia relativa alla scenografia del Festival di Sanremo 2016. La causa riguardava l’utilizzo da parte della RAI dell’immagine digitale di un fiore reperita online senza autorizzazione dell’autrice. La Cassazione ha chiarito che l’impiego di un software non esclude automaticamente la possibilità di tutela autorale, purché sia presente un effettivo contributo creativo umano. La Corte ha sottolineato che il livello di creatività deve essere verificato caso per caso per stabilire se il programma informatico abbia semplicemente supportato l’autore o ne abbia sostituito integralmente il lavoro.

A livello internazionale, solo alcune giurisdizioni prevedono espressamente la tutela delle opere generate da computer. Tra queste vi sono Hong Kong, India, Irlanda, Nuova Zelanda, Sud Africa e Regno Unito. La normativa britannica, attraverso il Copyright Designs and Patent Act del 1988, attribuisce i diritti sull’opera al soggetto che ha organizzato il funzionamento della macchina rendendo possibile la creazione del contenuto.

Nel frattempo, l’Europa sta costruendo un quadro normativo più dettagliato. L’AI Act introduce obblighi di trasparenza per i fornitori di modelli generativi, imponendo la documentazione dei dataset utilizzati per l’addestramento e il rispetto delle clausole di opt-out richieste dai titolari dei diritti. Anche il Codice europeo di buone pratiche per i modelli GPAI, approvato nel maggio 2025, dedica una parte specifica alla tutela del copyright e dell’autorialità.

Uno dei temi più discussi riguarda il Text and Data Mining, ossia l’utilizzo automatizzato di grandi quantità di dati per addestrare i modelli di AI. La normativa europea distingue tra utilizzo per finalità scientifiche e impiego commerciale, consentendo ai titolari delle opere di opporsi tramite il sistema dell’opt-out. La legge italiana 132/2025 recepisce questo principio ma rinvia alle disposizioni europee senza introdurre regole autonome più dettagliate.

Resta inoltre aperta la questione del plagio involontario. I sistemi generativi possono produrre contenuti molto simili a opere esistenti, specialmente quando vengono richiesti materiali ispirati a stili facilmente riconoscibili.

Negli ultimi mesi diversi casi hanno riportato il problema all’attenzione pubblica. Le immagini generate nello stile dello Studio Ghibli, l'Italian Plumber costruito come una versione del personaggio Super Mario di Nintendo o rappresentazioni molto simili alla bottiglia di ketchup Heinz sono esempi che mostrano quanto il confine tra ispirazione e violazione del copyright possa risultare sottile.

Anche il mondo artistico ha già avviato azioni legali contro le aziende del settore. Le artiste Sarah Andersen, Kelly McKernan e Karla Ortiz hanno promosso una class action contro alcuni generatori di immagini, accusandoli di aver utilizzato miliardi di opere protette per addestrare i sistemi senza autorizzazione.

La normativa italiana disciplina già il tema delle opere derivate. Gli articoli 4, 7 e 18 della legge 633/1941 riconoscono tutela alle elaborazioni creative, purché autorizzate dall’autore dell’opera originaria. Le parodie rappresentano invece un’eccezione, a condizione che il nuovo contenuto modifichi il significato dell’opera iniziale trasformandolo in un lavoro autonomo.

Con l’intelligenza artificiale, però, il problema diventa più complesso. Quando manca un contributo umano diretto, diventa difficile stabilire se il sistema possa essere considerato autore di una vera elaborazione creativa oppure di una parodia. Secondo alcuni osservatori, riconoscere questa possibilità significherebbe attribuire alla macchina capacità interpretative e critiche tipicamente umane.

Parallelamente stanno crescendo le tecnologie dedicate alla tracciabilità dei contenuti generati artificialmente. Tra queste vi è il watermarking digitale. Lo standard C2PA, sviluppato da un consorzio composto tra gli altri da Adobe, Microsoft, Google e BBC, consente di inserire metadati crittografati capaci di certificare l’origine dei contenuti, le modifiche effettuate e l’eventuale utilizzo dell’intelligenza artificiale. Google ha sviluppato il sistema SynthID per le immagini generate dai propri modelli, mentre Meta ha introdotto Video Seal per i video sintetici.

Le diverse piattaforme di AI presentano inoltre regole differenti sulla gestione dei contenuti generati. ChatGPT assegna normalmente all’utente la proprietà degli output, ma nei piani gratuiti le conversazioni possono essere utilizzate per migliorare i modelli. Midjourney concede licenze commerciali agli utenti a pagamento, mentre le immagini prodotte con gli account gratuiti vengono pubblicate nella galleria pubblica della piattaforma. Adobe Firefly, invece, utilizza prevalentemente dataset composti da contenuti Adobe Stock, opere con licenze aperte e materiali di dominio pubblico, offrendo anche forme di indennizzo per gli utenti enterprise.

Per professionisti, creativi e aziende, il rischio di plagio involontario resta una delle principali criticità operative. Gli esperti consigliano quindi di conservare la documentazione del processo creativo, archiviare prompt e versioni intermedie degli output, utilizzare strumenti di verifica antiplagio e modificare in maniera significativa i contenuti generati automaticamente.

Il quadro normativo, comunque, è ancora in piena evoluzione. Tra il 2026 e il 2027 è attesa la sentenza della Corte di Giustizia dell’Unione Europea nel caso Like Company v. Google Ireland, destinata a chiarire se l’addestramento dei modelli su materiale protetto possa costituire violazione del diritto d’autore. In Italia, invece, la legge 132/2025 ha affidato al Governo il compito di definire entro dodici mesi una disciplina più organica sull’utilizzo dei dati nei processi di training dell’intelligenza artificiale.

Nel frattempo si stanno diffondendo modelli di licenza diretta tra editori e aziende tecnologiche. OpenAI ha già firmato accordi con gruppi editoriali come News Corp, Condé Nast e Associated Press, segnando un possibile cambio di paradigma nel rapporto tra piattaforme di AI e industria dei contenuti digitali.

Tag: