Avete presente un pappagallo? Può imitare i suoni, ma senza il mangime adatto non riuscirà mai a crescere sano. L’intelligenza artificiale funziona in modo simile: ripete ciò che trova, ma per imparare davvero ha bisogno di dati ben preparati, i cosiddetti dataset. Finora però raccogliere questi dati era un lavoro lungo e complicato, soprattutto quando si trattava di documenti tecnici pieni di tabelle, grafici e note.
La novità arriva da ByteDance, la società madre di TikTok, che ha reso open-source un progetto chiamato Dolphin. È un’intelligenza artificiale multimodale capace di prendere i PDF più complessi e trasformarli in formati semplici e leggibili, come JSON o HTML. In pratica, riesce a scomporre e riorganizzare automaticamente quelle informazioni che per le macchine erano difficili da digerire.
Il risultato è che i ricercatori potranno costruire dataset molto più puliti e affidabili, accelerando la possibilità di addestrare nuove intelligenze artificiali su testi complicati, dagli articoli scientifici ai contratti. Il fatto che Dolphin sia open-source rende la scoperta ancora più significativa, perché chiunque potrà utilizzarla e migliorarla. È come aver trovato il modo giusto di preparare il mangime per il nostro pappagallo: ora può crescere più in fretta e imparare davvero.