Nel campo dell’applicazione dell’intelligenza artificiale in medicina la Sicilia inizia a guadagnare terreno. Il Policlinico Paolo Giaccone di Palermo si è distinto sulla scena internazionale grazie al riconoscimento ricevuto dal ricercatore Ciro Celsa, dell'Unità Operativa di Gastroenterologia ed Epatologia, che ha ricevuto il Merit Award all'ultimo convegno ESMO su IA e oncologia digitale, grazie a uno studio che propone un utilizzo innovativo dell'IA nella gestione del carcinoma epatocellulare uno dei tumori più complessi da trattare.
Il sistema sviluppato da Celsa e dal suo team si basa su Large Language Models in grado di analizzare la documentazione clinica e supportare le decisioni terapeutiche, raggiungendo un'elevata accuratezza nella previsione delle valutazioni tumorali e nell'identificazione di casi realmente complessi. Lo studio rientra ini un programma di ricerca che sta riscuotendo l'interesse anche oltre i confini italiani, grazie alla collaborazione con l'Università di Yale e al recente finanziamento EUROSTART di Celsa, che supporta lo sviluppo di sistemi di intelligenza artificiale multimodale per i tumori del fegato. Il team sta già lavorando a nuove applicazioni e alla validazione internazionale del modello.
Ecco cosa ci ha raccontato il dottor Ciro Celsa su come nasce e dove può arrivare questo progetto.
Dottor Celsa, può spiegare sinteticamente in cosa consiste lo studio premiato all'ESMO e qual era l'obiettivo principale del vostro lavoro?
"Il nostro studio ha sviluppato un sistema di intelligenza artificiale in grado di analizzare la documentazione clinica dei pazienti con epatocarcinoma e fornire supporto decisionale ai medici. L'obiettivo principale era duplice: da un lato, aiutare i clinici a identificare il trattamento più appropriato per ogni paziente; dall'altro, stratificare i pazienti in base alla complessità clinica per ottimizzare le risorse del tumor board multidisciplinare.
L'epatocarcinoma presenta sfide uniche: si sviluppa spesso in pazienti con cirrosi, esistono molteplici opzioni terapeutiche (dalla chirurgia alla radiologia interventistica, dall'immunoterapia ai trattamenti locali), e ogni decisione deve considerare sia lo stadio del tumore che la funzionalità epatica residua. Volevamo creare uno strumento che potesse "leggere" questa complessità e aiutare a identificare quali pazienti necessitano realmente di una discussione collegiale approfondita e quali potrebbero seguire percorsi più standardizzati".
Perché avete scelto di utilizzare un modello basato su Large Language Models nella gestione dell'epatocarcinoma? Qual è la vera innovazione?
"La vera innovazione sta nel fatto che i Large Language Models sono in grado di "comprendere" il linguaggio naturale delle cartelle cliniche, esattamente come lo scriverebbe un medico. A differenza dei sistemi tradizionali che richiedono dati perfettamente strutturati, il nostro sistema può lavorare con note cliniche scritte liberamente, referti medici, lettere di dimissione, tutta quella documentazione che nella pratica quotidiana non è mai perfettamente standardizzata.
Abbiamo integrato i LLM con le linee guida internazionali di gestione dell'epatocarcinoma, creando quello che chiamiamo un approccio di "retrieval-augmented generation". Il sistema non si limita a "leggere" i dati del paziente, ma li interpreta alla luce delle migliori evidenze scientifiche disponibili. È come avere un assistente che conosce perfettamente tutte le linee guida e può applicarle rapidamente al caso specifico. Inoltre, abbiamo confrontato diversi approcci tecnici per identificare la configurazione ottimale. Questo ci ha permesso di bilanciare accuratezza e praticabilità nell'implementazione clinica".
Lo studio è stato testato su quasi 500 valutazioni cliniche di oltre 400 pazienti, qual è il risultato più rilevante che avete ottenuto?
"I risultati sono stati davvero incoraggianti su più fronti. Per quanto riguarda la predizione del trattamento, il nostro sistema ha raggiunto un'accuratezza vicina al 90% nel predire esattamente la decisione terapeutica presa dal team multidisciplinare.
Un altro dato interessante è la capacità del sistema di stratificare i pazienti per complessità clinica, raggiungendo un'accuratezza di circa 85% Questo significa che il sistema può identificare con grande affidabilità quali sono i casi che richiedono una discussione collegiale approfondita e quali potrebbero seguire percorsi più lineari.
È importante sottolineare che abbiamo testato il sistema su casi reali, gestiti presso il nostro centro tra il 2020 e il 2024, quindi non in condizioni di laboratorio ma nella reale complessità della pratica clinica quotidiana. Questo rende i risultati particolarmente significativi in termini di applicabilità pratica".
In che modo il vostro sistema di AI supporta concretamente la decisione clinica senza sostituire il giudizio del medico?
Questa è una distinzione fondamentale. Il nostro sistema non prende decisioni, ma fornisce supporto informativo strutturato. Funziona come un "secondo parere" molto rapido che aiuta il clinico a organizzare le informazioni, a considerare tutte le opzioni terapeutiche disponibili alla luce delle linee guida e a semplificare il percorso decisionale all’interno dei team multidisciplinari.
Immaginate un medico che visita un paziente con epatocarcinoma: deve considerare lo stadio tumorale, la funzionalità epatica, le comorbidità, le controindicazioni a certi trattamenti, le preferenze del paziente. Il nostro sistema può analizzare rapidamente tutta questa documentazione e suggerire: "In base alle caratteristiche di questo paziente e alle attuali linee guida, le opzioni terapeutiche principali sono X, Y e Z, e questo caso presenta queste specifiche complessità". Il medico resta l'unico responsabile della decisione finale. Il sistema gli fornisce uno strumento per non trascurare elementi importanti e per standardizzare il processo decisionale secondo le migliori evidenze, ma la valutazione complessiva, il rapporto con il paziente, la considerazione di fattori non codificabili, tutto questo rimane patrimonio esclusivo del giudizio clinico umano".
Che impatto pratico potrebbe avere questa tecnologia sull'organizzazione dei tumor board e sulla gestione dei casi più complessi?
"L'impatto potenziale è significativo, soprattutto in termini di ottimizzazione delle risorse. I tumor board multidisciplinari sono fondamentali per la gestione ottimale dell'epatocarcinoma, ma organizzarli è estremamente dispendioso: richiedono la presenza contemporanea di gastroenterologi, oncologi, chirurghi, radiologi interventisti, e spesso la disponibilità di questi specialisti è limitata.
Il nostro sistema potrebbe aiutare a fare un “triage” dei casi in modo intelligente: i pazienti con caratteristiche più standard potrebbero seguire percorsi diagnostico-terapeutici più lineari, mentre i casi complessi, quelli che davvero necessitano della discussione collegiale, verrebbero identificati sistematicamente e prioritizzati per il tumor board. Questo non significa ridurre la qualità dell'assistenza, anzisignifica assicurarsi che le risorse specialistiche più preziose vengano dedicate ai casi che ne hanno maggiormente bisogno. Inoltre, aiuta a standardizzare l'approccio anche in centri più piccoli o meno specializzati, dove magari l'expertise sull'epatocarcinoma è minore.
Infine, c'è un aspetto formativo: il sistema potrebbe essere utilizzato per training, mostrando ai medici in formazione come casi simili vengono gestiti secondo le linee guida internazionali".
Qual è stato il contributo principale della collaborazione con Yale e cosa ha aggiunto alla qualità del progetto?
"La collaborazione con l'Università di Yale, e in particolare con il Dr. Mauro Giuffrè, è stata preziosa sotto molteplici aspetti. Yale rappresenta uno dei centri di eccellenza mondiale per la ricerca in ambito di intelligenza artificiale applicata alla medicina. Yale ha un'esperienza consolidata nell'implementazione clinica di strumenti di AI, e questo know-how pratico è stato essenziale per orientare il nostro lavoro verso soluzioni realmente applicabili e non solo teoricamente interessanti. La partnership ci ha anche aperto prospettive per validazioni future del sistema in contesti internazionali e multicentrici, che sono il passo successivo necessario per portare questa tecnologia dalla ricerca alla pratica clinica quotidiana".
Quali sono i prossimi passi? Pensate di estendere il modello ad altri ambiti dell'epatologia o di validarlo in studi multicentrici internazionali?
"Abbiamo già un piano ambizioso per i prossimi sviluppi, che si inserisce in una strategia più ampia che vede l'Università di Palermo e il Policlinico Paolo Giaccone in prima linea nell'implementazione dell'intelligenza artificiale in ambito sanitario.
Quello che rende particolarmente solido questo percorso è l'esistenza di due Cabine di Regia dedicate all'AI, una presso l'Università di Palermo e una presso l'Azienda Ospedaliera Universitaria Policlinico Paolo Giaccone, entrambe coordinate dal Prof. Calogero Cammà, che oltre a essere Direttore della nostra Unità Operativa di Gastroenterologia ed Epatologia, ricopre questo ruolo strategico. Questa doppia struttura di coordinamento garantisce che gli sviluppi tecnologici siano perfettamente allineati sia con le esigenze della ricerca e della didattica universitaria, sia con quelle dell'assistenza clinica quotidiana.
Stiamo già lavorando all'estensione del sistema ad altre patologie gastroenterologiche e non solo. Il modello concettuale che abbiamo sviluppato, integrare Large Language Models con linee guida cliniche e dati non strutturati, è applicabile a molte altre condizioni. Grazie al lavoro di un gruppo multidisciplinare che coinvolge anche gli ingegneri della nostra Università, in particolare il gruppo coordinato dal Prof. Roberto Pirrone e dal Dott. Salvatore Contino, stiamo esplorando applicazioni molto concrete e immediatamente utili per la pratica clinica.
Una delle direzioni più promettenti è l'integrazione degli LLM con i sistemi informativi ospedalieri: la cartella clinica elettronica, le relazioni ambulatoriali, la refertazione degli esami strumentali. L'obiettivo finale è velocizzare e semplificare molte delle attività quotidiane ripetitive e "burocratiche" del medico, liberando tempo prezioso che può essere dedicato ai pazienti e alle attività cliniche più complesse. Questo è un punto fondamentale. L'AI più sofisticata non serve a nulla se poi non viene utilizzata nella pratica quotidiana e se non porta un beneficio concreto e misurabile nel lavoro del clinico.
Un'altra direzione interessante è lo sviluppo di sistemi multimodali. Non solo analisi di testo clinico quindi, ma integrazione con imaging radiologico, dati di laboratorio, e in futuro anche dati genomici e di medicina di precisione. Il finanziamento EUROSTART che ho recentemente ottenuto è proprio orientato in questa direzione: sviluppare modelli di AI che possano integrare diverse fonti di informazione per fornire un supporto ancora più completo e personalizzato al processo decisionale clinico.
Naturalmente, parallelamente a questi sviluppi applicativi, proseguirà anche la validazione scientifica attraverso studi multicentrici internazionali. Vogliamo testare il sistema in altri ospedali, con casistiche diverse e in contesti organizzativi differenti, per verificare che l'accuratezza e l'utilità clinica si mantengano elevate. Solo attraverso questa validazione rigorosa potremo pensare a un'implementazione su larga scala che abbia un reale impatto sul sistema sanitario".