Un modello AI valuta eventi cardiovascolari nei trial clinici con accuratezza paragonabile ai medici esperti

Presentato all'American Heart Association 2025 Scientific Sessions e pubblicato su JACC, il modello Auto-MACE utilizza deep reinforcement learning per aggiudicare morte cardiovascolare, infarto e ictus con prestazioni comparabili a quelle dei comitati di esperti.

Un modello AI valuta eventi cardiovascolari nei trial clinici con accuratezza paragonabile ai medici esperti
Condividi:
4 min di lettura

Ricercatori del Brigham and Women's Hospital di Boston hanno presentato il sette novembre 2025 all'American Heart Association Scientific Sessions un modello di intelligenza artificiale denominato Auto-MACE in grado di aggiudicare eventi avversi maggiori in trial clinici cardiovascolari con prestazioni paragonabili a quelle di medici esperti. Lo studio, pubblicato simultaneamente sul Journal of the American College of Cardiology, suggerisce che questa tecnologia potrebbe essere utilizzata per semplificare i processi e risparmiare risorse economiche nella ricerca. Pablo M. Marti-Castellote e colleghi scrivono che riducendo il volume di casi che richiedono revisione umana, l'AI può diminuire un importante fattore di costo e ritardi nelle tempistiche di aggiudicazione.

I ricercatori hanno addestrato il modello linguistico Auto-MACE per aggiudicare morte cardiovascolare basandosi su cinque grandi trial clinici cardiovascolari: INVESTED, DELIVER, PARAGON-HF, PRO2TECT e INNO2VATE. Per l'infarto miocardico non fatale il training si è basato su dati di PARAGON-HF, mentre per l'ictus su dati di PARAGON-HF, PRO2TECT e INNO2VATE. Il modello è stato poi testato su cinquemilacinquecentosessantuno partecipanti di PARADISE-MI, pazienti con infarto miocardico complicato da disfunzione sistolica o congestione polmonare.

Auto-MACE ha aggiudicato con confidenza il sessantanove percento delle morti, il quarantasei percento dei potenziali infarti miocardici e il cinquantatré percento degli ictus. Per gli eventi aggiudicati con alta confidenza, il modello ha dimostrato accuratezza comparabile a quella dei comitati di esperti di aggiudicazione clinica. Gli errori nell'identificazione degli eventi avversi cardiovascolari maggiori erano dovuti all'incapacità di estrarre dati sulla troponina da tabelle e moduli a caselle, oltre che al fraintendimento di un infarto precedente come nuovo evento. Per l'ictus, la maggior parte degli errori riguardava casi in cui il modello aggiudicava ictus ma il comitato non trovava eventi, spesso perché il modello interpretava erroneamente ictus precedenti o evidenze di ictus pregressi su imaging cerebrale come nuovi eventi.

Alexandra Popma del Cardiovascular Research Foundation di New York, commentando i risultati per TCTMD, ha definito lo studio fantastico e un passo formale nel processo di portare l'AI nei trial clinici. La sfida rimane come tradurre questa ricerca in un prodotto e output che sarà accettabile dalle agenzie regolatorie. La domanda aperta resta come farlo in modo etico che soddisfi tutti gli standard di trasparenza e tracciabilità. L'applicazione di un modello di aggiudicazione basato su AI coerente attraverso tutti gli eventi all'interno di un trial e persino tra trial diversi potrebbe migliorare la riproducibilità rispetto all'aggiudicazione da parte di numerosi revisori con esperienza eterogenea.

Gli autori riconoscono che il percorso più pragmatico per i trial pivotali di fase tre consiste nell'implementazione ibrida insieme a un'attenta supervisione del comitato di aggiudicazione clinica umano. Il dialogo precoce con le agenzie regolatorie sarà cruciale per garantire l'accettazione dei dati sugli endpoint generati dall'AI. I comitati di aggiudicazione degli eventi clinici rappresentano un costo significativo nei trial cardiovascolari. Esperti indipendenti devono rivedere documenti medici, risultati di laboratorio e imaging per determinare se gli eventi riportati soddisfano definizioni predeterminate di endpoint come morte, infarto o ictus.

Il processo richiede tempo, competenza specializzata e coordinamento tra più revisori. Auto-MACE potrebbe automatizzare gran parte di questo lavoro, consentendo ai comitati umani di concentrarsi solo sui casi ambigui o di bassa confidenza. Il modello linguistico analizza cartelle cliniche elettroniche, report di imaging e dati di laboratorio utilizzando tecniche di natural language processing per estrarre informazioni rilevanti e applicare criteri diagnostici. La capacità di processare migliaia di documenti rapidamente e coerentemente rappresenta un vantaggio significativo rispetto alla revisione manuale.

Tuttavia, le limitazioni emerse nello studio evidenziano che l'AI non è ancora pronta per operare autonomamente. L'incapacità di estrarre dati da formati non testuali come tabelle e checkbox rappresenta una sfida tecnica che richiede ulteriore sviluppo. La tendenza a interpretare erroneamente eventi storici come nuove occorrenze suggerisce che il modello necessita di migliore comprensione del contesto temporale. Questi problemi sottolineano l'importanza di mantenere supervisione umana, almeno nelle fasi iniziali di implementazione.

Alla fine, Auto-MACE non rappresenta solo un'innovazione nella ricerca cardiovascolare. Segna il momento in cui l'intelligenza artificiale inizia a sostituire processi umani non attraverso la superiorità assoluta, ma attraverso l'efficienza scalabile. E pone una domanda che nessun algoritmo può rispondere da solo: quando la medicina smette di essere una pratica umana per diventare un processo computazionale, cosa resta del giudizio clinico.

Tag: