Una ricerca condotta dai medici-scienziati del Beth Israel Deaconess Medical Center ha dimostrato che il software di linguaggio AI ChatGPT-4, (LLM), ha superato medici residenti e curanti per alcune fasi del ragionamento clinico.
“È diventato chiaro molto presto che gli LLM possono fare diagnosi, ma chiunque pratichi la medicina sa che c’è molto di più nella medicina di questo”, ha detto Adam Rodman MD, medico di medicina interna e ricercatore nel dipartimento di medicina del BIDMC
Pubblicata in seguito su JAMA Internal Medicine, la ricerca ha dimostrato che non solo l’IA è in grado di fornire diagnosi accurate, ma sviluppa anche capacità di ragionamento clinico comparabili, o persino superiori, a quelle dei professionisti umani in contesti specifici.
Il Team di 21 medici curanti e 18 di medicina interna guidati dal Dr. Adam Rodman e dalla Dr.ssa Stephanie Cabral, ha messo a confronto le capacità del software ChatGPT-4 con le capacità mediche dei medici del team di ricerca.
Utilizzando il punteggio revised-IDEA per la valutazione dei dati clinici, ai partecipanti e al software è stato chiesto di affrontare 20 casi clinici tramite quattro fasi di procedura diagnostica, si è iniziato con la raccolta dei sintomi principali e dei segni vitali con l’approfondimento delle informazioni fornite dal paziente. Dopo di ciò si è svolto l’esame fisico e i test diagnostici. Per ogni fase, i medici e il chatbot dovevano fornire e giustificare le diagnosi differenziali, che sono state poi valutate secondo il criterio di punteggio r-IDEA.
I risultati hanno mostrato che ChatGPT-4 ha ottenuto il punteggio r-IDEA più alto, con una media perfetta di 10 su 10, contro il 9 dei medici curanti e l’8 dei residenti. Tuttavia, in termini di accuratezza diagnostica, l’IA ha mostrato prestazioni simili a quelle degli esseri umani. Si può dire che sia stato un pareggio tra il team di valutazione dei dottori e le diagnosi fornite dall’intelligenza artificiale. Nonostante il ragionamento clinico sulla base dei casi medici fosse corretto, i bot AI erano anche “semplicemente sbagliati” avendo più casi di ragionamento errato nelle loro risposte. La scoperta sottolinea l’idea che l’IA sarà probabilmente più utile come strumento per aumentare, e non sostituire, il processo di ragionamento umano.
Nonostante un ottima produzione di dati rispetto all’esperimento da parte di ChatGPT, il software non è ancora pronto per una messa in pratica in campo medico al posto delle capacità umane. La Dr.ssa Cabral ha constatato il potenziale dell’IA per ridurre le inefficienze burocratiche, permettendo così ai medici di dedicare più tempo alla relazione con i pazienti.
“Sono necessari altri studi per determinare come i LLM possano essere integrati al meglio nella pratica clinica, ma anche ora potrebbero essere utili come punto di controllo, aiutandoci a assicurarci di non perdere qualcosa. La mia speranza è che l’IA migliori l’interazione paziente-medico, semplificando i processi e aumentando la qualità dell’assistenza”, ha affermato la Dottoressa del BIDMC.
Lo studio messo in pratica rappresenta un passo cruciale nel valutare l’utilizzo degli LLM nella medicina clinica e apre la strada a ulteriori ricerche per integrarli efficacemente nella pratica quotidiana.
Sebbene ChatGPT-4 abbia dimostrato una straordinaria capacità di ragionamento clinico, i ricercatori hanno sottolineato che l’IA ha commesso errori significativi in alcuni casi. Il team sottolinea che il valore aggiunto dell’IA che dimostra un ragionamento clinico molto preciso, il futuro dell’assistenza sanitaria potrebbe basarsi su una sinergia tra intelligenza artificiale e competenze umane, migliorando l’esperienza e i risultati per i pazienti.
In seguito allo studio pubblicato su JAMA Internal Medicine, il futuro dell’intelligenza artificiale appare molto promettente ma pieno di sfide ma l’obiettivo finale non deve essere quello di sostituire i medici. Il vero potenziale risiede in una collaborazione tra intelligenza artificiale e intelligenza umana.
Gli esseri umani eccellono in empatia, giudizio e comprensione del contesto culturale e personale di un paziente, mentre l’IA brilla nella velocità e nell’accuratezza dei calcoli e nella capacità di elaborare molti dati. Insieme, possono creare un sistema sanitario più efficiente, migliorando il ragionamento clinico, che richiede non solo conoscenze teoriche ma anche capacità di analisi sequenziale e contestuale.
Come detto da Geoffrey Hinton: “Senza l’umanità non ci sarebbe mai stata l’intelligenza artificiale”, infatti il futuro dell’IA non è uno scenario in cui dominano le macchine, ma un mondo in cui l’intelligenza artificiale collabora in sinergia con l’intelligenza umana per creare nuove opportunità, migliorando non solo la medicina, ma gli aspetti della vita a 360°.
Questo contenuto è stato scritto da un utente della Community. Il responsabile della pubblicazione è esclusivamente il suo autore.