I modelli ChatGPT superano i benchmark umani negli esami di neurologia

In uno studio presentato su JAMA Network Open, due versioni di ChatGPT Large Language Models (LLM) hanno dimostrato una notevole capacità di superare gli studenti di neurologia umana negli esami di tipo board. Questo sviluppo segna una pietra miliare significativa nell’applicazione dell’intelligenza artificiale (AI) in campo medico, in particolare in neurologia.

Il passo avanti dell’intelligenza artificiale negli esami neurologici

I ricercatori hanno utilizzato LLM 1 (ChatGPT versione 3.5) e LLM 2 (ChatGPT versione 4) per affrontare le domande della banca di domande dell'American Board of Psychiatry and Neurology (ABPN). Il risultato principale dello studio è stato che il LLM 2 ha raggiunto un impressionante tasso di successo dell'85%, superando la media umana del 73,8%. In particolare, questa prestazione è stata ottenuta senza che i modelli avessero accesso a Internet o fossero sottoposti a una messa a punto specifica per la neurologia.

Lo studio ha aderito a rigorosi protocolli scientifici, comprese le linee guida Strengthening the Reporting of Observational Studies in Epidemiology (STROBE). Il confronto con gli studenti di neurologia umana prevedeva una serie di domande, classificate come di ordine inferiore, incentrate sulla comprensione di base e sulla memoria, o di ordine superiore, che richiedevano applicazione, analisi e pensiero valutativo.

Le implicazioni dell’intelligenza artificiale in campo medico

Le prestazioni superiori di LLM 2, soprattutto nelle domande di ordine superiore, sottolineano i rapidi progressi nell'intelligenza artificiale e le sue potenziali applicazioni in contesti clinici. Ciò è particolarmente rilevante in quanto l’intelligenza artificiale continua a penetrare in ambiti tradizionalmente riservati alle competenze umane, come la medicina, l’esercito, l’istruzione e la ricerca.

L’uso dell’intelligenza artificiale nella neurologia clinica si è espanso, con compiti che vanno dalla diagnosi alla pianificazione del trattamento e alla prognosi. Lo studio evidenzia come l’intelligenza artificiale, in particolare le architetture basate su trasformatori come ChatGPT, possano aiutare e talvolta sostituire i ruoli umani in questi campi.

Bilanciare l’intelligenza artificiale e le competenze umane

Sebbene i risultati siano promettenti, aprono anche discussioni sull’equilibrio tra intelligenza artificiale e competenza umana in campi sensibili come la medicina. Gli autori dello studio sottolineano che i punti di forza dell’intelligenza artificiale nei compiti basati sulla memoria, rispetto a quelli che richiedono una cognizione profonda, indicano un ruolo complementare piuttosto che una sostituzione degli esperti medici umani.

I risultati dello studio testimoniano il potenziale dell’intelligenza artificiale nel migliorare le pratiche mediche e gli strumenti educativi. Tuttavia, sottolinea anche la necessità di una valutazione e di un perfezionamento continui di questi sistemi di intelligenza artificiale per garantire che aumentino in modo efficace le competenze umane.

Lo studio di JAMA Network Open rivela un salto significativo nelle capacità dell’intelligenza artificiale, in particolare nel campo medico della neurologia. I risultati dimostrano l’abilità dell’intelligenza artificiale in compiti analitici complessi e aprono la porta a nuove possibilità nella formazione e nella pratica medica. Il futuro dell’intelligenza artificiale in medicina appare luminoso, con queste tecnologie pronte a svolgere un ruolo sempre più di supporto accanto ai professionisti umani.

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto