Un approccio formativo rivoluzionario consente all’intelligenza artificiale di generalizzare come le menti umane

In uno sviluppo rivoluzionario per il campo dell’intelligenza artificiale (AI), i ricercatori hanno svelato un nuovo protocollo di addestramento che può migliorare significativamente la capacità di un modello di intelligenza artificiale di generalizzare e comprendere le informazioni, avvicinandolo al modo in cui gli esseri umani apprendono e ragionano. Questo approccio innovativo sfida la convinzione convenzionale secondo cui più dati sono la chiave per migliorare l’apprendimento automatico, offrendo nuove informazioni sui segreti dell’intelligenza artificiale e della cognizione umana.

Gli esseri umani eccellono nel comprendere e combinare varie componenti per dare un senso al mondo, un’abilità cognitiva nota come “composizionalità” o “generalizzazione sistematica”. Ci consente di decodificare frasi non familiari, creare risposte originali e comprendere i significati sottostanti delle parole e delle regole grammaticali. Raggiungere la composizionalità è stato a lungo una sfida per gli sviluppatori di intelligenza artificiale, poiché le reti neurali tradizionali faticano a emulare questo aspetto fondamentale della cognizione umana.

Sebbene gli attuali modelli di intelligenza artificiale generativa come GPT-3 e GPT-4 di OpenAI possano imitare in una certa misura la composizionalità, spesso non raggiungono determinati parametri di riferimento, non riuscendo a cogliere veramente il significato e l’intenzione dietro le frasi che generano. Tuttavia, un recente studio pubblicato su Nature suggerisce che un protocollo di allenamento unico incentrato sul modo in cui le reti neurali apprendono potrebbe essere la chiave per affrontare questa sfida.

Rimodellare il processo di apprendimento

Gli autori dello studio hanno adottato un approccio diverso all'addestramento dell'intelligenza artificiale, evitando la necessità di creare architetture di intelligenza artificiale completamente nuove. Invece, hanno iniziato con un modello di trasformatore standard, la stessa architettura fondamentale utilizzata in ChatGPT e Bard di Google, ma senza alcuna formazione testuale preliminare. L’innovazione fondamentale risiedeva nel regime di allenamento stesso.

I ricercatori hanno progettato una serie di compiti che coinvolgevano un linguaggio fittizio composto da parole senza senso come “dax”, “lug”, “kiki”, “fep” e “blicket”. Queste parole erano associate a serie di punti colorati, con alcune parole che rappresentavano direttamente i colori dei punti specifici e altre che indicavano funzioni che alteravano l'output dei punti. Ad esempio, “dax” rappresentava un punto rosso, mentre “fep” era una funzione che, se combinata con “dax” o altre parole simboliche, moltiplicava per tre l’output del punto corrispondente. Fondamentalmente, l’AI non ha ricevuto informazioni su queste associazioni; i ricercatori hanno semplicemente fornito esempi di frasi senza senso accanto alle corrispondenti configurazioni di punti.

AI Raggiungere una comprensione simile a quella umana

Man mano che il modello di intelligenza artificiale veniva addestrato, imparava gradualmente a rispondere in modo coerente, aderendo alle regole implicite del linguaggio privo di senso. Anche di fronte a nuove combinazioni di parole, l'intelligenza artificiale ha dimostrato la sua capacità di "comprendere" le regole inventate della lingua e di applicarle a frasi mai viste prima. Questa straordinaria impresa ha accennato al potenziale di generalizzazione dell'intelligenza artificiale, un passo fondamentale verso un ragionamento di tipo umano.

Per valutare le prestazioni dell'intelligenza artificiale, i ricercatori l'hanno confrontata con i partecipanti umani. In alcuni casi, l’intelligenza artificiale addestrata ha risposto con una precisione del 100%, superando gli esseri umani, che hanno raggiunto un tasso di precisione di circa l’81%. Anche quando l’intelligenza artificiale commetteva errori, questi rispecchiavano gli errori comunemente commessi dagli esseri umani, evidenziando la sua capacità di ragionare in modo simile a quello umano.

Ciò che è particolarmente degno di nota è che questa prestazione impressionante è stata ottenuta con un modello di trasformatore relativamente piccolo, non con un’intelligenza artificiale massiccia addestrata su vasti set di dati. Questa scoperta suggerisce che, invece di inondare i modelli di apprendimento automatico con infiniti dati, un approccio più mirato, simile a un corso di linguistica o algebra specializzata, potrebbe produrre miglioramenti sostanziali nelle capacità dell’intelligenza artificiale.

Implicazioni e direzioni future

Sebbene questo nuovo protocollo di allenamento offra risultati promettenti, è essenziale riconoscerne i limiti. Il modello di intelligenza artificiale eccelleva in compiti specifici legati al riconoscimento di modelli all’interno di un linguaggio fabbricato, ma faticava di fronte a sfide completamente nuove o forme di generalizzazione non praticate. Di conseguenza, è fondamentale riconoscere che il raggiungimento di una generalizzazione limitata nell’intelligenza artificiale è un passo significativo ma non raggiunge l’obiettivo finale dell’intelligenza artificiale generale.

Armando Solar-Lezama, informatico del Massachusetts Institute of Technology, osserva che questa ricerca potrebbe aprire nuove strade per migliorare l’intelligenza artificiale. Concentrandoci sull’insegnamento di modelli per ragionare in modo efficace, anche in compiti sintetici, potremmo trovare modi per migliorare le capacità dell’intelligenza artificiale oltre i limiti attuali. Tuttavia, l’ampliamento di questo nuovo protocollo di formazione potrebbe presentare sfide che devono essere affrontate.

Oltre alle implicazioni pratiche per l’intelligenza artificiale, questa ricerca potrebbe anche far luce sul funzionamento interno delle reti neurali e sulle loro capacità emergenti. Comprendere questi processi potrebbe contribuire a ridurre al minimo gli errori nei sistemi di intelligenza artificiale e migliorare la nostra comprensione della cognizione umana.

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto