Recentemente, i ricercatori cinesi dell’Università di Pechino e dell’Eastern Institute of Technology (EIT) hanno svelato un quadro innovativo progettato per addestrare modelli di apprendimento automatico con conoscenze pregresse, un allontanamento dall’approccio convenzionale basato solo sui dati. I ricercatori evidenziano l’impatto trasformativo dei modelli di deep learning sulla ricerca scientifica, sottolineando la loro capacità di estrarre relazioni significative da vasti set di dati. Il framework affronta i limiti dei modelli esistenti, come Sora di OpenAI, che fatica a simulare accuratamente alcune interazioni del mondo reale a causa della mancanza di comprensione delle leggi fisiche come la gravità.
I modelli di deep learning, rinomati per aver rivoluzionato la ricerca scientifica, si basano principalmente su dati estesi per la formazione piuttosto che incorporare conoscenze pregresse come leggi fisiche o logica matematica. Tuttavia, i ricercatori dell’Università di Pechino e dell’Eastern Institute of Technology propongono un cambio di paradigma. Il team suggerisce che la combinazione dei dati con le conoscenze pregresse durante la formazione potrebbe portare a modelli di apprendimento automatico più accurati e informati.
La sfida sta nel determinare quali aspetti della conoscenza pregressa, comprese le relazioni funzionali, le equazioni e la logica, dovrebbero essere integrati per facilitare un migliore pre-apprendimento senza causare il collasso del modello. Il professor Chen Yuntian sottolinea che l’inondazione di modelli con un elevato volume di conoscenze e regole spesso porta a difficoltà o fallimenti negli attuali modelli di apprendimento automatico informato.
Un quadro per valutare l’importanza delle regole
Per superare questa sfida, i ricercatori hanno sviluppato un quadro che valuta il valore delle regole e determina combinazioni ottimali che migliorano la capacità predittiva dei modelli di deep learning. Xu Hao, il primo autore e ricercatore presso l’Università di Pechino, spiega che il loro quadro calcola “l’importanza delle regole” analizzando come regole o combinazioni specifiche influenzano l’accuratezza predittiva di un modello.
Questo approccio mira a bilanciare l'influenza dei dati e della conoscenza, migliorando l'efficienza e le capacità di inferenza dei modelli di deep learning. Il team prevede che incorporare la conoscenza umana nei modelli di intelligenza artificiale potrebbe migliorare significativamente la loro riflessività nel mondo reale, rendendoli più applicabili nei settori scientifico e ingegneristico.
I ricercatori hanno testato la loro struttura ottimizzando un modello per risolvere equazioni multivariate e un altro per prevedere i risultati di un esperimento di chimica. Chen suggerisce che, a breve termine, questo quadro troverà le sue applicazioni più utili nei modelli scientifici in cui la coerenza con le regole fisiche è vitale per evitare potenziali conseguenze negative.
Nonostante i risultati promettenti, il team riconosce la sfida. Man mano che vengono aggiunti più dati a un modello, le regole generali diventano più significative delle regole locali specifiche. Tuttavia, questa osservazione non offre vantaggi significativi in campi come la biologia e la chimica, dove spesso mancano regole generali.
Verso scienziati autonomi dell’IA
Guardando al futuro, il gruppo di ricerca aspira a fare un ulteriore passo avanti nel suo quadro, consentendo all’intelligenza artificiale di identificare le proprie conoscenze e regole direttamente dai dati senza intervento umano. L’obiettivo finale è creare un circuito chiuso, trasformando il modello in un vero scienziato dell’intelligenza artificiale. Chen prevede questo sviluppo come un passo significativo verso l’autonomia nell’intelligenza artificiale e il team sta lavorando attivamente su uno strumento plug-in open source per gli sviluppatori di intelligenza artificiale per facilitare questa transizione.