L'avvento di piattaforme di intelligenza artificiale con modelli linguistici di grandi dimensioni come Chat-GPT ha inaugurato una nuova era di interazioni basate sull'intelligenza artificiale. Sebbene si sia registrato un aumento dell’interesse e dello sviluppo della tecnologia IA in Medio Oriente, i modelli in lingua araba sono spesso rimasti indietro. Tuttavia, uno sforzo di collaborazione tra l’Università di Intelligenza Artificiale Mohamed bin Zayed (MBZUAI) di Abu Dhabi, Cerebras Systems con sede nella Silicon Valley e la società di intelligenza artificiale G42 con sede negli Emirati Arabi Uniti ha svelato uno strumento di intelligenza artificiale rivoluzionario su misura per chi parla arabo, chiamato “Jais”. Questo sviluppo non solo risponde alle esigenze degli arabi, ma ha anche il potenziale per far avanzare modelli linguistici di grandi dimensioni in altre lingue sottorappresentate nel panorama dell’intelligenza artificiale.
La sfida dei modelli linguistici arabi
Sebbene i modelli linguistici esistenti come ChatGPT e LLaMA di Meta abbiano alcune funzionalità per la lingua araba, sono stati formati prevalentemente su dati inglesi provenienti da Internet. Secondo Timothy Baldwin, rettore ad interim e professore di elaborazione del linguaggio naturale presso MBZUAI, Jais ha adottato un approccio diverso. Ha utilizzato una combinazione di set di dati in inglese e arabo, con una forte enfasi sui contenuti del Medio Oriente. Questo approccio formativo unico ha consentito a Jais di raggiungere un livello di comprensione e competenza nell'arabo che lo distingue dai suoi omologhi.
La dominanza delle lingue con alfabeto latino
La predominanza su Internet delle lingue che utilizzano l’alfabeto latino, con l’inglese in prima linea, ha portato alla creazione di set di dati più grandi per queste lingue. Mohammed Soliman, direttore delle tecnologie strategiche e del programma di sicurezza informatica presso il Middle East Institute, sottolinea che l’accesso esclusivo agli strumenti di intelligenza artificiale per lingue specifiche potrebbe svantaggiare vari settori della società. I modelli linguistici formati principalmente in inglese spesso mancano di consapevolezza culturale e di comprensione dei diversi background, il che può influire negativamente sull’esperienza degli utenti.
Sfumature culturali e dialetti in arabo
L’arabo, essendo la sesta lingua più parlata a livello globale, rappresenta una sfida unica a causa della sua ricca diversità di dialetti. L’arabo standard moderno è tipicamente utilizzato per documenti ufficiali e scritti formali, mentre i dialetti locali sono prevalenti nei blog e nei social media. Jais, con i suoi diversi dati di formazione, ha la capacità di navigare tra questi dialetti e comprendere le sfumature culturali, rendendolo più versatile e applicabile in diversi settori.
Ampliare le possibilità
Mentre Jais continua ad evolversi, il team di sviluppo sta cercando di espandere le sue capacità oltre le interazioni basate su testo. Hanno in programma di incorporare la capacità di lavorare con immagini, grafici o dati tabulari, aprendo possibilità di applicazioni nell'interpretazione di scansioni mediche, nell'analisi dei dati di investimento o nell'elaborazione dei dati satellitari.
Responsabilità nello sviluppo dell’IA
Jais, come altri modelli di intelligenza artificiale generativa, implementa l'ottimizzazione delle istruzioni per prevenire la generazione di contenuti dannosi o tossici. Aderisce alle regole e ai costumi locali, garantendo che le risposte siano in linea con le norme etiche e culturali. Il processo di sviluppo di Jais ha comportato il dialogo con il governo degli Emirati Arabi Uniti e altre istituzioni per garantire un'implementazione responsabile dell'IA.
Sviluppi regionali negli Emirati Arabi Uniti
Gli Emirati Arabi Uniti sono stati in prima linea nello sviluppo di sistemi di intelligenza artificiale generativa. Nel 2017 è diventato il primo paese al mondo a nominare un ministro dell’IA. In particolare, il più grande modello di intelligenza artificiale generativa della regione, Falcon, è stato presentato dall’Advanced Technology Research Council di Abu Dhabi e dal Technology Innovation Institute (TII). Sebbene Falcon sia attualmente disponibile solo in inglese, vanta 180 miliardi di parametri e supera i concorrenti nel ragionamento, nella codifica e nei test di conoscenza. Sia Falcon che Jais sono open source, rendendo il loro codice accessibile a chiunque possa utilizzarlo o modificarlo.
Il potenziale impatto dell’intelligenza artificiale sul Medio Oriente
Secondo un rapporto del 2018 di PwC, il Medio Oriente trarrà fino a 320 miliardi di dollari di benefici dall’intelligenza artificiale entro il 2030. La regione è desiderosa di sviluppare le proprie capacità nel settore dell’intelligenza artificiale per sfruttare tutto il potenziale di questa tecnologia. Ali Hosseini, chief digital officer di PwC per il Medio Oriente, sottolinea che alcuni dei migliori modelli di intelligenza artificiale open source sono stati sviluppati nella regione, citando Falcon e Jais come primi esempi.
L’introduzione di Jais, uno strumento di intelligenza artificiale su misura per chi parla arabo, rappresenta un significativo passo avanti nell’affrontare il divario linguistico nel panorama dell’intelligenza artificiale. Non solo soddisfa le esigenze degli arabi, ma costituisce anche un precedente per lo sviluppo di modelli linguistici per le lingue sottorappresentate in tutto il mondo. Con la sua capacità di comprendere i dialetti e le sfumature culturali, Jais è pronta ad avere un profondo impatto in vari settori, favorendo l’evoluzione dell’intelligenza artificiale in Medio Oriente e oltre. Poiché la tecnologia dell’intelligenza artificiale continua ad avanzare, l’inclusività nei modelli linguistici è fondamentale per garantire che i benefici dell’intelligenza artificiale siano accessibili a diverse popolazioni in tutto il mondo. Jais rappresenta un passo promettente in quella direzione, con il potenziale per sviluppi più innovativi all’orizzonte.