Ti presentiamo Luo Fuli: il professionista dell’intelligenza artificiale dietro il modello open source di DeepSeek e la tecnologia MLA

Luo Fuli è un ricercatore di 29 anni a cui netizen e colleghi in Cina hanno soprannominato “prodigio dell’intelligenza artificiale”. È nota per il suo ruolo fondamentale nello sviluppo di DeepSeek-V2. Questo è il primo modello linguistico di intelligenza artificiale (AI) della Cina che potrebbe competere con ChatGPT di OpenAI.

Secondo il South China Morning Post, il modello linguistico di grandi dimensioni (LLM) è stato lanciato da DeepSeek il 26 dicembre 2024 ed è stato addestrato con molte meno risorse rispetto a Meta's Llama.

In un'intervista del maggio 2023 con il media cinese 36Kr, il fondatore di DeepSeek Liang Wenfeng ha affermato che quando recluta talenti, l'azienda dà priorità alle capacità rispetto all'esperienza. Fonti di notizie locali suggeriscono che il team di sviluppatori della startup è composto principalmente da laureati e studenti universitari.

"I nostri ruoli tecnici principali sono occupati principalmente da neolaureati o con uno o due anni di esperienza lavorativa", ha spiegato.

Questa strategia ha aiutato DeepSeek a costruire un team di giovani ricercatori ambiziosi, tra cui Gao Huazuo e Zeng Wangding. Ai due sono state attribuite innovazioni chiave nell’architettura MLA.

Luo Fuli: Sfidare l'informatica ha dato i suoi frutti

Tra gli sviluppatori più ricercati dell'azienda c'è Luo Fuli. Si dice che sia un'esperta di tecnologia "intelligente" e sincera con un forte background nell'elaborazione del linguaggio naturale (PNL). Secondo quanto riferito, Fuli è cresciuto in un ambiente modesto. Si dice che il suo interesse per la tecnologia potrebbe derivare da suo padre, un ingegnere elettrico.

L'ascesa di Luo nel campo dell'intelligenza artificiale è iniziata presso l'Istituto di linguistica computazionale dell'Università di Pechino. Rapporti non confermati da approfondimenti e social media affermano che inizialmente era incerta sullo studio dell'informatica. Fuli ha anche fallito alcune volte mentre lo faceva.

Tuttavia, alla fine ha scoperto la sua passione per l'intelligenza artificiale e si è fatta un nome grazie a ricerche rivoluzionarie. Inoltre, si dice che Luo abbia ricevuto inviti e offerte di lavoro mentre era ancora a scuola, ma li ha rifiutati tutti.

Nel 2019, ha attirato l'attenzione del settore tecnologico cinese dopo aver pubblicato otto articoli sulla PNL alla conferenza dell'Association for Computational Linguistics (ACL).

La sua conoscenza e il suo contributo alla PNL l'hanno portata a ricevere numerose offerte da importanti aziende tecnologiche, in particolare Alibaba.

Alla DAMO Academy di Alibaba, Luo ha contribuito a VECO, un modello di intelligenza artificiale multilingue. Ha lavorato al progetto open source AliceMind dell'azienda, aiutando il mercato online a far avanzare le sue iniziative di intelligenza artificiale. Tuttavia, le sue ambizioni sono andate oltre la ricerca aziendale. A tal fine, nel 2022 è entrata a far parte del ruolo di ricercatrice principale presso DeepSeek AI guidata da Wengfeng.

Luo Fuli e il giovane team di sviluppatori di DeepSeek AI

All'inizio, Luo faceva parte del team che ha realizzato DeepSeek-V2. Si tratta di un modello linguistico di grandi dimensioni ed economicamente vantaggioso che la gente del posto ha soprannominato “AI Pinduoduo”, in riferimento al gigante cinese dell’e-commerce online noto per i suoi prezzi convenienti.

Intervenendo a una conferenza tecnologica nel 2023, Luo ha messo in luce come il modello offra funzionalità di lingua cinese di alto livello. Ciò rivaleggiava anche con i migliori sistemi di intelligenza artificiale globale come ChatGPT e Qwei.

Luo Fuli ha attribuito il successo di DeepSeek-V2 a una combinazione di architettura innovativa, infrastruttura solida e impegno dell'azienda verso la trasparenza. Durante la sua permanenza in azienda, DeepSeek ha condiviso apertamente i suoi rapporti tecnici, i pesi dei modelli e il codice di inferenza su GitHub. L'obiettivo era attualizzare il suo approccio open source allo sviluppo dell'intelligenza artificiale.

DeepSeek AI – La tecnologia open source al suo apice

Una delle caratteristiche distintive di DeepSeek-V2 è l'uso dell'architettura Multi-Level Attention (MLA) e Mixture of Experts (MoE). L'MLA consente al modello di concentrarsi su diversi livelli di informazioni testuali, in modo simile al modo in cui un lettore umano elabora un libro. Ha spostato l'attenzione tra frasi, paragrafi e capitoli a seconda del contesto.

Nel frattempo, il MoE ottimizza l’efficienza computazionale indirizzando i compiti a “esperti” virtuali selezionati all’interno del modello. L'accumulo ha ridotto il consumo di risorse aumentando al contempo le prestazioni.

Luo Fuli ritiene che la Cina abbia bisogno di più laboratori di intelligenza artificiale. Insiste che il suo Paese dovrebbe concentrarsi su progetti ingegneristici pratici e su larga scala.

Luo Fuli è stato anche un forte sostenitore di uno spostamento verso la ricerca che dia priorità alle applicazioni del mondo reale. La nuova direzione dovrebbe garantire che i progressi dell’intelligenza artificiale si traducano in benefici tangibili per le imprese e i consumatori.

La crescente influenza del tecnico ventinovenne nel settore dell'intelligenza artificiale non è passata inosservata. Secondo quanto riportato dall'SCMP, il fondatore di Xiaomi le ha offerto personalmente un pacchetto di compensi annuali di 10 milioni di yuan, ma non è chiaro se abbia accettato l'offerta.

Cryptopolitan Academy: come scrivere un curriculum Web3 che ottenga interviste – Cheat Sheet GRATUITO

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto