Dopo aver riscontrato "problemi tecnici persistenti" con i chip Ascend di Huawei, DeepSeek ha posticipato il rilascio del suo modello R2 AI.
Il colosso cinese dell'intelligenza artificiale sta riscontrando ritardi dopo essere stato incoraggiato dalle autorità locali a utilizzare sistemi nazionali per i propri prodotti.
Rilascio ritardato del modello di intelligenza artificiale DeepSeek R2
L'azienda cinese di intelligenza artificiale DeepSeek ha rinviato il lancio del suo ultimo modello di intelligenza artificiale dopo aver riscontrato persistenti problemi tecnici con i processori Ascend di Huawei.
DeepSeek era stata incoraggiata dalle autorità cinesi a utilizzare i chip Huawei al posto dei prodotti Nvidia realizzati negli Stati Uniti dopo il successo del lancio del suo modello R1 a gennaio, ma l'azienda ha riscontrato gravi problemi durante la fase di addestramento del suo modello R2.
Secondo fonti vicine alla questione, questi problemi hanno costretto DeepSeek a fare affidamento sui chip Nvidia per l'addestramento, mentre per l'inferenza si è affidato ai chip Ascend di Huawei.
Gli addetti ai lavori affermano che i chip cinesi, compresi quelli di Huawei, soffrono di una connettività inter-chip più lenta, di limitazioni software e di problemi di stabilità rispetto ai prodotti Nvidia.
Huawei ha inviato un team di ingegneri negli uffici di DeepSeek per aiutarla ad adattare il modello ai suoi chip, ma nonostante il supporto in loco, la start-up non è riuscita a completare con successo la formazione sull'hardware Ascend, secondo quanto riportato dalle fonti .
DeepSeek aveva pianificato di lanciare il modello R2 a maggio, ma a causa dei problemi di prestazioni del chip Ascend, il lancio è stato posticipato.
Sfide allo slancio di DeepSeek
Secondo una persona a conoscenza della questione, i ritardi nel lancio di R2 sono aggravati da progressi più lenti del previsto nell'etichettatura dei dati per le funzionalità aggiornate del modello.
Sebbene alcuni resoconti dei media cinesi suggeriscano che il nuovo modello potrebbe essere rilasciato nelle prossime settimane, il fondatore di DeepSeek, Liang Wenfeng, ha espresso internamente la sua insoddisfazione per i progressi compiuti, esortando il team a prendersi il tempo necessario per produrre un modello in grado di mantenere il vantaggio competitivo dell'azienda.
Nel frattempo, i rivali hanno continuato a guadagnare terreno. Ritwik Gupta, ricercatore di intelligenza artificiale presso l'Università della California, Berkeley, ha affermato che molti sviluppatori in Cina si sono rivolti al modello Qwen3 di Alibaba , che ha descritto come potente e flessibile.
Gupta ha osservato che Qwen3 ha adottato alcune delle innovazioni principali di DeepSeek, come un algoritmo di addestramento che abilita le capacità di ragionamento, ma le ha rese più efficienti da implementare.
Gupta, che monitora l'ecosistema AI di Huawei, ha affermato che la piattaforma Ascend sta attraversando "fatiche iniziali", ma ha previsto un miglioramento futuro.
"Solo perché oggi non vediamo modelli leader addestrati su Huawei non significa che non accadrà in futuro", ha affermato. "È questione di tempo".
Nvidia, un attore centrale nelle tensioni tecnologiche tra Stati Uniti e Cina, ha recentemente accettato di cedere al governo statunitense una parte dei suoi ricavi legati alla Cina in cambio della ripresa delle vendite dei suoi chip H2O ai clienti cinesi. L'azienda ha sottolineato l'importanza di mantenere l'accesso agli sviluppatori cinesi, avvertendo che "cedere interi mercati e sviluppatori non farebbe altro che danneggiare l'economia e la sicurezza nazionale americana".
Non limitarti a leggere le notizie sulle criptovalute. Comprendile. Iscriviti alla nostra newsletter. È gratuita .