NVIDIA punta a spodestare Intel e AMD.

Il 31 maggio, NVIDIA ha annunciato la produzione su vasta scala della sua CPU Vera, posizionando il chip a 88 core come il primo processore per data center progettato specificamente per i carichi di lavoro degli agenti di intelligenza artificiale. Secondo il comunicato stampa dell'azienda, Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure, ByteDance e CoreWeave sono tra i primi ad adottarlo e a pianificarne l'implementazione.

Il chip rappresenta la spinta più aggressiva di NVIDIA finora oltre le GPU, per entrare nel mercato delle CPU dominato da Intel e AMD per decenni. Mentre Grace, il precedente chip per server basato su ARM di NVIDIA, ha venduto circa 2,5 milioni di unità fino ad oggi, Vera introduce un'architettura core completamente personalizzata chiamata Olympus, anziché utilizzare un design core ARM standard, secondo Tom's Hardware.

Perché i carichi di lavoro degli agenti AI stanno ridefinendo la domanda di CPU nei data center

Il panorama economico dei data center per l'intelligenza artificiale è cambiato. Con l'evoluzione dei modelli, che passano dalla semplice risposta a domande all'esecuzione di codice, all'invocazione di programmi e al coordinamento di attività complesse, la CPU diventa un elemento chiave. Jensen Huang, CEO di NVIDIA, ha descritto direttamente il potenziale: "Gli agenti di IA saranno i maggiori utilizzatori di risorse di calcolo… Vera è la prima CPU progettata per questo futuro, costruita per eseguire l'IA agentiva su scala iperscalabile con prestazioni, efficienza e programmabilità straordinarie."

Le specifiche di Vera ne illustrano il potenziale. È dotata di 88 core Olympus, insieme alla tecnologia Spatial Multithreading proprietaria dell'azienda, e di un sistema di memoria LPDDR5X, che offre una larghezza di banda fino a 1,2 TB al secondo con un consumo energetico inferiore a 30 watt. Secondo il produttore, Vera può eseguire attività a una velocità 1,8 volte superiore rispetto ai processori x86 quando si lavora con applicazioni di intelligenza artificiale orientata agli agenti, come la compilazione di codice, l'esecuzione di Python, Java e la manipolazione di database.

Test indipendenti condotti da Phoronix, utilizzando benchmark selezionati da NVIDIA, hanno dimostrato che Vera compila un kernel Linux in 20 secondi (in una configurazione a singolo socket), offrendo un incremento prestazionale del 10% rispetto all'AMD EPYC 9575F operante a 5,0 GHz, come affermato sul blog di NVIDIA. Il fondatore di Phoronix, Michael Larabel, ha dichiarato che Vera "riesce a sfoderare una potenza di fuoco notevole, con una competitività nei confronti delle CPU Intel/AMD x86_64 che non ho mai visto in nessun altro processore ARM o non x86_64".

Tuttavia, va precisato che i benchmark utilizzati sono stati selezionati ed eseguiti dalla stessa NVIDIA. Finora non sono stati condotti test indipendenti.

Adozione iniziale sul mercato da parte di laboratori di intelligenza artificiale, fornitori di servizi su larga scala e aziende.

Tra i clienti di Vera figurano istituti di ricerca sull'intelligenza artificiale , aziende leader nel settore dell'infrastruttura IT e società finanziarie. In una dichiarazione rilasciata dalla presidente del NYSE, Lynn Martin, la borsa, che gestisce oltre 1.100 miliardi di messaggi al giorno, intende utilizzare Vera, insieme a Redpanda e Hewlett Packard Enterprise, per aumentare la capacità e ridurre la latenza.

Secondo James Bradbury, responsabile del settore calcolo di Anthropic, l'azienda sta valutando Vera per carichi di lavoro agentici ad alta intensità di CPU. "L'aumento della potenza di calcolo è un importante acceleratore per la crescita dei modelli", ha affermato Bradbury. "Siamo entusiasti di vedere Vera emergere come una componente promettente dell'ecosistema nella risoluzione di carichi di lavoro agentici."

Oracle Cloud Infrastructure prevede di diventare il primo hyperscaler a utilizzare Vera, con il vicepresidente esecutivo di OCI, Mahesh Thiagarajan, che lo definisce "la prossima frontiera del supercalcolo AI su larga scala".

Sul fronte della produzione hardware, Dell Technologies, HPE, Lenovo e Supermicro offriranno Vera in configurazioni server con CPU standalone. NVIDIA l'ha descritta come "la prima opzione CPU standard oltre x86" da parte dei principali OEM. Anche i produttori con sede a Taiwan, tra cui ASUS, Foxconn, GIGABYTE, Quanta Cloud Technology e Wistron, stanno realizzando sistemi.

Maggiore integrazione nell'intera infrastruttura di intelligenza artificiale di NVIDIA.

Vera si inserisce perfettamente nella visione di NVIDIA di un ecosistema completo per l'intelligenza artificiale. Vera funge da CPU host della piattaforma Vera Rubin, che si abbina alle GPU Rubin utilizzando NVLink-C2C di seconda generazione con una larghezza di banda di 1,8 TB/s. Inoltre, Vera fa parte della piattaforma BlueField-4 STX per quanto riguarda la rete e lo storage. Secondo Dealroom , Ian Buck, dirigente di NVIDIA, ha consegnato le prime unità Vera a clienti come Anthropic a San Francisco e SpaceXAI a Palo Alto.

La filiera di fornitura delle memorie ha reagito immediatamente. Secondo DIGITIMES, la decisione di NVIDIA di commercializzare Vera come chip separato crea una domanda di DRAM a basso consumo, mettendo ulteriormente sotto pressione la già precaria catena di fornitura dei chip di memoria.

Cosa tenere d'occhio con l'ingresso di Vera nella fase di implementazione.

I sistemi Vera saranno consegnati a partner e fornitori di servizi cloud nel terzo trimestre di quest'anno. Tuttavia, è necessario valutare alcuni aspetti, come la veridicità dei risultati dei benchmark indipendenti su una serie di applicazioni generiche rispetto alle affermazioni di NVIDIA in termini di prestazioni e la capacità del chip Olympus personalizzato di competere con il software x86 in termini di compatibilità applicativa. Al momento, però, una cosa è certa: NVIDIA non si accontenta più di possedere solo l'acceleratore. Vuole l'intera infrastruttura per i data center dedicati all'intelligenza artificiale.

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi unirti a loro ?

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto