Come previsto, Nvidia ha presentato la nuova architettura Blackwell al GTC 2024. Con il chip B200 e la piattaforma GB200, il produttore entra in nuove sfere
Come previsto, lunedì sera Nvidia ha presentato la nuova architettura Blackwell allaGTC 2024 (GPU Technology Conference)in corso, promettendo di stabilire nuovi standard.
Le impressionanti specifiche tecniche (vedi sotto) suggeriscono che clienti importanti come Amazon e Microsoft, con le relative richieste e budget, faranno la fila da Nvidia per ottenere il maggior numero possibile di questi chip.
Le cose più importanti in breve
- Nvidia presenta la nuova architettura Blackwell per l’IA generativa alla GTC 2024.
- Il chip B200 sostituisce le ammiraglie H100 e GH100 e offre prestazioni ed efficienza energetica migliori.
La GPU è basata su un processo produttivo a 4 nm e dispone di 208 miliardi di transistor. - Il superchip GB200 combina processori Grace e GPU Blackwell e offre una potenza di calcolo estremamente elevata.
Dati tecnici di Nvidia B200
La GPU è stata sviluppata sulla base del processo produttivo 4NP, uno speciale processo di produzione a 4 nm progettato per Blackwell dal produttore di chip taiwanese TSMC.
Il B200 stesso è un progetto a doppio chip. I due chip integrati comunicano tramite un collegamento slide-to-die a una velocità fino a 10 TByte al secondo e non dovrebbero quindi presentare svantaggi rispetto al processo MCM (Multi Chip Module), utilizzato principalmente da AMD.
La scheda B200 contiene un totale di 208 miliardi di transistor Secondo Nvidia, la potenza di calcolo teorica è la seguente:- FP8: fino a 20 PetaFLOPS
- FP16: fino a 10 PetaFLOPS
- FP32: fino a 5 PetaFLOPS
Sul fronte della memoria, Nvidia B200 lavora con 192 GByte di memoria HBM3e, la cui larghezza di banda dovrebbe raggiungere gli 8 TByte/s.
“Grace Blackwell” come nuovo superchip
Il nuovo chip costituisce anche la base per il superchip “Grace Blackwell” chiamato GB200, che sarà utilizzato principalmente nel computer NVL72 di Nvidia e in soluzioni personalizzate.
Fedele al suo nome, il GB200 Grace Blackwell è una soluzione ibrida composta da un processore Grace con 72 core Neoverse V2 del produttore Arm e da due dei chip grafici B200 indicati – quindi un singolo chip GB200 ha quattro die in questo senso.
Nel computer NVL72 di cui sopra, 36 CPU Grace sono utilizzate insieme a 72 GPU Blackwell (e di conseguenza 144 die Blackwell), il che si traduce nei seguenti dati tecnici folli:
- Processore: 2.592 core ARM Neoverse V2
- Memoria: fino a 17 TByte di RAM LPDDR5X
- 72 GPU Blackwellcon 13,5 TByte di memoria HBM3e
- FP4 potenza di calcolo: fino a 1.440 PetaFLOPS
- FP8 potenza di calcolo: fino a 720 PetaFLOPS
- FP16 potenza di calcolo: fino a 360 PetaFLOPS
Grazie a NVLink, che promette una larghezza di banda fino a 130 TByte al secondo, il supercomputer NVL72 dovrebbe comportarsi come un singolo processore grafico massivo
Un totale di fino a 576 GPU può essere collegato in un dominio NVLink – secondo Huang, la potenza di calcolo totale dovrebbe essere sufficiente per elaborare modelli linguistici (LLM) di grandi dimensioni con trilioni di parametri.
Il consumo energetico ipotizzato è di conseguenza elevato: si dice che un singolo superchip GB200 richieda fino a 2.700 watt.
I primi clienti commerciali sono già in coda La piattaforma AI dovrebbe essere disponibile per i partner commerciali nel corso dell’anno. Nvidia cita esplicitamente cloud provider come AWS, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure, che stanno mostrando interesse per l’architettura Blackwell. Come spiega Huang, con Blackwell Nvidia sta affrontando il “lancio di maggior successo nella storia dell’azienda”.