GP100 (Big-Pascal): la super GPU di Nvidia solo per l'HPC

Dettagli: Scritto da Michele Carasia; Categoria: Hardware; Pubblicato: 06 Aprile 2016

Come previsto, alla GTC 2016 di San Jose Nvidia ha svelato la GPU GP100 basata sulla nuova architettura Pascal. Si tratta del più grande e del più potente chip grafico mai progettato dall'azienda americana, costruito con il nuovo processo produttivo a 16nm FinFET+ di TSMC.

GP100 ha una superficie di 610 millimetri quadrati ed integra 15.3 miliardi di transistor, contro gli 8mld di transistor presenti in GM200 (Maxwell, 600mm2) prodotto a 28m. Questi numeri potrebbero lasciare intendere un raddoppio interno dei Cuda Core, ma non è così: Nvidia ha riorganizzato gli Streaming Multiprocessor (SM) in blocchi da 64 (contro i 128 di Maxwell) in modo da poter inserire un maggiore numero di unità dedicate ai calcoli a doppia precisione (portato il rapporto DP/SP da 1/32 a 1/2) ed ha praticato una serie di ottimizzazioni architetturali (registri, LDS, ecc.) tutte mirate al GPU computing. Come risultato: GP100 ha "solo" 3584 Cuda Core (in realtà sarebbero 3840 CC; 4 SM sono di ridondanza), ovvero un mero +17% rispetto a GM200 (3072 CC), ma è in grado di generare una potenza in FP64 pari a 5.3 TFLOPS contro i 0.21 TFLOPS di Maxwell (+2400% !!!).

Ovviamente tutto lo spazio aggiuntivo non è solo occupato dalle unità FP64. Il dato più impressionante riguarda i file di registro, la cui grandezza passa da 6MB a 15MB (256KB per SM) proprio per supportare al meglio il calcolo parallelo. La cache L2 sale da 3 a 4MB e la memoria condivisa aumenta del 70%. Importante è anche l'occupazione del nuovo memory controller per memorie HBM2 con ampiezza da 4096-bit.

La GPU GP100 nasce per le schede Tesla di nuova generazione e porta, oltre alle memorie HBM2, la nuova tecnologia di connessione NVLINK (purtroppo di disponibile solo sulle piattaforme server IBM, nDA) ed il supporto ai calcoli "mixed precision" in FP16. Durante il keynote di apertura della GDC, Jen-Hsun Huang - CEO di Nvidia - ha mostrato la scheda professione Tesla P100 con GPU GP100 e 16GB di HBM2. La produzione in volumi è già iniziata e l'arrivo sul mercato è previsto a giugno.

Per quanto riguarda la versione consumer di GP100 non ci sono informazioni a riguardo. I costi proibitivi e lo specifico orientamento HPC rendono difficile l'inserimento di questo chip grafico in una soluzione della famiglia GeForce. Probabilmente un'alternativa a "Big-Pascal" arriverà sui desktop sotto forma di un'inedita declinazione (si parla di nome in codice GP102) con un'architettura gaming-oriented più vicina al GP104 che al GP100.

Tesla Products	Tesla M40	Tesla P100
GPU	GM200 (Maxwell)	GP100 (Pascal)
SMs	24	56
TPCs	24	28
FP32 CUDA Cores / SM	128	64
FP32 CUDA Cores / GPU	3072	3584
FP64 CUDA Cores / SM	4	32
FP64 CUDA Cores / GPU	96	1792
Base Clock	948 MHz	1328 MHz
GPU Boost Clock	1114 MHz	1480 MHz
FP64 GFLOPs	213	5304
Texture Units	192	224
Memory Interface	384-bit GDDR5	4096-bit HBM2
Memory Size	Up to 24 GB	16 GB
L2 Cache Size	3072 KB	4096 KB
Register File Size / SM	256 KB	256 KB
Register File Size / GPU	6144 KB	14336 KB
TDP	250 Watts	300 Watts
Transistors	8 billion	15.3 billion
GPU Die Size	601 mm²	610 mm²
Manufacturing Process	28-nm	16-nm

GP100 (Big-Pascal): la super GPU di Nvidia solo per l'HPC

Commenti

Flash News & Press Release

ASUSTOR NAS e Roon: una sinergia perfetta per gli amanti della musica digitale

Overland-Tandberg rivoluziona l'archiviazione dei dati con il lancio di Intelligent iSCSI-SAS Bridge powered by ATTO

ASUSTOR introduce sui propri NAS la tecnologia WORM

La piattaforma RDX è la scelta ideale per le imprese e per i professionisti che desiderano proteggersi in modo efficace dai cy…

I NAS ASUSTOR supportano la condivisione di fino a tre stampanti USB simultaneamente

Sicurezza: i NAS ASUSTOR supportano ora anche il protocollo open source WireGuard

Xpanstor 4 aumenta la capacità di archiviazione dei NAS ASUSTOR e porta la loro flessibilità a un nuovo livello

Con l'innovativo selettore NVR di ASUSTOR identificare la soluzione più adatta alle proprie esigenze diventa semplice

La GeForce RTX 5090 costerà almeno 1800 Euro

AMD Ryzen 7 9800X3D: non ci saranno problemi di disponibilità

AMD presenta le CPU Ryzen 5 5600XT e Ryzen 5 5600T

Robert Hallock spiega perché Arrow Lake non va come dovrebbe nel gaming

ASUSTOR annuncia Flashstor Gen2: per la prima volta SoC AMD invece di Intel!

carlToon