NVIDIA-gp100 homeCome previsto, alla GTC 2016 di San Jose Nvidia ha svelato la GPU GP100 basata sulla nuova architettura Pascal. Si tratta del più grande e del più potente chip grafico mai progettato dall'azienda americana, costruito con il nuovo processo produttivo a 16nm FinFET+ di TSMC.

GP100 ha una superficie di 610 millimetri quadrati ed integra 15.3 miliardi di transistor, contro gli 8mld di transistor presenti in GM200 (Maxwell, 600mm2) prodotto a 28m. Questi numeri potrebbero lasciare intendere un raddoppio interno dei Cuda Core, ma non è così: Nvidia ha riorganizzato gli Streaming Multiprocessor (SM) in blocchi da 64 (contro i 128 di Maxwell) in modo da poter inserire un maggiore numero di unità dedicate ai calcoli a doppia precisione (portato il rapporto DP/SP da 1/32 a 1/2) ed ha praticato una serie di ottimizzazioni architetturali (registri, LDS, ecc.) tutte mirate al GPU computing. Come risultato: GP100 ha "solo" 3584 Cuda Core (in realtà sarebbero 3840 CC; 4 SM sono di ridondanza), ovvero un mero +17% rispetto a GM200 (3072 CC), ma è in grado di generare una potenza in FP64 pari a 5.3 TFLOPS contro i 0.21 TFLOPS di Maxwell (+2400% !!!).

nv-GP100-SM-diagram nv-GP100-Block-Diagram

Ovviamente tutto lo spazio aggiuntivo non è solo occupato dalle unità FP64. Il dato più impressionante riguarda i file di registro, la cui grandezza passa da 6MB a 15MB (256KB per SM) proprio per supportare al meglio il calcolo parallelo. La cache L2 sale da 3 a 4MB e la memoria condivisa aumenta del 70%. Importante è anche l'occupazione del nuovo memory controller per memorie HBM2 con ampiezza da 4096-bit.

Pascal-miracol

La GPU GP100 nasce per le schede Tesla di nuova generazione e porta, oltre alle memorie HBM2, la nuova tecnologia di connessione NVLINK (purtroppo di disponibile solo sulle piattaforme server IBM, nDA) ed il supporto ai calcoli "mixed precision" in FP16. Durante il keynote di apertura della GDC, Jen-Hsun Huang - CEO di Nvidia - ha mostrato la scheda professione Tesla P100 con GPU GP100 e 16GB di HBM2. La produzione in volumi è già iniziata e l'arrivo sul mercato è previsto a giugno.

P100 SXM2

P100 SXM2 back

Per quanto riguarda la versione consumer di GP100 non ci sono informazioni a riguardo. I costi proibitivi e lo specifico orientamento HPC rendono difficile l'inserimento di questo chip grafico in una soluzione della famiglia GeForce. Probabilmente un'alternativa a "Big-Pascal" arriverà sui desktop sotto forma di un'inedita declinazione (si parla di nome in codice GP102) con un'architettura gaming-oriented più vicina al GP104 che al GP100.

 

Tesla Products Tesla M40 Tesla P100
GPU GM200 (Maxwell) GP100 (Pascal)
SMs 24 56
TPCs 24 28
FP32 CUDA Cores / SM 128 64
FP32 CUDA Cores / GPU 3072 3584
FP64 CUDA Cores / SM 4 32
FP64 CUDA Cores / GPU 96 1792
Base Clock 948 MHz 1328 MHz
GPU Boost Clock 1114 MHz 1480 MHz
FP64 GFLOPs 213 5304
Texture Units 192 224
Memory Interface 384-bit GDDR5 4096-bit HBM2
Memory Size Up to 24 GB 16 GB
L2 Cache Size 3072 KB 4096 KB
Register File Size / SM 256 KB 256 KB
Register File Size / GPU 6144 KB 14336 KB
TDP 250 Watts 300 Watts
Transistors 8 billion 15.3 billion
GPU Die Size 601 mm² 610 mm²
Manufacturing Process 28-nm 16-nm