Come previsto, alla GTC 2016 di San Jose Nvidia ha svelato la GPU GP100 basata sulla nuova architettura Pascal. Si tratta del più grande e del più potente chip grafico mai progettato dall'azienda americana, costruito con il nuovo processo produttivo a 16nm FinFET+ di TSMC.
GP100 ha una superficie di 610 millimetri quadrati ed integra 15.3 miliardi di transistor, contro gli 8mld di transistor presenti in GM200 (Maxwell, 600mm2) prodotto a 28m. Questi numeri potrebbero lasciare intendere un raddoppio interno dei Cuda Core, ma non è così: Nvidia ha riorganizzato gli Streaming Multiprocessor (SM) in blocchi da 64 (contro i 128 di Maxwell) in modo da poter inserire un maggiore numero di unità dedicate ai calcoli a doppia precisione (portato il rapporto DP/SP da 1/32 a 1/2) ed ha praticato una serie di ottimizzazioni architetturali (registri, LDS, ecc.) tutte mirate al GPU computing. Come risultato: GP100 ha "solo" 3584 Cuda Core (in realtà sarebbero 3840 CC; 4 SM sono di ridondanza), ovvero un mero +17% rispetto a GM200 (3072 CC), ma è in grado di generare una potenza in FP64 pari a 5.3 TFLOPS contro i 0.21 TFLOPS di Maxwell (+2400% !!!).
Ovviamente tutto lo spazio aggiuntivo non è solo occupato dalle unità FP64. Il dato più impressionante riguarda i file di registro, la cui grandezza passa da 6MB a 15MB (256KB per SM) proprio per supportare al meglio il calcolo parallelo. La cache L2 sale da 3 a 4MB e la memoria condivisa aumenta del 70%. Importante è anche l'occupazione del nuovo memory controller per memorie HBM2 con ampiezza da 4096-bit.
La GPU GP100 nasce per le schede Tesla di nuova generazione e porta, oltre alle memorie HBM2, la nuova tecnologia di connessione NVLINK (purtroppo di disponibile solo sulle piattaforme server IBM, nDA) ed il supporto ai calcoli "mixed precision" in FP16. Durante il keynote di apertura della GDC, Jen-Hsun Huang - CEO di Nvidia - ha mostrato la scheda professione Tesla P100 con GPU GP100 e 16GB di HBM2. La produzione in volumi è già iniziata e l'arrivo sul mercato è previsto a giugno.
Per quanto riguarda la versione consumer di GP100 non ci sono informazioni a riguardo. I costi proibitivi e lo specifico orientamento HPC rendono difficile l'inserimento di questo chip grafico in una soluzione della famiglia GeForce. Probabilmente un'alternativa a "Big-Pascal" arriverà sui desktop sotto forma di un'inedita declinazione (si parla di nome in codice GP102) con un'architettura gaming-oriented più vicina al GP104 che al GP100.