maxwellLa scorsa settimana abbiamo parlato della GPU GM107, la prima della generazione "Maxwell", chiedendoci quale fosse il segreto della nuova architettura implementata da Nvidia per raggiungere un livello di efficienza così elevato.

Grazie a Videocardz scopriamo che le specifiche relative ai CUDA Core e alle TMU di questa GPU, riportate sia dal programma GPU-Z che da alcuni partner di Nvidia sulle confezioni delle schede GTX 750 Ti / GTX 750 , non sono corrette. Questo nonostante le rassicurazioni di TechPowerUp sul supporto al GM107 con l'ultima versione di GPU-Z.

L'architettura Maxwell ha un'organizzazione degli Streaming Multiprocessors diversa da Kepler. Nvidia chiama la nuova struttura con la sigla SMM (Streaming Multiprocessor Maxwell) der distinguerli degli SMX di Kepler.

Proviamo a capire cos'è cambiato. Il singolo SM non ha più un design monoblocco a 192 ALU e 16 TMU, ma 128 ALU e 8 TMU suddivisi su 4 sotto-blocchi. Nvidia controbilancia questa riduzione di unità con un incremento delle cache L1 per SM e della memoria condivisa. Attenendoci al grafico, scheduler e dispatch sono presenti su ogni sotto-blocco. Se non è solo un modo diverso di disegnare lo schema rispetto all'SMX questo significa che Maxwell ha 32 ALU/warp per scheduler.

smm smx

Salendo di livello notiamo che il GPC (Graphics Processing Clusters) non è più composto da 2 SM ma da 5 SM e, stando alle informazioni riportate da Videocardz, c'è stato un enorme aumento anche della cache L2 (2MB vs. 256KB del GK107). Se confermato questa dovrebbe essere un'altra grande novità delle GPU Maxwell rispetto a Kepler (tanto per dire: Big-Kepler ha 1.5MB di cache L2, Hawaii ha solo 1MB di L2 e, ricordiamo, GM107 è un solo chip di fascia medio bassa).

Maxwell GM107

(GM107: diagramma a blocchi) 

In sintesi, per tornare al discorso iniziale, il numero complessivo dei CUDA Core del GM107 non è 960 (5 x 192) ma 640 (5 x 128), idem per le TMU che non sono 80 (5 x 8) ma 40 ( 5x4 ). Clock, MC e ROP invece erano giuste.

Di seguito la tabella aggiornata con i valori corretti:

 

GTX 650 GTX 750 Ti GTX 660
ASIC GPU GK107 GM107
GK106
Processo produttivo 28 nm 28 nm 28nm
Generazione Kepler Maxwell Kepler
Dimensioni del die 118 mm2 148 mm2 221 mm2
N.Transistor 1.3 mld 1.87 mld 2.58 mls
Frequenza Core (default) 1058 MHz 1085 MHz 980 MHz
Frequenza Core (boost)    - 1163 MHz 1033 MHz
Frequenza Memoria 5000 MHz 54100 MHz 5400 MHz
GPC 1 1 3
Streaming Multiprocessor 2 5 5
ALU 384  640  960
TMUs 32 40 96
ROPs 16 16 24
Cache L2 256KB 2048KB (???) 348KB
Interfaccia memorie 128-bit 128-bit 192-bit
Quantitativo VRAM 1 GB 2 GB 2 GB
Connettore alimentazione AUX PCIe 6-pin SI NO  SI
TDP 65W 60W 140W

 

A questo punto possiamo dire che Maxwell non è un semplice aggiornamento di Kepler ma è un qualcosa di più. Purtroppo Nvidia non può ancora valorizzare tutto il potenziale della nuova architettura perchè è ancora legata al processo produttivo a 28nm. Ma la strada intrapresa, in relazione all'efficienza energetica, è quella giusta.