La scorsa settimana abbiamo parlato della GPU GM107, la prima della generazione "Maxwell", chiedendoci quale fosse il segreto della nuova architettura implementata da Nvidia per raggiungere un livello di efficienza così elevato.
Grazie a Videocardz scopriamo che le specifiche relative ai CUDA Core e alle TMU di questa GPU, riportate sia dal programma GPU-Z che da alcuni partner di Nvidia sulle confezioni delle schede GTX 750 Ti / GTX 750 , non sono corrette. Questo nonostante le rassicurazioni di TechPowerUp sul supporto al GM107 con l'ultima versione di GPU-Z.
L'architettura Maxwell ha un'organizzazione degli Streaming Multiprocessors diversa da Kepler. Nvidia chiama la nuova struttura con la sigla SMM (Streaming Multiprocessor Maxwell) der distinguerli degli SMX di Kepler.
Proviamo a capire cos'è cambiato. Il singolo SM non ha più un design monoblocco a 192 ALU e 16 TMU, ma 128 ALU e 8 TMU suddivisi su 4 sotto-blocchi. Nvidia controbilancia questa riduzione di unità con un incremento delle cache L1 per SM e della memoria condivisa. Attenendoci al grafico, scheduler e dispatch sono presenti su ogni sotto-blocco. Se non è solo un modo diverso di disegnare lo schema rispetto all'SMX questo significa che Maxwell ha 32 ALU/warp per scheduler.
Salendo di livello notiamo che il GPC (Graphics Processing Clusters) non è più composto da 2 SM ma da 5 SM e, stando alle informazioni riportate da Videocardz, c'è stato un enorme aumento anche della cache L2 (2MB vs. 256KB del GK107). Se confermato questa dovrebbe essere un'altra grande novità delle GPU Maxwell rispetto a Kepler (tanto per dire: Big-Kepler ha 1.5MB di cache L2, Hawaii ha solo 1MB di L2 e, ricordiamo, GM107 è un solo chip di fascia medio bassa).
(GM107: diagramma a blocchi)
In sintesi, per tornare al discorso iniziale, il numero complessivo dei CUDA Core del GM107 non è 960 (5 x 192) ma 640 (5 x 128), idem per le TMU che non sono 80 (5 x 8) ma 40 ( 5x4 ). Clock, MC e ROP invece erano giuste.
Di seguito la tabella aggiornata con i valori corretti:
|
GTX 650 | GTX 750 Ti | GTX 660 |
ASIC GPU | GK107 | GM107 |
GK106 |
Processo produttivo | 28 nm | 28 nm | 28nm |
Generazione | Kepler | Maxwell | Kepler |
Dimensioni del die | 118 mm2 | 148 mm2 | 221 mm2 |
N.Transistor | 1.3 mld | 1.87 mld | 2.58 mls |
Frequenza Core (default) | 1058 MHz | 1085 MHz | 980 MHz |
Frequenza Core (boost) | - | 1163 MHz | 1033 MHz |
Frequenza Memoria | 5000 MHz | 54100 MHz | 5400 MHz |
GPC | 1 | 1 | 3 |
Streaming Multiprocessor | 2 | 5 | 5 |
ALU | 384 | 640 | 960 |
TMUs | 32 | 40 | 96 |
ROPs | 16 | 16 | 24 |
Cache L2 | 256KB | 2048KB (???) | 348KB |
Interfaccia memorie | 128-bit | 128-bit | 192-bit |
Quantitativo VRAM | 1 GB | 2 GB | 2 GB |
Connettore alimentazione AUX PCIe 6-pin | SI | NO | SI |
TDP | 65W | 60W | 140W |
A questo punto possiamo dire che Maxwell non è un semplice aggiornamento di Kepler ma è un qualcosa di più. Purtroppo Nvidia non può ancora valorizzare tutto il potenziale della nuova architettura perchè è ancora legata al processo produttivo a 28nm. Ma la strada intrapresa, in relazione all'efficienza energetica, è quella giusta.