Il segreto di "Maxwell": Nvidia cambia gli Streaming Multiprocessors

Dettagli: Scritto da Michele Carasia; Categoria: Hardware; Pubblicato: 13 Febbraio 2014

maxwell La scorsa settimana abbiamo parlato della GPU GM107, la prima della generazione "Maxwell", chiedendoci quale fosse il segreto della nuova architettura implementata da Nvidia per raggiungere un livello di efficienza così elevato.

Grazie a Videocardz scopriamo che le specifiche relative ai CUDA Core e alle TMU di questa GPU, riportate sia dal programma GPU-Z che da alcuni partner di Nvidia sulle confezioni delle schede GTX 750 Ti / GTX 750 , non sono corrette. Questo nonostante le rassicurazioni di TechPowerUp sul supporto al GM107 con l'ultima versione di GPU-Z.

L'architettura Maxwell ha un'organizzazione degli Streaming Multiprocessors diversa da Kepler. Nvidia chiama la nuova struttura con la sigla SMM (Streaming Multiprocessor Maxwell) der distinguerli degli SMX di Kepler.

Proviamo a capire cos'è cambiato. Il singolo SM non ha più un design monoblocco a 192 ALU e 16 TMU, ma 128 ALU e 8 TMU suddivisi su 4 sotto-blocchi. Nvidia controbilancia questa riduzione di unità con un incremento delle cache L1 per SM e della memoria condivisa. Attenendoci al grafico, scheduler e dispatch sono presenti su ogni sotto-blocco. Se non è solo un modo diverso di disegnare lo schema rispetto all'SMX questo significa che Maxwell ha 32 ALU/warp per scheduler.

smm smx

Salendo di livello notiamo che il GPC (Graphics Processing Clusters) non è più composto da 2 SM ma da 5 SM e, stando alle informazioni riportate da Videocardz, c'è stato un enorme aumento anche della cache L2 (2MB vs. 256KB del GK107). Se confermato questa dovrebbe essere un'altra grande novità delle GPU Maxwell rispetto a Kepler (tanto per dire: Big-Kepler ha 1.5MB di cache L2, Hawaii ha solo 1MB di L2 e, ricordiamo, GM107 è un solo chip di fascia medio bassa).

(GM107: diagramma a blocchi)

In sintesi, per tornare al discorso iniziale, il numero complessivo dei CUDA Core del GM107 non è 960 (5 x 192) ma 640 (5 x 128), idem per le TMU che non sono 80 (5 x 8) ma 40 ( 5x4 ). Clock, MC e ROP invece erano giuste.

Di seguito la tabella aggiornata con i valori corretti:

	GTX 650	GTX 750 Ti	GTX 660
ASIC GPU	GK107	GM107	GK106
Processo produttivo	28 nm	28 nm	28nm
Generazione	Kepler	Maxwell	Kepler
Dimensioni del die	118 mm²	148 mm²	221 mm²
N.Transistor	1.3 mld	1.87 mld	2.58 mls
Frequenza Core (default)	1058 MHz	1085 MHz	980 MHz
Frequenza Core (boost)	-	1163 MHz	1033 MHz
Frequenza Memoria	5000 MHz	54100 MHz	5400 MHz
GPC	1	1	3
Streaming Multiprocessor	2	5	5
ALU	384	640	960
TMUs	32	40	96
ROPs	16	16	24
Cache L2	256KB	2048KB (???)	348KB
Interfaccia memorie	128-bit	128-bit	192-bit
Quantitativo VRAM	1 GB	2 GB	2 GB
Connettore alimentazione AUX PCIe 6-pin	SI	NO	SI
TDP	65W	60W	140W

A questo punto possiamo dire che Maxwell non è un semplice aggiornamento di Kepler ma è un qualcosa di più. Purtroppo Nvidia non può ancora valorizzare tutto il potenziale della nuova architettura perchè è ancora legata al processo produttivo a 28nm. Ma la strada intrapresa, in relazione all'efficienza energetica, è quella giusta.

Il segreto di "Maxwell": Nvidia cambia gli Streaming Multiprocessors

Commenti

Flash News & Press Release

ASUSTOR NAS e Roon: una sinergia perfetta per gli amanti della musica digitale

Overland-Tandberg rivoluziona l'archiviazione dei dati con il lancio di Intelligent iSCSI-SAS Bridge powered by ATTO

ASUSTOR introduce sui propri NAS la tecnologia WORM

La piattaforma RDX è la scelta ideale per le imprese e per i professionisti che desiderano proteggersi in modo efficace dai cy…

I NAS ASUSTOR supportano la condivisione di fino a tre stampanti USB simultaneamente

Sicurezza: i NAS ASUSTOR supportano ora anche il protocollo open source WireGuard

Xpanstor 4 aumenta la capacità di archiviazione dei NAS ASUSTOR e porta la loro flessibilità a un nuovo livello

Con l'innovativo selettore NVR di ASUSTOR identificare la soluzione più adatta alle proprie esigenze diventa semplice

La GeForce RTX 5090 costerà almeno 1800 Euro

AMD Ryzen 7 9800X3D: non ci saranno problemi di disponibilità

Il Socket LGA1851 di Intel potrebbe essere un "one shot"

Arrow Lake-S: un mix di processi produttivi

Il Power Limit 2 delle CPU Arrow Lake rimarrà elevato

carlToon