Pagine

Con la presentazione della GPU GK104 basata su architettura Kepler, Nvidia ha dimostrato di essere in grado di realizzare un chip grafico potente e al tempo stesso efficiente. Grazie alla GeForce GTX 680 (GK104) la Casa di Santa Clara ha spodestato la Radeon HD 7970 (Tahiti XT) di AMD dal trono delle schede video a singola GPU più veloci in ambito gaming e con la GTX 690 (dual-GK104) ha imposto in solitaria la propria leadership tra le soluzioni a doppia GPU di nuova generazione, costringendo la rivale a rivedere il progetto - e rinviare il lancio - della HD7990.

In ordine temporale l'ultima scheda video della famiglia GTX 600 a sfruttare il design della GPU GK104 è la GeForce GTX 670, modello oggetto dell'analisi odierna. Si tratta di un prodotto che Nvidia definisce di fascia performance ma che dall'alto dei sui 400 Euro rientra a nostro avviso ancora nel segmento high-end. Specifiche tecniche alla mano la GTX 670 si pone un gradino più in basso della GTX 680 mentre come prezzo raccomandato sfida direttamente la Radeon HD 7950 di AMD.

S5004728

Rispetto alla precedente generazione GTX 500 le differenze "estetiche" tra la GTX 670 e la 680 sono più marcate di quelle che c'erano tra la GTX 570 e la GTX 580: le schede adesso utilizzano due PCB completamente diversi ma paradossalmente il divario prestazionale "teorico" si è accorciato. Si tratta di una precisa scelta di Nvidia dettata dal fatto che le caratteristiche del "piccolo" chip GK104, compresa flessibilità e margini di divisione, sono ben diversi da quelle del mastodontico GF110.

Questa recensione contiene, oltre alla prova della GTX 670 reference di Nvidia, anche i test in SLI effettuati affiancando una seconda scheda video GTX 670 al fine di valutare le prestazioni velocistiche nei confronti dei sistemi multi-GPU di AMD basati su schede HD 7950.


Il sample fornitoci da Nvidia ha una copertura completamente in plastica nera che nasconde il radiatore vero e proprio e fa da convogliatore all'aria soffiata dalla ventola radiale. L'ingombro è di due slot PCI e la lunghezza della scheda è pari a 24 centimetri, la GTX 670 è più corta della GTX 680 di quasi  1,5 centimetri.

S5004725

Osservando il retro scopriamo che in realtà il PCB è molto più piccolo, la lunghezza è di appena 17 centimetri, con il restante spazio occupato da un prolungamento in plastica che fa da base all'ancoraggio a tre punti della ventola. I due connettori di alimentazione PCIe a 6 pin sono posizionati all'estremità superiore del circuito stampato. Sempre sul retro trovano posto 4 degli 8 chip di memoria video GDDR5, scelta insolita ma che consente di risparmiare prezioso spazio sulla parte antreiore del PCB perchè semplifica le saldature e le interconnessioni. 

S5004733

La zona posteriore presenta intorno al foro della ventola un piccolo avvallamento che facilitare l'aspirazione dell'aria anche in caso di configurazioni SLI.

S5004739

Sulla parte anteriore troviamo la griglia per lo sfogo dell'aria calda affiancata da due connettori DVI, un connettore HDMI 1.4a e un connettore Display Port 1.2. Al pari della GTX 680 anche la GTX 670 è in grado di pilotare fino a  4 monitor contemporaneamente e supporta le tecnologie Nvidia Surround e Nvidia 3D Vision Surround su scheda singola.

S5004738

 E' possibile rimuovere completamente la copertura in plastica separando il sistema di raffreddamento "passivo" da quello "attivo".

S5004741

Il PCB è più da scheda mainstream che da soluzione high-end/performance. La sezione di alimentazione a 4+2 fasi (GPU + Mem) è stata spostata in avanti ed è pilotata dal controller OnSemi NCP5392P. Si tratta di un'abbinamento che non lascia spazio alla regolazione via software avanzata e che consente a Nvidia di risparmiare sulla componentistica e sul prezzo dell'integrazione/assemblaggio.

S5004762

Il sistema di raffreddamento è molto semplice. Parliamo di un dissipatore compatto, con base in rame ed alette in alluminio, posto a diretto contatto con la GPU e di un un mini heatsink dedicato alla sezione VRM. Anche i chip di memoria anteriore, così come quelli posteriori, sono completamente scoperti.  

S5004752

S5004754

 


Il chip grafico GK104 che equipaggia la GTX 670 è lo stesso della GTX 680, realizzato da TSMC con il processo produttivo a 28nm e composto da  3.54 miliardi di transistor integrati in un die di appena 294mm^2. Nvidia ha disabilitato un modulo SMX (Streaming Multiprocessor) pescando dal bacino delle GPU che non hanno superato tutto il binning process per rientrare nelle specifiche della GTX 680. Considerando che un singolo modulo SMX è composto da 192 CUDA core e da 16 TMUs, il numero totale degli shader della GTX 670 è sceso da 1536 a 1344 unità e quello delle texture mapping da 128 a 112. Tipicamente Nvidia accompagna quest'operazione con un taglio delle ROPs e del controller di memoria per differenziare maggiormente i modelli derivati dallo stesso chip ma non è il caso della GTX 670, visto che tutto il back-end è praticamente lo stesso della sorella maggiore. Troviamo le 32 Raster Operation Pipeline con 512KB di cache L2 e tutti e 4 i memory controller GDDR5 da 64-bit (256-bit d'ampiezza totale).

GTX670 arch


Dal punto di vista delle frequenze di clock la riduzione ha interessato esclusivamente la GPU, con il Base ed il Boost clock abbassati rispettivamente da 1006MHz a 915MHz e da 1059MHz a 980MHz. La frequenza degli 8 chip GDDR5, dalla capacità di 256MB ciascuno (2048 MB di VRAM totale), è rimasta invariata: pari a 6008MHz effettivi.

Come potenza computazionale Nvidia ha tagliato complessivamente circa il 10~13% del totale messo a disposizione della GTX 680, ma questo ha consentito di diminuire il TDP di 25W: passando da 195W a 170W.

Prima di procedere con l'elenco delle feature della GTX 670 ricordiamo, a titolo informativo, che la disattivazione del modulo SMX è avvenuta a livello hardware mediate laser-cut, pertanto non è possibile abilitare gli shader mancanti flashando il BIOS con quello della GTX 680. Quest'ultima operazione può essere effettuata sui modelli non reference che utilizzano lo stesso PCB, ma dà come unico risultato il riallineamento delle frequenze di Base e Boost Clock tra la GTX 670 e la GTX 680.


La GTX 670 ripropone tutte le feature software e hardware introdotte da Nvidia con la GTX 680 e con l'architettura Kepler. L'elenco comprende:

  • GPU Boost
  • Adaptive VSync
  • FXAA e TXAA
  • Bindless Textures
  • NVENC

GPU Boost 
Al pari delle moderne CPU Intel ed AMD, NVIDIA ha deciso di regalare alle sue nuove GPU un sistema di boost prestazionale automatico che incrementa la frequenza di funzionamento del chip, quando esiste la possibilità di farlo. L'idea è sempre la stessa: fissato un limite massimo per la potenza assorbita, quando il caso reale fa si che non lo si raggiunga, la GPU ha uno "spazio" a disposizione per incrementare le sue prestazioni.

gpu-boost-0

In parole povere, NVIDIA ha fissato un limite massimo per la potenza assorbita da questa scheda impostando un determinato TDP (thermal design power) e su questo ha stabilito un valore di frequenza nominale, pari a 915MHz, per la GTX 670. Questi dati implicano che, a quella frequenza e con una determinata tensione di funzionamento, la massima dissipazione del chip grafico deve essere quella indicata dal TDP.

Se però ci mettiamo in un caso pratico di un gioco che sta girando, non sempre tutte le unità del chip grafico sono coinvolte e, anche se la frequenza è quella massima possibile di 915MHz, la tensione è quella prevista, non è detto che i consumi del chip siano quelli massimi imposti dal TDP. In tali casi è dunque possibile incrementare la frequenza di funzionamento e se necessario anche la tensione per ottenere maggiori prestazioni.

Il funzionamento deve essere ovviamente dinamico (se fosse stata impostata una frequenza di funzionamento superiore fissa sarebbe stato necessario innalzare il limite di TDP) e controllato in real time. Questo è proprio quanto fa NVIDIA con Kepler nel quale è stata integrata una circuiteria hardware che continuamente controlla i consumi della GPU, evitando perciò di dover ricorrere a specifici (e statici) profili per ogni applicazione.

gpu-boost

Dal clock di base in modalità 3D di 915MHz, le schede GeForce GTX 670 possono così raggiungere un “Boost Clock” di almeno 980MHz (nel momento in cui i consumi dell'applicazione che sta girando lo permettono). Il massimo clock raggiunto potrebbe essere però superiore a questo se la GPU ha ancora spazio a disposizione per salire. Il produttore afferma di aver osservato incrementi anche fino ad 1,08GHz.

GPU Boost, infine, è pienamente compatibile con le pratiche di overclock. Per aumentare la frequenza di base della GPU, sia nel caso in cui venga effettuato dai partners AIB sia quando venga effettuato dall'utente finale utilizzando uno dei tanti tool software a disposizione, è necessario prima modificare il target di potenza della GPU che, a quel punto, risucirà a raggiungere anche più elevati valori di Boost Clock. Il funzionamento è molto simile a quello che incontriamo con le schede grafiche della rivale AMD.

gpu-boost-2 

Adaptive VSync
Per risolvere i problemi di qualità delle immagini dovuti al sincronismo fra il framerate ed il refresh dei display, NVIDIA ha ideato una tecnologia indicata come Adaptive VSync, la quale risulta disponibile per tutte le schede grafiche GeForce grazie ai nuovi drivers della serie 300. Il problema dello stuttering, dovuto al VSync, si presenta con determinati videogame ed in determinate situazioni: purtroppo non è risolvibile in maniera definitiva attivando o disattivando il VSync dai drivers della scheda grafica come si fa ormai da sempre.

adapt1

La disattivazione del VSync apporta i maggiori benefici solo quando il framerate è inferiore a 60 frame al secondo: così facendo si evita che la sincronizzazione salti di colpo da 60Hz a 30Hz o a valori inferiori (multipli di 60). Quando però il framerate è superiore a 60, mantenere il VSync disattivato crea fastidiose linee orizzontali che risultano maggiormente visible all'aumentare degli fps. In questo caso sarebbe perciò meglio avere il VSync attivato.

 adapt2

NVIDIA ha dunque pensato di rendere dinamica l'attivazione e la disattivazione del VSync attraverso la tecnologia Adaptive VSync. Quando il framerate scende sotto i 60 frame al secondo il VSync viene disattivato mentre viene attivato quando sale sopra i 60 fps. Nel pannello di controllo dei drivers NVIDIA esistono due modalità per Adaptive VSync (Adaptive e Adaptive (half refresh rate)) che hanno come limite 60Hz e 30Hz.

adapt3

Due nuove tecniche di AA: FXAA e TXAA
Quello delle tecniche di AntiAliasing è un terreno di discussione ancora molto fertile nonostante se ne parli e lo si affronti ormai da anni. La tecnica indicata come FXAA è già disponibile all'interno di alcuni giochi e, vista la sua indubbia efficienza, NVIDIA ha pensato di supportarla al meglio implementandola all'interno dei drivers (questo permette di applicarla a qualunque gioco).

La tecnica di FXAA è basata su un filtro di pixel shading applicato alla fine del processo di creazione delle scene assieme ad altri filtri di post processing come quelli di motion blur o bloom. I vantaggi sono relativi sia alle prestazioni che all'uso della memoria rispetto alle tecniche di multi-sample anti-aliasing (MSAA) e, come se non bastasse, il filtro permette di agire sia sull'edge aliasing che sull'aliasing per single-pixel e sub-pixel con una riduzione importante dello shader aliasing. Possiamo affermare che la qualità del filtro FXAA è simile a quella della tecnica MSAA 4x al costo di un MSAA 2x.

Nei drivers della serie 300 è supportata la modalità FXAA che rispecchia un mix delle tecniche FXAA 1 (disponibile ad esempio in Age of Conan, F.E.A.R.3 e Duke Nukem Forever) e FXAA 3 (Battlefield 3) che fornisce una migliore combinazione fra performance e qualità delle immagini e funziona con applicazioni DirectX 9, DirectX 10, DirectX 11 e OpenGL. Il mix proposto da NVIDIA migliora la risposta sul testo rispetto all'FXAA 1 e la qualità delle immagini rispetto all'FXAA 3 che però risulta a sua volta superiore su HUD e testo.

La tecnica di TXAA è invece del tutto nuova ed è stata progettata per avvantaggiarsi in pieno delle performance delle GeForce GTX 680/670 con high FP16 texture. TXAA è un insieme di filtri di anti-aliasing hardware, stadi custom di CG AA resolve "film style" e un componente temporale (applicato solo nel caso di TXAA 2x). In sostanza il TXAA è un resolve filter di elevata qualità progettato per funzionare correttamente con la pipeline di post processing HDR.

TXAA è dipsonibile in due modalità, TXAA 1 e TXAA 2. Il primo offre una qualità visiva simile a quella di una tecnica di MSAA 8x con un pegno prestazionale vicino a quello di un MSAA 2x; il TXAA 2 costa quanto un MSAA 4x ma la qualità è superiore a quella di un MSAA 8x.

fxaa

I primi giochi ad utilizzare le tecniche di TXAA saranno disponibili entro l'anno ed includeranno: MechWarrior Online, Secret World, Eve Online, Borderlands 2, Unreal 4 Engine, BitSquid, Slant Six Games e Crytek.

Bindless Texture
Finora la gestione delle texture è stata legata ad una tabella di riferimenti che, con le DirectX 11, permette di utilizzare 128 slot e dunque altrettante texture simultaneamente. Questo numero è esattamete lo stesso che troviamo nelle architetture Fermi mentre con Kepler e le bindless texture, è possibile utilizzare contemporaneamente quante texture si desidera (il limite è spostato ad oltre un milione) perché lo shader può referenziare le texture direttamente in memoria.

bt

Le bindless texture sono per ora utilizzabili solo con applicazioni OpenGL ma si prevede che essere saranno disponibili anche con le DirectX in maniera nativa o attraverso una API NVIDIA (NVAPI).

NVENC 
All'interno di Kepler NVIDIA ha integrato un apposito modulo per la gestione in hardware della codifica dei video H.264. NVENC, che ricorda da vicino la tecnologia Intel Quick Sync Video, permette di effettuare queste operazioni con consumi decisamente ridotti e con velocità fino a 8x rispetto al video in real time: ciò significa che, se dovete codificare un video di 32 minuti vi saranno necessari appena 4 minuti.

In precedenza, con architettura CUDA based, la stessa operazione poteva essere effettuata da un programma software capace di sfruttare i CUDA Core che, nonostante l'eccezionale incremento prestazionale rispetto ad una CPU tradizionale, non risulta efficiente quanto il nuovo modulo di Kepler. Questo offre prestaizoni 4 volte superiori con consumi inferiori. In aggiunta NVENC può lavorare in parallelo con un encoder CUDA senza avere rispercussioni sulle prestazioni (tranne nel caso i cui qualche algoritmo di pre-processing richiede CUDA per il suo funzionamento).

NVENC supporta i profili H.264 Base, Main ed High Profile Level 4.1 (come nello standard Blu-ray), supporta la codifica MVC (Multiview Video Coding) per i video stereoscopici usati nei Blu-ray 3D e permette di codificare video fino alla risoluzione di 4096x4096 pixel. I possibili utilizzi di NVENC riguardano la realizzazione di videoconferenze HD su notebook mainstream, l'invio di contenuti in alta definizione da un PC desktop verso schermi TV attraverso una rete wireless o il semplice authoring di dischi Blu-ray.


Riassumiamo nella tabella seguente le caratteristiche tecniche della nuova VGA NVIDIA confrontate con quelle di altri modelli già noti.

Caratteristiche tecniche schede video

GeForce GTX 580

GeForce  GTX 670

GeForce GTX 680

Radeon HD 7950

Radeon HD 7970

Sigla GPU

GF110

 

GK104

GK104

Tahiti PRO

Tahiti XT

Numero ALU/shader

512

1344

1536

1792

2048

Processo produttivo

40nm

28nm

28nm

28nm

28nm

Transistor

~3 miliardi

3,54 miliardi

3,54 miliardi

4,31 miliardi

4,31 miliardi

Dimensioni del die

520mm2

294mm2

294mm2

365mm2

365mm2

Frequenza (boost) GPU

772MHz

915 (980)MHz

1006 (1058)MHz

800MHz

925MHz

Frequenza shader

1544MHz

915MHz

1006MHz

800MHz

925MHz

Interfaccia memorie

384-bit

256-bit

256-bit

384-bit

384-bit

Frequenza memorie

1000MHz

1502MHz

1502MHz

1250MHz

1375MHz

Freq. mem. effettiva

4GHz

6,002GHz

6,008GHz

5GHz

5,5GHz

Tipo di memoria

GDDR5

GDDR5

GDDR5

GDDR5

GDDR5

Banda di memoria

192GB/s

192,26GB/s

192,26GB/s

240GB/s

264GB/s

Quantità memoria

1536MB

2048MB

2048MB

3072MB

3072MB

Interfaccia

PCIe 2.1

PCIe 3.0

PCIe 3.0

PCIe 3.0

PCIe 3.0

Alimentazione supplementare

-1x6-pin
-1x8-pin

2x6-pin

2x6-pin

2x6-pin

-1x6-pin
-1x8-pin

Numero slot occupati

2

2

2

2

2

TDP

244W

170W

~250W

~200W

~250W

Specifiche rilevate da GPU-Z:

screen GPU-z 

(NVIDIA GeForce GTX 670)

SLI

(NVIDIA GeForce GTX 670 in SLI)

Nella tabella seguente abbiamo indicato le frequenze di clock di GPU e memorie video ed i voltaggi di alimentazione GPU in modalità Desktop 2D e Load 3D.

Frequenze e tensioni (NVIDIA GeForce GTX 670)
Freq. GPU
(MHz)
Freq. Memorie
(MHz)
Voltaggio GPU
(V)
Desktop 2D 324 648 0,987
Load 3D 914~1084* 6008 1,037~1,175

 *il valore di GPU Boost indicato da Nvidia è di 980MHz


I test sulle schede grafiche sono eseguiti applicando scrupolosamente sempre le stesse condizioni di prova al fine di garantire una perfetta comparabilità degli stessi e la ripetibilità, quale requisito essenziale di qualunque test. Nella pratica scegliamo le sequenze che meglio si adattano alle nostre condizioni di prova, preferendo i titoli che contengono al loro interno un sistema di benchmark grazie al quale è facile escludere eventuali errori umani nelle misurazioni.

I test sono ripetuti per tre volte e nel momento in cui la varianza fra un risultato e l'altro dovesse risultare troppo elevata, il test viene ulteriormente ripetuto fino a scartare le cause che hanno determinato il risultato non conforme. Il sistema utilizzato include solo i componenti strettamente necessari mentre il sistema operativo è installato di fresco ed i software sono limitati ai giochi utilizzati per le prove con i rispettivi tool di benchmark.

La configurazione di prova include i seguenti componenti:

Sistema di prova
Scheda madre Intel DX79 LGA 2011
Processore Intel Core i7-3960X @4.2GHz
Memorie 8GB DDR3 @1600MHz
Hard disk Hitachi 500GB SATA2
Alimentatore Enermax MaxRevo 1350W
Sistema operativo Windows 7 Ultimate 64-bit

 Il sistema installato e pronto per i test:

setup

(GeForce GTX 670)

setup sli

(GeForce GTX 670 in SLI)

I driver utilizzati sono i GeForce 301.42 ufficiali.

Il confronto con le altre schede è stato effettuato mediante la nostra suite di benchmark (test sintetici e giochi) alla risoluzione di 1920x1080 per la singola GTX 670 ed a 2048x1536 per le configurazioni single e multi-GPU.


3DMark11

Benchmark sintetico sviluppato da Futuremark per testare le potenzialità di rendering 3D delle moderne GPU di AMD e nVidia compatibili con le DirectX11. Il test supporta l´illuminazione volumetrica, la tessellation, la profondità di campo e gli effetti di post processing, oltre alla simulazione della fisica. 

Performance Preset

3d p

Sensibilmente più veloce lo SLI di GTX 670 rispetto al CF di HD 7950, con la singola GTX 670 che riesce a distanziare persino la top di gamma HD 7970 di AMD.

Extreme Preset

3d e

 Salendo di risoluzione e di dettagli lo scenario al 3DMark 11 non cambia.


Unigine Heaven 2.5

Versione 2.5 del benchmark 3D "Heaven" basato sull´omonimo motore grafico proprietario Unigine  in grado di sfruttare le API  DirectX 11. Nelle nostre prove abbiamo cercato di evidenziare le differenze prestazionali con i seguenti settaggi della Tessellation: Disabled, Normal ed Extreme.

Tessellation: Disabled

u off

Tessellation: Normal

u n

Tessellation: Extreme

u e

 La GTX 670 è costantemente d'avanti alla HD 7970, con il divario che cresce leggeremente aumentando il livello di tessellation. 


Alien vs. Predator

Alien vs. Predator: la versione originale progettata per console Atari subisce una profonda rivisitazione per essere adattata a sistemi DirectX 11, API delle quali sfrutta in particolare effetti SSAO (Screen Space Ambient Occlusion), di ombre dinamiche e di smooting delle curve dell´alieno.

1920x1080 (Single)

avp

avp aa


In AvP la scheda non riesce più a superare la HD 7970 ma s'impone sempre sulla HD 7950 anche con l'AA al massimo.

2048x1536 (Single e SLI)

2 avp

2 avp_aa

La configurazione multi-GPU premia lo SLI di GTX 670 in condizioni normali ed il CF di HD 7950 quando si applicano i filtri. Troppo lontano il Triple-CF di HD 7950 che in questo test presenta uno scaling del 99.9%.


Battlefield 3

FPS bellico basato sull'engine Frostbite 2.0 di DICE. Il motore grafico è completamente compatibile con le DirectX 11 e gestisce in tempo reale: radiosity,  rendering differito, sistema di collisioni Destruction 3.0 e animazioni ANT. Battlefield 3 mostra  tutto quello che un sistema hardware moderno è in grado di fare grazie ad una qualità delle scene davvero impareggiabile. Per le nostre prove abbiamo utilizzato una sequenza fissa ed il tool di registrazione del framerate FRAPS. 

1920x1080 (Single)

bf3

bf3 aa

La GTX 670 è più lenta della "sorella maggiore" solo dell'8% con l'MSAA a 4x. A questa risoluzione riesce quasi sempre a mantenere un frame-rate superiore ai 60 fps.

2048x1536 (Single e SLI)

2 bf3

2 bf3_aa

Buone le prestazioni anche in SLI. Le due GTX 670 scalano le HD 7950 ma sono complessivamente più veloci.


Dirt3

Gioco di guida arcade di tipo off-road e rally costruito intorno all'ultima versione del motore grafico EGO Engine di Codemasters arricchita con effetti DirectX 11.

1920x1080 (Single)

dirt3

dirt3 aa


Come abbiamo più volte sottolineato Dirt3 penalizza l'architettura dual-geometry engine delle Radeon HD 6900/7800/7900. Si tratta di un problema software che AMD e Codemasters non sono ancora riusciti a risolvere.

2048x1536 (Single e SLI)

2 dirt3

nwe dirt3

Meglio lo SLI di GTX 670 rispetto al CF di HD 7950, ma parliamo comunque di titolo che non è in grado di mettere in difficoltà neppure le moderne schede a singola GPU. Comunque le due GTX 670 riescono a far registrare un frame-rate minimo addirittura superiore al Triple-CF quando sono si utilizza il filtro MSAA.


Just Cause 2 

Action in terza persona con elementi da gioco di guida di tipo free roaming sviluppato da Avalanche Studios e pubblicato da Eidos Interactive.  Basata sull' Avalanche Engine 2.0 il gioco sfrutta il rendering DirectX 10. 

1920x1080 (Single)

jc2

jc2 aa

Davvero minima la differenza tra GTX 670 e GTX 680 in Just Cause 2 a questa risoluzioni, con o senza filtri.

2048x1536 (Single e SLI)

 2 jc2

 2 jc2_aa

 Stranamente il CF di 7950 riesce a superare lo SLI di GTX 670. L'impressione è che la scarsa scalabilità in multi-GPU per Nvidia sia dovuta ad un problema driver.


Lost Planet 2

Avventura d´azione sci-fi di CAPCOM disponibile in versione DirectX 9 e DirectX 11 nella quale vengono pesantemente sfruttati effetti di tesselation.

1920x1080 (Single)

lp2

lp2 aa


Troppo veloce la GTX 670 anche per la HD 7970. I 6GHz di frequenza VRAM per le due GTX 600 fanno la differenza rispetto al bus a 384-bit delle Radeon HD 7900.

2048x1536 (Single e SLI)

2 lp2

2 lp2_aa

Lo SLI impensierisce addirittura il Triple-CF.


Mafia 2

Sviluppato da 2K Czech utilizza il motore grafico The Illusion Engine. Le nostre prove sono baste sul sistema di benchmark integrato.

1920x1080 (Single)

mafia2

mafia2 aa


Applicando il filtro AA la GTX 670 cede il passo alla HD 7970 ma è sempre davanti alla HD 7950.

2048x1536 (Single e SLI)

2 mafia2 

 2 mafia2_aa

Disfatta per il multi-GPU di AMD in questo test, con il Triple-CF più lento del CF quando non si utilizza il filtro AA.


Metro 2033

Sparatutto in prima persona con ambientazione post-apocalittica sviluppato da 4A Games  e pubblicato da THQ. Il gioco supporta appieno tutte le feature DirectX 11, come tessellation e DirectCompute, e per questo richiede molte risorse hardware.

1920x1080 (Single)

matro 

 metro aa

Test pesante già a 1080p. La maggiore bandwitch della HD 7970 fa la differenza con l'AA a 4x.

2048x1536 (Single e SLI)

 2 metro

 2 metro_aa

 CF superiore allo SLI quando si applicano i filtri AA, ma in single è ancora la GTX 670 a spuntarla.


Shogun 2

Strategico in tempo reale sviluppato da The Creative Assembly e pubblicato da SEGA. Il motore grafico è stato aggiornato con la patch 2.0 alle DirectX 11 ed offre effetti avanzati di tesseletion, anti-aliasing ed ombre dinamiche.

1920x1080 (Single)

shogun2

shogun2 aa

Questa è sicuramente la prova più dura per l'architettura Kepler. Per la prima volta la GTX 670 è più lenta della HD 7950 e si ritrova addirittura dietro alla GTX 580.

2048x1536 (Single e SLI)

2 shogun 

 2 shogun_aa

L'ottimo scaling in SLI lascia pensare che ci sia una difficoltà nello sfruttare tutta la potenza delle singole GTX 600. Nel test mancano i risultati del Triple-CF a causa di un problema driver. 


The Witcher 2

Gioco di ruolo di CD Projekt che sfrutta il motore proprietario Red Engine. Nonostante il supporto limitato alle DirectX 9 è uno dei titoli con la migliore grafica in circolazione, merito soprattutto dell'elevatissimo dettaglio poligonale e della massiccia presenza di effetti di post-processing. 

1920x1080 (Single)

tw2

tw2 aa

Scambio di posizioni tra la GTX 670 e la HD 7970 una volta arrivati i filtri. La HD 7950 è troppo in dietro per inpensierire la GTX 670 mentre la GTX 680 si trova avanti solo grazie alla maggiore frequenza di clock del GPU Boost.

2048x1536 (Single e SLI)

new tw2

2 tw2_aa_us

L'UberSampling taglia le gambe a qualsiasi single-GPU. Si salvano solo lo SLI di GTX 670 ed il Triple-CF di HD 7950 ma spesso anche con queste configurazioni il frame-rate cala drasticamente sotto i 30 fps.


Consumi

I consumi si riferiscono all'intero sistema.

c s

c i

Consumi elevati in full-load per le due GTX 670 dovuti alla capacità dei driver Nvidia e del GPU-boost di far lavorare le schede sempre al limite del TDP e di stressare gran parte dei core della nostra CPU. Presa singolarmente la GTX 670 consuma come le HD 7950 custom di Asus e Sapphire.

Temperature

Le temperature della GPU sono state rilevate tramite il tool GPU-Z cercando di far rimanere quelle ambientali costantemente sui 21°C. 

 t s

 t i

I primi tre posti sono occupati da soluzioni reference dotati di dissipatori stock ma a differenza della GTX 680 e della HD 7870 la GTX 670 è  decisamente più rumorosa, con la  ventola che - essendo completamente ancorata ad una struttura in plastica - trasmette fastidiose vibrazioni già con la scheda in idle. 


Probabilmente a causa della seconda scheda video custom abbiamo avuto dei problemi software con l'overclock della configurazione SLI, pertanto la prova è limitata alla sola soluzione reference di Nvidia.

Tramite il tool Precision X abbiamo impostato il valore di GPU Clock Offset a +105MHz ed quello di Memory Clock Offset a +200MHz, settando il Power Target al massimo consentito (+122%). 

precision x_oc

 Di seguito il risultato ottenuto.

P9332

OC

Deludente la prova di overclock della GTX 670 reference, ma lo scarso incremento prestazionale è dovuto eslusivamente al sistema di raffredamento utilizzato da Nvidia: assolutamente poco efficiente e molto rumoroso.


Parlando solo di performance e prezzo in relazione alla concorrenza la GTX 670 è per ora la scheda più interessante di questa nuova generazione. Non solo è sempre più veloce della diretta rivale HD 7950, ma alla risoluzione di 1920x1080 pixel si piazza addirittura davanti alla HD 7970 e in alcuni test riesce a mettere in difficoltà la ben più costosa GTX 680. Il divario con la "sorella maggiore" tende a rimanere costante tra il 5~10% anche salendo di risoluzione e applicando i vari filtri visto che le due soluzioni hanno tutto il comparto back-end uguale ed offrono la stessa bandwidth.

Purtroppo il modello reference paga alcune scelte di Nvidia poco comprensibili agli occhi degli utenti appassionati. Il PCB di ridotte dimensioni non consente di utilizzare una componentistica da scheda di fascia alta ed il sistema di raffreddamento non è all'altezza. Le memorie video (anteriori e posteriori) sono lasciate naked e la ventola a turbina è troppo rumorosa soprattutto a causa delle vibrazioni create dalla struttura di supporto completamente in plastica. Tutto questo si traduce in una scarsa propensione all'overclock praticato manualmente. Peccato visto le enormi potenzialità del chip GK104.

Il nostro consiglio è di orientarsi su GTX 670 custom sviluppate dai partner di Nvidia con PCB non reference e sistemi di raffreddamento a doppia ventola.

Lo SLI di GTX 670 non delude le aspettative e risulta chiaramente vincitore nei confronti del Crossfire di HD 7950, nonostante l'ottima scalabilità raggiunta da AMD. Il grande vantaggio della configurazione multi-GPU Nvidia risiede nel frame-rate minimo più alto e nella capacità di sfruttare al meglio le piattaforme multi-core. I consumi però sono più alti a causa del GPU boost di Nvidia che fa lavorare le due GPU quasi sempre al limite del TDP e la rumorosità è decisamente più marcata sia in idle che in full-load (quando si utilizzano GTX 670 reference).