Con l'architettura Bulldozer, annunciata oltre un anno fa, AMD è riuscita solo parzialmente nei suoi intenti. L'idea era quella di portare sul mercato una serie di processori performanti e molto efficienti ma, vuoi per qualche inghippo non dipendente espressamente dalla propria volontà quali i problemi di produzione, vuoi per cause legate ad una struttura completamente nuova e tutta da ottimizzare i tempi di presentazione si sono allungati oltre misura facendo sfumare ogni sogno di gloria. L'azienda è riuscita comunque a far parlare del proprio prodotto e riempire pagine di giornali e siti web specializzati, tutti più o meno concordi sui risultati e pronti ad accoglierne le evoluzioni.
Evoluzioni che non si fanno attendere più di tanto: oggi vedono la luce le nuove CPU della serie FX, nome in codice Vishera, basate su quello che rappresenta il primo aggiornamento dell'architettura Bulldozer, ovvero Piledriver, prodotta a 32 nm. Cosa ci si possa aspettare dai nuovi modelli AMD lo mette subito in tavola, riducendo il tutto ad un mero 15% di miglioramento delle performance: con questo non vogliamo tirare già le conclusioni, quantomeno non vogliamo farlo prima di aver valutato tutti i risultati dei test, i prezzi di vendita e le potenzialità del prodotto.
Nulla di nuovo vi è nel disegno architetturale se non alcune ottimizzazioni. AMD ha limato quà e là, ottimizzato qualche particolare ma soprattutto portato la frequenza di base a ben 4GHz, un valore che la stessa azienda utilizza a suon di spot per dire che le proprie CPU top di gamma oggi non solo dispongono di architettura a 8 core ma sono anche le prime a funzionare con simili parametri.
Le CPU FX-series 2012 continuano a tener saldo il proprio legame col passato anche riguardo il socket, ancora AM3+ facendo così felici coloro che già possiedono una scheda madre di questo genere e oggi hanno a disposizione un più ampio ventaglio di scelta per pensare ad un eventuale upgrade.
Vishera come e meglio di Bulldozer
Piledriver parte dagli stessi concetti di Bulldozer, anzi ne rappresenta "solo" un'evoluzione. AMD ha ripreso esattamente i concetti introdotti con la sua precedente architettura per le CPU desktop x86 top di gamma apportando ottimizzazioni in ogni dove. Con Piledriver, dunque, viene indicata l'architettura dei core delle CPU FX-series 2012 note con il nome in codice di Vishera e disponibili con architettura a 4, 6 e 8 core o, per meglio dire, a 2, 3 e 4 moduli (come per Bulldozer, un modulo è l'unità minima delle CPU FX).
Pur senza entrare nuovamente nel dettaglio e nelle definizioni di "core" e "module", cose delle quali abbiamo più volte parlato, vi ricordiamo che un modulo Bulldozer include due core x86 che condividono parte delle risorse quali la cache L2, l'unità FPU capace di gestire anche istruzioni FMAC a 256-bit e le unità di Fetch e Decode.
Nel dettaglio, queste sono le caratteristiche dell'architettura Vishera:
Caratteristiche di base delle CPU in esame | |||||
AMD Vishera (8-core) |
AMD Zambezi (8-core) |
Intel SB (4-core) |
Intel SB-E (6-core) |
Intel IB (4-core) |
|
Architettura | Piledriver | Bulldozer | Sandy Bridge | Sandy Bridge | Ivy Bridge |
Socket | AM3+ | AM3+ | LGA 1155 | LGA 2011 | LGA 1155 |
Numero di transistor | 1,2 miliardi | 1,2 miliardi | 1,16 miliardi | 2,27 miliardi | 1,4 miliardi |
Processo produttivo | 32nm SOI | 32nm SOI | 32nm | 32nm | 22nm |
Dimensioni die | ~315mm2 | ~315mm2 | 216mm2 | 435mm2 | 160mm2 |
Cache L1 | 16KB D per core 64KB I per modulo |
16KB D per core 64KB I per modulo |
32KB D per core 32KB I per core |
32KB D per core 32KB I per core |
32KB D per core 32KB I per core |
Cache L2 | 2MB per modulo | 2MB per modulo | 256KB per core | 256KB per core | 256KB per core |
Cache L3 | 8MB | 8MB | 8MB | Fino a 15MB | 8MB |
Thread per core | 1 | 1 | 2 | 2 | 2 |
Turbo | Si | Si | Si | Si | Si |
FPU | 256-bit | 256-bit | 128-bit | 128-bit | 128-bit |
Controller delle memorie | DDR3-1866 Dual-channel |
DDR3-1866 Dual-channel |
DDR3-1333 Dual-channel |
DDR3-1600 Quad-channel |
DDR3-1600 Dual-channel |
Controller grafico | N/A | N/A | DirectX 10.1 | N/A | DirectX 11 |
PCI Express | N/A | N/A | 16 lane (2.0) | 40 lane (3.0) | 16 lane (3.0) |
TDP | 95W, 125W | 95W, 125W | 65W, 95W | 130W | 77W |
Vishera è prodotto esattamente con lo stesso nodo di Bulldozer, quello a 32nm con tecnologia SOI (Silicon on Insulator) di GlobalFoundries. Il numero di transistor resta esattamente identico a quello del suo antenato così come l'occupazione di spazio sul die: questa effettivamente poteva essere una delle possibili ottimizzazioni sulle quali evidentemente AMD non è risucita a fare molto.
Come dicevamo anche in passato, AMD deve migliorare nettamente il suo design per poter raggiungere il livello della rivale Intel che riesce a mettere quasi lo stesso numero di transistor in un'area nettamente inferiore: il die di Sandy Bridge ha poco meno di 1,2 miliardi di transistor ma occupa un'area di soli 216mm quadrati contro i 315mm quadrati di Vishera, nonostante il processo produttivo sia sempre a 32nm. E un miglioramento sarebbe auspicabile anche nelle fila di GF per poter accedere ad un processo produttivo più avanzato, chissà forse saltando direttamente ai 14nm. Ipotesi e possibilità tutte da verificare, ma intanto la situazione resta quella di un prodotto che sulla carta avrebbe grosse potenzialità ma nella pratica deve subire la concomitanza di numerose problematiche.
Anche riguardo l'organizzazione della memoria cache, altro tallone d'Achille per le CPU AMD rispetto alle proposte Intel, non troviamo alcuna differenza rispetto a Bulldozer. La gerarchia a tre livelli prevede una cache L1 dati esclusiva da 16KB per ogni core set associativa a 4-vie, una cache L1 istruzioni set associativa a 2 vie da 64KB per modulo, dunque condivisa fra due core, una cache L2 da 2MB per modulo, anch'essa condivisa fra due core, con set associatività a 16-vie ed infine una cache L3 da 8MB (per i modelli a 8-core) condivisa fra tutti i moduli.
Fin qui sembrerebbe che non ci siano novità di rilievo. Guardando a quanto indicato da AMD il diagramma a blocchi dell'architettura non subisce alcun intervento, cosa che invece accade all'interno dei singoli blocchi:
Blocchi dell'architettura di Bulldozer, identici a quelli di Vishera
Le novità introdotte con Vishera
Le novità - come anticipato - sono tutte sotto forma di ottimizzazioni: quasi ogni singolo blocco dell'architettura Bulldozer è stato rivisto e migliorato per garantire maggiori prestazioni ed efficienza. Anzitutto il produttore si è preoccupato di migliorare gli algoritmi di branch prediction per avere un più basso penalty in caso di errore nella previsione e le unità di instruction retire. A ciò è seguito un ampliamento del modulo di decodifica ora in grado di supportare istruzioni FMA3 ed F16C ed una ottimizzazione degli scheduler per le istruzioni integer e floating point.
AMD ha lavorato anche al miglioramento dei registri e delle cache con modifiche agli algoritmi di prefetch, ampliamento della TLB della cache L1 e aumento dell'efficienza della cache L2.
Latenza cache (cicli di clock) | ||||||
Core i7 2600K | Core i7 3960X | Core i7 3770K | AMD Phenom II | AMD FX-8120 | AMD FX-8350 | |
L1 | 4 | 3 | 3 | 3 | 4 | 4 |
L2 | 11 | 10 | 10 | 16 | 27 | 25 |
L3 | 36 | 64 | 54 | 86 | 88 |
Tali modifiche hanno portato ad un leggero miglioramento della latenza della cache L2 che passa da 27 cicli di clock a 25 mentre resta invariata quella associata alla cache L1.
Come per le CPU Bulldozer, anche le nuove Vishera utilizzano la tecnologia Turbo Core per aumentare l'efficienza. Il Turbo Core permette il funzionamento a frequenze superiori rispetto a quella di default utilizzando due step indicati come All Core Turbo (tutti i core sono utilizzati e fatti funzionare ad una frequenza maggiore) e Max Turbo (un numero ridotto di core è utilizzato ad una frequenza ancora superiore).
AMD FX-8350 ed il resto della compagnia
Quattro sono le nuove CPU che oggi AMD mette sul piatto della bilancia. Queste andranno a sostituire i vecchi processori Bulldozer grazie alla possibilità di essere ospitate sulle stesse piattaforma socket AM3+ basate su chipset 990FX, 990X o 970. I modelli della serie FX "Vishera" che troveremo presto in commercio, a 4, 6 o 8 core, hanno un TDP di 95W oppure 125W e supportano memorie DDR3 fino a 1866MHz (con alcune limitazioni).
Elenco processori AMD ed Intel | |||||||||||
Modello | Core | PP | Socket | Freq. | Turbo | C/T | L2 | L3 | Mem. | GPU | TDP |
Processori AMD FX-Series | |||||||||||
FX-8350 | Piledriver | 32nm | AM3+ | 4,0GHz | 4,2GHz | 8/8 | 8MB | 8MB | DDR3 | N/A | 125W |
FX-8320 | Piledriver | 32nm | AM3+ | 3,5GHz | 4,0GHz | 8/8 | 8MB | 8MB | DDR3 | N/A | 125W |
FX-6300 | Piledriver | 32nm | AM3+ | 3,5GHz | 4,1GHz | 6/6 | 6MB | 8MB | DDR3 | N/A | 95W |
FX-4300 | Piledriver | 32nm | AM3+ | 3,8GHz | 4,0GHz | 4/4 | 4MB | 4MB | DDR3 | N/A | 95W |
FX-8150 | Bulldozer | 32nm | AM3+ | 3,6GHz | 4,2GHz | 8/8 | 8MB | 8MB | DDR3 | N/A | 125W |
FX-8120 | Bulldozer | 32nm | AM3+ | 3,1GHz | 4,0GHz | 8/8 | 8MB | 8MB | DDR3 | N/A | 125W |
FX-8100 | Bulldozer | 32nm | AM3+ | 3,1GHz | 3,7GHz | 8/8 | 8MB | 8MB | DDR3 | N/A | 95W |
FX-6200 | Bulldozer | 32nm | AM3+ | 3,8GHz | 4,1GHz | 6/6 | 6MB | 8MB | DDR3 | N/A | 125W |
FX-6100 | Bulldozer | 32nm | AM3+ | 3,3GHz | 3,9GHz | 6/6 | 6MB | 8MB | DDR3 | N/A | 95W |
FX-4170 | Bulldozer | 32nm | AM3+ | 4,2GHz | 4,3GHz | 4/4 | 4MB | 8MB | DDR3 | N/A | 125W |
FX-4100 | Bulldozer | 32nm | AM3+ | 3,6GHz | 3,8GHz | 4/4 | 4MB | 8MB | DDR3 | N/A | 95W |
Processori AMD Phenom II | |||||||||||
Phenom II X6 1090T | Thuban | 45nm | AM3 | 3.2GHz | 3,6GHz | 6/6 | 3MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X6 1075T | Thuban | 45nm | AM3 | 3.0GHz | 3,5GHz | 6/6 | 3MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X6 1055T | Thuban | 45nm | AM3 | 2.8GHz | 3,3GHz | 6/6 | 3MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X6 1035T | Thuban | 45nm | AM3 | 2.6GHz | 3,1GHz | 6/6 | 3MB | 6MB | DDR2/3 | N/A | 95W |
Phenom II X4 980 BE | Deneb | 45nm | AM3 | 3,7GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X4 975 BE | Deneb | 45nm | AM3 | 3,6GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X4 970 BE | Deneb | 45nm | AM3 | 3,5GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X4 965 BE | Deneb | 45nm | AM3 | 3,4GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 125W |
Phenom II X4 955 BE | Deneb | 45nm | AM3 | 3,2GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 125W |
Processori Intel Core 3rd gen | |||||||||||
Core i7-3770K | IB | 22nm | LGA 1155 | 3,50GHz | 3,90GHz | 4/8 | 1MB | 8MB | DDR3 | HD 4000 | 77W |
Core i7-3770 | IB | 22nm | LGA 1155 | 3,40GHz | 3,90GHz | 4/8 | 1MB | 8MB | DDR3 | HD 4000 | 77W |
Core i5-3570K | IB | 22nm | LGA 1155 | 3,40GHz | 3,80GHz | 4/4 | 1MB | 6MB | DDR3 | HD 4000 | 77W |
Core i5-3550 | IB | 22nm | LGA 1155 | 3,30GHz | 3,70GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2500 | 77W |
Core i5-3450 | IB | 22nm | LGA 1155 | 3,10GHz | 3,50GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2500 | 77W |
Core i7-3770T | IB | 22nm | LGA 1155 | 2,50GHz | 3,70GHz | 4/8 | 1MB | 8MB | DDR3 | HD 4000 | 45W |
Core i7-3770S | IB | 22nm | LGA 1155 | 3,10GHz | 3,90GHz | 4/8 | 1MB | 8MB | DDR3 | HD 4000 | 65W |
Core i5-3550S | IB | 22nm | LGA 1155 | 3,00GHz | 3,70GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2500 | 65W |
Core i5-3450S | IB | 22nm | LGA 1155 | 2,80GHz | 3,50GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2500 | 65W |
Processori Intel Core 2nd gen | |||||||||||
Core i7-3960X | SBE | 32nm | LGA 2011 | 3,30GHz | 3,90GHz | 6/12 | 1,5MB | 15MB | DDR3 | N/A | 130W |
Core i7-3930K | SBE | 32nm | LGA 2011 | 3,20GHz | 3,80GHz | 6/12 | 1,5MB | 12MB | DDR3 | N/A | 130W |
Core i7-3820 | SBE | 32nm | LGA 2011 | 3,60GHz | 3,90GHz | 4/8 | 1MB | 10MB | DDR3 | N/A | 130W |
Core i7-2600K | SB | 32nm | LGA 1155 | 3,40GHz | 3,80GHz | 4/8 | 1MB | 8MB | DDR3 | HD 3000 | 95W |
Core i7-2600S | SB | 32nm | LGA 1155 | 2,80GHz | 3,80GHz | 4/8 | 1MB | 8MB | DDR3 | HD 2000 | 65W |
Core i5-2500T | SB | 32nm | LGA 1155 | 2,30GHz | 3,30GHz | 4/4 | 1MB | 6MB | DDR3 | HD 200 | 45W |
Core i5-2500S | SB | 32nm | LGA 1155 | 2,70GHz | 3,70GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2000 | 65W |
Core i5-2500K | SB | 32nm | LGA 1155 | 3,30GHz | 3,70GHz | 4/4 | 1MB | 6MB | DDR3 | HD 3000 | 95W |
Core i5-2500 | SB | 32nm | LGA 1155 | 3,30GHz | 3,70GHz | 4/4 | 1MB | 6MB | DDR3 | HD 2000 | 95W |
Il risultato di un design non ottimizzato e di un processo produttivo che ormai comincia a scricchiolare, sono immediatamente visibili nella tabella. Mentre le CPU AMD FX continuano a viaggiare su TDP di 125W e, nel migliore dei casi, di 95W, Intel riesce a scendere a 77W o addirittura 65W con le CPU Ivy Bridge. Sugli stessi valori di TDP troviamo, invece, le CPU Sandy Bridge-E.
Fra le nuove proposte il modello FX-8350, che abbiamo oggi sul nostro banco di prova, rappresenta quello più veloce: architettura a 4 moduli / 8 core, frequenza nominale di 4,0GHz e Turbo fino a 4,2GHz, 8MB di cache L2, 8MB di cache L3 e controller delle memorie dual-channell DDR3-1866. Rispetto al top di gamma di precedente generazione, FX-8150, cambia solo la frequenza nominale (si passa dai 3,6GHz a 4GHz).
La CPU è ovviamente identica ai modelli Bulldozer così come a tutte le altre soluzioni AMD di attuale (A-Series) e precedente (Phenom II) generazione. D'altro canto tutti i socket AMD sono molto simili fra loro e così anche gli heatspreader posizionati sopra il die. Sulla CPU è riportata una serigrafia che indica il modello esatto e, probabilmente, settimana e stabilimento di produzione, nel nostro caso FD8350FRW8KHK.
Il socket AM3+ è lo stesso da ormai diversi anni pur avendo subito alcune evoluzioni. Ai lati dispone di due blocchi in plastica sui quali può essere fissato il dissipatore oppure, nei casi più estremi, questi possono essere rimossi per far spazio ad un radiatore di più grosse dimensioni.
Come per tutte le CPU FX-series anche le nuove arrivate prevedono moltiplicatore completamente sbloccato sia verso l'alto che verso il basso con granularità di 0,5x e frequenza di bus di 200MHz.
Sistemi di prova
Per eseguire i test sulle CPU abbiamo rispettato le seguenti regole:
- Sulla scheda sono stati installati solo i componenti necessari: CPU, Memoria, Scheda video e Hard disk.
- L'hard disk è stato formattato, sono stati poi installati il sistema operativo, i drivers per le periferiche e, quando necessario, sono state installate patch e aggiornamenti.
- Ogni test è stato ripetuto per tre volte e, se i risultati di qualche test si mostrano troppo lontani dalla media (elevata varianza), il test stesso è stato di nuovo ripetuto, scartando il risultato non corretto.
- Alla fine di ogni sessione di prova l'hard disk è stato formattato.
In merito ai sistemi di prova, ci siamo serviti di differenti piattaforme a seconda del tipo di CPU. Ciò è stato necessario per ottenere un sistema funzionante per ogni tipo di Socket che le CPU utilizzate per la nostra comparazione utilizzano. Ovviamente si è cercato di realizzare i sistemi con componenti simili, quando possibile, uguali.
Sistema di prova | |
Sistema Socket AM3+ | |
Scheda madre | ASUS Crosshair V Formula AMD 990FX |
Processori |
|
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1866MHz |
Sistema Socket FM1 | |
Scheda madre | ASRock A75 Pro4 con FHX A75 socket FM1 |
Processori | AMD A8-3850 (2,9GHz, 4MB L2, Radeon HD 6550D, quad core) |
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket AM3 | |
Scheda madre | ASUS Crosshair IV Formula AMD 890FX |
Processori |
|
Memoria | 2GB DDR3 1600 OCZ (1GB x 2) @ 9/9/9/24 - 1333MHz |
Sistema Socket AM2+ | |
Scheda madre | Gigabyte GA-MA790GP AMD 790FX |
Processori |
|
Memoria | 2GB DDR2 1066 Corsair (1GB x 2) @ 5/7/7/24 - 1066MHz |
Sistema Socket LGA 2011 | |
Scheda madre | Intel DX79SI Siler X79 Express |
Processori | Intel Core i7-3960X (3,3GHz, Turbo 3,9GHz, 1,5MB L2, 15MB L3, six core) |
Memoria | 8GB DDR3 2000 (4 x 2GB) @ 1600MHz |
Sistema Socket 1155 LGA (Ivy Bridge) | |
Scheda madre | Intel DZ77GA-70K (Gasper) |
Processori | Core i7-2600k - Turbo Mode ON |
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket 1155 LGA (Sandy Bridge) | |
Scheda madre |
|
Processori |
|
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket 1156 LGA (Lynnfield) | |
Scheda madre | Intel DP55KG Extreme |
Processori |
|
Memoria | 2GB DDR3 1333 (2 x 1GB) |
Sistema Socket 1156 LGA (Clarkdale) | |
Scheda madre | Intel DH55TC |
Processori | Core i5 661 - Turbo Mode ON |
Memoria | 2GB DDR3 1333 (2 x 1GB) |
Scheda video | Intel GMA HD |
Sistema Socket 1366 LGA | |
Scheda madre | ASUS P6T Intel X58 |
Processori |
|
Memoria | 3GB DDR3 1066 (3 x 1GB) |
Opzioni Comuni | |
Hard Disk | Maxtor 160GB 7200RPM Serial ATA |
Scheda video | Radeon HD4850 512MB |
Scheda audio | Integrata |
Media | DVD Rom 8x |
Alimentatore | Corsair 620W |
Sistema operativo | Windows 7 64-bit |
I test eseguiti sono descritti qui di seguito:
Benchmark sintetici
-
Fritz Chess Benchmark: questo è un tool che misura la potenza del processore di sistema utilizzando il motore per la creazione di giochi di scacchi "Fritz 9 engine". Il risultato del test è espresso in nodi per secondo medi. Il software è fortemente ottimizzato per girare in ambienti multicore ed è capace di attivare fino ad 8 thread contemporaneamente.
-
ScienceMark 2.0: grazie a ScienceMark è possibile misurare le prestazioni del sistema in ambiente di calcolo spinto. Inoltre il software misura le prestazioni della memoria di sistema e della cache integrata nella CPU.
- SiSoft SANDRA 2010: questa suite di benchmark sintetici ci offre un quadro specifico delle prestazioni di ogni componente disponibile all'interno della piattaforma di test come memorie, CPU, disco fisso e così via.
Grafica 3D
-
3DMark06 (versione 1.1.0 Professional): ci permette di valutare le prestazioni grafiche 3D offerte dal sistema. Nel suo computo sono inclusi, in particolare, la CPU, la memoria di sistema ed il controller grafico.
-
World In Conflict (RTS): si tratta di uno strategico in tempo reale, che unisce a questo tipo di giochi una visuale simile a quella degli sparatutto in prima persona e che fa degli effetti particellari e della fisica le sue armi migliori.
-
Crysis: uno dei più indicativi titoli 3D DirectX 10 per effetti grafici e per l´utilizzo della fisica.
Utilizzo generico
-
PovRay (versione 3.6): il tool Persistence of Vision Raytracer (PovRay) permette di creare grafica tridimensionale di elevata qualità. Al suo interno troviamo una scena standard creata proprio per effettuare benchmark sulla CPU che sfrutta la maggior parte delle feature disponibili con questo software. Per rendere ripetibili i nostri test utilizziamo sempre le impostazioni di default del file .ini.
-
Cinebench (versione 10 e versione 11): suite di test multi-piattaforma basato sul software di animazione CINEMA 4D ampiamente utilizzato da studi e case di produzione per la creazione di contenuti 3D. Grazie ad esso possiamo valutare le performance del sottosistema CPU seppure l'influenza di chipset, memorie e scheda grafica installate nel sistema non può essere trascurata. Il software esegue un test di rendering capace di sollecitare uno o tutti i core del processore disponibili.
-
7-Zip (versione 9.15 beta): con questo noto software di compressione dati eseguiamo due diversi benchmark. Il primo viene realizzato utilizzando il tool integrato che restituisce una indicazione sui MIPS (million instructions per second) che il sistema è in grado di offrire (potete confrontare i risultati ottenuti con quelli ufficiali e con quelli del vostro sistema). Il secondo invece prende in considerazione una situazione reale nella quale viene richiesto al sistema di comprimere in formato 7z una cartella da 5,36GB contenente 4.379 file di diversa dimensione e tipologia (immagini, testo, html, video, foto, applicazioni) e 536 sottocartelle e poi di decomprimere la stessa. L'operazione di compressione ha una forte dipendenza dalla memoria cache della CPU e dalla memoria RAM installata nel sistema. Quella di estrazione dipende molto, invece, dalla capacità della CPU di gestire le operazioni su interi. In tutti i casi, il software sfrutta abbastanza bene tutte le risorse (core) di CPU a disposizione.
-
Auto Gordian Knot (versione 2.55): software utile per effettuare backup di DVD o comunque operazioni di transcodifica video nei formati DivX ed XviD. Per le nostre prove utilizziamo il codec XviD che il tool installa di default ed eseguiamo il ripping di un completo DVD (Codice Swordfish) che per l'occasione abbiamo memorizzato su un disco fisso e lo "comprimiamo" in modo da farlo entrare su due CD.
-
Handbrake (versione 0.9.4): un software di transcodifica video open-source multipiattaforma e multithreaded con il quale effettuiamo una conversione video di un intero DVD (Codice Swordfish) in formato adatto per i dispositivi Apple iPod, iPhone e iPad.
-
DaCapo (versione 9.12): questa suite di benchmark permette di valutare il comportamento del sistema quando si utilizzano tool di sviluppo per Java. Esso include tutta una serie di applicazioni reali open source fra cui Tomcat, FOP, Eclipse, Batik, Xalan e altri. Nel nostro caso riportiamo il tempo complessivo necessario all'esecuzione di tutti i test.
Unità di calcolo, cache e memoria
Cominciamo la nostra analisi prestazionale da alcuni test sintetici che permettono di isolare uno specifico campo di applicazione ma soprattutto permettono di tenere in considerazione le performance della sola CPU.
Le prestazioni raw che possiamo imputare alle unità di calcolo su interi e numeri in virgola mobile parlano di una CPU FX-8350 capace di impensierire un Core i7-2600k Sandy Bridge, denotando un buon distacco dal top di gamma di precedente generazione.
Passando alla valutazione delle unità multimediali notiamo come la CPU FX-8350 abbia ereditato la dote dei suoi antenati riuscendo a fornire prestazioni in media superiori a quelle delle rivali Intel Sandy Bridge ed Ivy Bridge. Probabilmente buona parte del merito va al supporto esteso delle feature nate dal set di istruzioni MMX e poi evolute in quelle SSE.
Valutazione complicata quella relativa alla banda dati proveniente dalle memorie. Per la CPU FX-835o la banda registrata dal SiSoft SANRA è superiore a quella che si ottiene dal modello FX-8120 ma ben inferiore a quella che abbiamo registrato con il modello FX-8150. In ogni caso siamo ben al di sotto dei numeri che garantiscono le CPU Intel Sandy Bridge ed Ivy Bridge (nonostante le memorie utilizzate siano esattamente le stesse).
Science Mark è abbastanza d'accordo con quanto abbiamo appena visto.
Calcolo intensivo
Le applicazioni che sfruttano la sola potenza delle unità di calcolo (o quasi) rappresentano un ottimo banco di prova per le CPU. Primordia e Molecular Dynamics sono due benchmark di Science Mark che permettono di misurare le prestazioni eseguendo calcoli scientifici. Si tratta di due test che insistono sulle unità Floating Point, non sono per nulla ottimizzati per ambienti multi core e perciò utili a controllare le prestazioni del singolo core (IPC) e l'efficacia delle tecnologie Turbo.
Nelle pure prestazioni di calcolo con applicazioni single-thread, la nuova CPU AMD FX-8350 recupera qualche posizione ma i numeri restano quelli dei predecessori Bulldozer.
Fritz Chess è un engine di simulazione del gioco degli scacchi in grado di sfruttare al massimo ambienti multi-threaded, permettendo di indirizzare fino ad 8 thread. In questo caso la nuova CPU FX-8350 riesce a dare del filo da torcere alla CPU Intel Core i7-2600k.
Confermate le prestazioni elevate che si ottengono nel momento in cui si fa uso di applicazioni fortemente multi-threaded come lo sono gli algoritmi di crittazione Serpent di Truecrypt 7. La nuova CPU di AMD emerge e non eme confronti, nemmeno fra le fila delle più costose rivali Ivy Bridge.
Strano comportamento, invece, quello del modulo integrato per l'accelerazione della crittografia AES: nonostante la frequenza di funzionamento nominale dell'FX-8350 sia superiore a quella della sorella FX-8150, i numeri di questo test restano esattamente gli stessi.
Rendering e compressione
I software di rendering sono in grado di sfruttare sia le risorse della CPU che quelle grafiche, risultando così un ottimo metodo di misurazione delle prestazioni.
AMD insiste molto sul fatto che le proprie CPU Bulldozer e Vishera diano il meglio di loro con applicazioni multi-thread e Cinebench 10 ne è un chiaro esempio. Gli oltre 23.000 punti ottenuti nel test multiple CPU permettono all'FX-8350 di battere sonoramente il modello Core i7-2600k della rivale Intel mentre, gli appena 4.300 punti del test single CPU non sono sufficienti nemmeno a competere con il Core i3-2100k. Questo porta ad un fattore di moltiplicazione per le CPU AMD superiore a cinque (5,4 per l'FX-8350) contro un valore di 3,8 circa per le CPU Intel di ultima generazione. Insomma, è come se AMD avesse voluto supplire alla scarsità di prestazioni dovute alla singola unità con un più elevato numero di unità stesse.
Quando si passa nuovamente ad una applicazione poco ottimizzata per il multi-threading, come PovRay nella sua versione 3.6, le CPU AMD tornano a mostrare le proprie debolezze. Non che valga la formula "Mal comune, mezzo gaudio", ma guardando la classifica possiamo dire che questo comportamento accomuna tutte le CPU AMD degli ultimi anni, dai modelli Phenom a quelli FX-series ed A-series.
Ottimo anche il comportamento mostrato con 7-zip: il benchmark integrato in questo applicativo permette di sfruttare a dovere la potenza di architetture multi-core e trarre notevole beneficio da una CPU come l'FX-8350 di AMD che riesce perciò a posizionarsi giusto dietro il Core i7-3770k.
Codifica video, sviluppo e produttività
A differenza di quelli di rendering, i software di codifica video sono soliti sfruttare la sola potenza di calcolo della CPU, oltre che il sottosistema delle memorie (includendo cache, controller e memoria RAM).
Ancora una volta il margine di guadagno rispetto alle CPU FX-8150 Bulldozer permette al nuovo arrivato di superare il Core i7-2600k.
La conferma di questo comportamento ottimo con tool di transcodifica video arriva da XMPEG dove la CPU AMD FX-8350 riesce ad avvicinarsi notevolmente al Core i7-3770k, modello di punta della famiglia Ivy Bridge.
.
Ancora con Handbrake notiamo tempi di transcodifica assolutamente interessanti anche se del tutto simili a quelli del modello FX-8150.
I tempi legati all'esecuzione di applicazioni per sviluppo software JAVA contenute nella suite Da Capo pongono la nuova CPU agli stessi livelli delle altre soluzioni della famiglia Bulldozer (si tenga conto che questo benchmark ha una tolleranza molto elevata, nell'ordine del 7% circa).
La piattaforma AMD continua a dimostrare un buon feeling con le applicazioni di produttività tanto che nel test specifico del PCMark Vantage ritroviamo il sistema da noi utilizzato per le prove in terza posizione molto vicino a quello basato sulla sorella FX-8150 o sul top di gamma della famiglia Ivy Bridge a marchio Intel.
Prestazioni con giochi 3D
Abbiamo utilizzato alcuni giochi 3D per capire quanta potenza le CPU riescano a fornire alla scheda grafica. Per compatibilità con i vecchi risultati, le prove sono state eseguite con scheda grafica Radeon HD 4850 ad un livello di dettaglio e risoluzione contenuti.
Il punteggio ottenuto con il 3DMark06 non è così favorevole alla CPU AMD FX-8120 che non riesce a confrontarsi a viso aperto con i modelli di ultima generazione.
Lo stesso accade anche con Crysis ove le prestazioni della CPU in esame sono vicine a quelle del precedente Phenom II X6 1090T ma ben al di sotto di quelle garantite da Core i5-2500k e compagni.
Molto bene invece con Call of Juarez, gioco col quale la CPU in esame riesce a raggiungere quasi la vetta della classifica battuta solo dal Core i7-3770k Ivy Bridge.
Consumi
I consumi del sistema sono stati valutati misurando l'assorbimento alla presa di corrente ed effettuando rilevazioni in IDLE (solo desktop e servizi in background, occupazione CPU 0%) e sotto sforzo (CPU Stability Test). I valori riportati in tabella tengono conto anche di un fattore di correzione relativo all'alimentatore utilizzato:
-
I valori vanno considerati solo in termini comparativi, non assoluti, in quanto includono l'efficienza dell'alimentatore;
-
L'efficienza dell'alimentatore non è lineare ma segue una curva che tenderebbe a penalizzare i consumi ridotti. Abbiamo perciò applicato una correzione percentuale utile a rendere circa lineare la curva di inefficienza.
Una minima ottimizzazione dei consumi sembra ci sia stata. In modalità IDLE il nostro sistema ora consuma meno di quello basato su CPU Bulldozer FX-8150 o FX-8120, pur non riuscendo ancora a raggiungere gli ottimi valori delle piattaforme Intel.
Sotto stress la CPU FX-8350 dimostra di potersi comportare ancora bene ponendosi su valori inferiori a quelli della sorella FX-8150 nonostante le maggiori prestazioni in grado di fornire.
Un test effettuato con WPrime conferma quanto appena visto.
Overclock
Grazie alla presenza di un moltiplicatore completamente sbloccato è davvero semplice eseguire un overclock sulle CPU AMD FX-series, specie se si è alla ricerca di una ottimizzazione da usare quotidianamente per ottenere un miglioramento delle prestazioni del sistema. Questo primo tipo di overclock, effettuato dunque senza agire in maniera marcata né sul sistema di raffreddamento né sulla tensione di core, ci ha portato a raggiungere la frequenza massima di 4,6 GHz.
Per restare all'interno di una condizione di piena stabilità e sicurezza anche nel caso di eccessivo surriscaldamento, abbiamo lasciato funzionare la CPU un gradino più in basso, ovvero a 4,5GHz usando un moltiplicatore di 22,5x. In tali condizioni abbiamo eseguito una serie di test ed ottenuto i seguenti risultati:
Scalabilità in overclock | |||
Default (Turbo ON) | Overclock @4,5GHz (Turbo Off) | Differenza | |
Cinebench 11.5 - CPU | 6.93 | 6.92 | 0% |
Cinebench R10 - Single CPU | 4322 | 4830 | +11,8% |
Cinebench R10 - Multiple CPU | 23354 | 26388 | +13% |
Povray 3.6 (s) | 441 | 410 | +7,5% |
Povray 3.7 (s) | 54 | 48.2 | +12% |
AutoGK (s) | 68 | 64 | +6% |
Truecrypt - AES (MS/s) | 3300 | 3500 | +6,1% |
Truecrypt - Twofish (MB/s) | 777 | 875 | +12,6% |
7-zip (MIPS) | 22449 | 23916 | +6,5% |
Se invece l'obiettivo è quello di raggiungere il massimo valore di frequenza possibile, allora è necessario far leva sulla tensione di core e sul sistema di raffreddamento. Migliorando questi parametri è stato possibile raggiungere i 5115MHz (alzando la tensione di core dagli 1,35V circa a 1,52V).
Gestione dei thread
Le varie prove effettuate e l'esperienza accumulata con la precedente piattaforma ci hanno portato a valutare le prestazioni del sistema anche in presenza di più software capaci di sfruttare a dovere ambienti multi-core ed allo stesso tempo imporre un forte carico sulla CPU.
Così abbiamo effettuato una valutazione delle performance del processore utilizzando contemporaneamente più software. Nella prima prova abbiamo analizzato le differenze prestazionali registrate in Cinebench 11 (singolo core e multi-core) eseguito in concomitanza ad una sessione di WPrime.
Esecuzione contemporanea di più applicazioni | ||
Singola applicazione | CB + WPrime | |
Cinebench 11.5 - CPU | 6.93 | 6.92 |
Cinebench 11.5 - CPU (Single Core) | 1.10 | 1.09 |
Il risultato è praticamente identico! Ci rendiamo conto che effettivamente si tratta di una situazione quasi inspiegabile se non pensando ad una gestione delle priorità che avvantaggia Cinebench. Risultati molto vicini a questi sono stati ottenuti anche con la piattaforma Bulldozer utilizzando una CPU FX-8120 mentre con un modello Intel Sandy Bridge-E la differenza è più sensibile.
Occupazione di CPU durante l'esecuzione di Cinebench 11.5 insieme a WPrime
Ma cosa accade se invece di WPrime provassimo ad usare un altro software? Prendiamo come esempio 7-zip e vediamo come vanno ora le cose:
Esecuzione contemporanea di più applicazioni | ||
Singola applicazione | CB + 7-zip | |
Cinebench 11.5 - CPU | 6.93 | 2.82 |
Cinebench 11.5 - CPU (Single Core) | 1.10 | 0.77 |
7-zip - MIPS | 22449 | 21731 |
Questa volta il calo prestazionale è davvero importante, specie nella componente multi-core di Cinebench 11.5. In ogni modo il calo è inferiore (di poco) a quello che abbiamo registrato con una piattaforma concorrente Sandy Bridge o Ivy Bridge.
Occupazione di CPU durante l'esecuzione di Cinebench 11.5 insieme a 7-zip
Questo comportamento potrebbe essere spiegato dal fatto che lo sfruttamento delle risorse messe a disposizione dalle CPU Vishera a 8 core, anche da parte di software ottimizzati, non sempre è massimo. Ad esempio, utilizzando l'ultima versione di Winrar fortemente ottimizzata per ambienti multi-core mostra una occupazione media della CPU pari a circa il 90%.
Tutto ciò si riflette, specie quando viene eseguita una singola applicazione, anche sui risultati che avvantaggiano in un certo senso le CPU Intel che invece operano con la tecnologia HyperThreading per sfruttare al massimo ogni singolo core.
Conclusioni
Un modello come la CPU FX-8350 è quello che avrebbe dovuto vedere la luce al posto dell'FX-8150 o meglio ancora qualche mese prima. Sulla sua strada avrebbe trovato, all'epoca, un diretto concorrente come il Core i7-2600k, tranquillamente alla sua portata e, a quel punto, facilmente battibile sul piano del prezzo. AMD avrebbe potuto venderlo a 10 dollari in meno del rivale, garantirsi un margine ben più elevato di quello che poi ha ottenuto, ed avere nelle proprie mani un'arma davvero potente. Ma le nostre considerazioni valgono quanto carta straccia o anche meno, visto che la situazione reale è ben diversa e oggi il mercato delle CPU desktop è ben differente da quello di oltre un anno fa: Intel ha ormai completato del tutto la lineup delle sue CPU Ivy Bridge che, pur non regalando prestazioni entusiasmanti rispetto a Sandy Bridge, sono forti di un'eredità eccezionale e possono "campar di rendita".
AMD conscia di questo ha cercato di unire un certo incremento prestazionale rispetto alle CPU Bulldozer, ad una politica di prezzi molto aggressiva tanto da aver messo l'FX-8350 sullo stesso piano della CPU Core i5-3570k. Ciò significa che per meno di 200 dollari (195 per la precisione) è possibile avere una CPU potente quanto una soluzione concorrente da circa 250 dollari!
Peccato che le ottimizzazioni introdotte, pur garantendo un certo miglioramento dei consumi, non siano state sufficienti anche a rendere questa CPU competitiva sotto l'aspetto dell'efficienza: a tal proposito, uno dei punti sui quali a nostro avviso AMD dovrebbe lavorare è quello del design e - passando per terze parti - del processo produttivo. Sembrerà cosa scontata ma allora ci chiediamo come sia possibile che Intel riesca ad impacchettare lo stesso numero di transistor in un'area nettamente più piccola (si veda il confronto fra Sandy Bridge e Vishera) e questo nonostante GlobalFoundries dichiari che il suo processo a 32nm SOI (Silicon on Insulator) sia più denso di quello utilizzato da Intel.
La CPU FX-8350 risulta una valida soluzione anche nel campo dell'overclock: lasciando tutti i parametri inalterati ed agendo sul solo moltiplicatore (sbloccato) è stato possibile raggiungere frequenze dell'ordine dei 3,6 ~ 3,7GHz che potrebbero essere utilizzate anche in "daily" per avere un ulteriore 10% di vantaggio prestazionale. Migliorando la dissipazione con un sistema a liquido o anche solo con un radiatore ad aria più performante di quello stock non è difficile superare i 5GHz (noi siamo riusciti a superare i 5,1GHz con tensione di core di 1,52V e dissipatore ad aria).
Altro punto a favore di questa e delle altre novità AMD Vishera è sicuramente l'utilizzo del socket AM3+, forse uno dei più longevi della storia. Se avete già una scheda con chipset AMD serie 900 non avrete bisogno di cambiar nulla e potrete ottenere il massimo da questa piattaforma. Addirittura le nuove CPU funzionano anche su schede madri con chipset più datati come quelli serie 700 ed 800.
Tirando le somme, se cercate una CPU che offra un ottimo rapporto fra prezzo e prestazioni, supporto per applicazioni e ambienti multi-threading, potenzialità in overclock sia per potersi divertire sia per ottenere prestazioni superiori, il modello AMD FX-8350 rappresenta una soluzione ideale. Lo scotto è quello di accettare consumi abbastanza più elevati, dunque non pensatela come una piattaforma da mettere in salotto!