AMD ha da poco annunciato la nuova famiglia di APU, nome in codice Trinity, ma continua a spingere sulla vendita delle precedenti soluzioni desktop A-Series basate su Llano sia con modelli più performanti che con altri maggiormente attenti al costo d'acquisto ed ai consumi. Questa famiglia di processori dall'epoca della sua presentazione, avvenuta nell'estate del 2011, ad oggi ha subito diversi aggiornamenti che hanno garantito l'introduzione di nuovi modelli ed ora è in attesa dei suoi successori che arriveranno sul mercato probabilmente in Giugno (al momento AMD si è limitata alla fornitura delle soluzioni Trinity per notebook).
Le APU basate su architettura Llano rappresentano uno dei migliori esempi di integrazione ove i blocchi di CPU, core grafico e NorthBridge trovano posto all'interno di un singolo die realizzato con processo produttivo a 32nm SOI. Con le sue proposte AMD resta in balia di Intel per la parte x86 mentre riesce a dare un contributo molto forte alla causa dei core grafici integrati tanto da poterli definire di classe discreta. Un bilanciamento, quello delle APU, che pende di più verso un maggiore supporto alle applicazioni visive ed alla gestione dei flussi video in alta definizione. Manca, a nostro avviso, una chiara indicazione circa risparmi energetici importanti: più che un miglioramento delle prestazioni x86 sarebbe dunque auspicabile avere TDP più parsimoniosi che al momento, invece, spaziano in un range da 65W a 100W.
Allo stesso tempo, il nostro auspicio è quello di cominciare a vedere una maggiore diffusione di software che siano in grado di sfruttare tutte le potenzialità di un sistema GPGPU: gli standard ci sono (OpenCL) e le CPU con iGPU stanno diventando sempre più numerose. Basta solo la volontà degli sviluppatori ed un modo per far sì che l'utilizzo di simili tecnologie sia vantaggioso ma comunque trasparente per l'utente finale.
Parte di queste migliorie sono state prese in considerazione con la famiglia Trinity anche se l'aumento dell'efficienza è confinato ad ottimizzazioni non legate al processo produttivo e tangibili quasi solo nella declinazione mobile. Per vedere i modelli destinati al settore desktop sarà necessario attendere qualche settimana ancora ma il loro TDP non cambia rispetto a quello di Llano. Con Trinity AMD ha comunque fatto un ulteriore passo avanti in quello che è il suo progetto Fusion che dovrà portare ad una architettura completamente integrata nella quale i principali blocchi di un sistema di computing saranno "fusi" assieme.
Le APU Llano A-Series
Le APU A-Series basate su Llano includono fino a 4 core “Stars” realizzati a 32nm, un chip grafico Radeon “Sumo” che nella sua versione più potente fa perno su ben 400 shader processor, un controller delle memorie dual-channel compatibile con moduli DDR3-1866, controller PCI Express con 16 linee e modulo UVD per la decodifica di flussi video.
La complessità architetturale ci porta a dover confrontare queste APU con le CPU Intel Core Sandy Bridge e Ivy Bridge ma non è quella la fascia di prezzo a cui mira AMD. O meglio, non è una fascia di prezzo così ampia. Con le CPU Core Intel offre modelli per la fascia bassa del mercato (Core i3), per la fascia media (Core i5) e per la fascia alta (Core i7) mentre lascia alle CPU Core i7 della famiglia Sandy Bridge-E la fascia estrema così come ai modelli Pentium / Celeron quella entry level. Il paragone corretto da considerare per le APU A-Series, dunque, è quello delle CPU Intel Core i3 e Core i5.
Specifiche APU AMD Llano | |||
AMD Llano | Intel Sandy Bridge | Intel Ivy Bridge | |
Socket | FM1 | LGA 1155 | LGA 1155 |
Transistor | 1,45 miliardi | 995 milioni | 1,4 miliardi |
Processo produttivo | 32nm SOI GF | 32nm | 22nm |
Dimensioni die | 228mm2 | 216mm2 | 160mm2 |
Cache L1 | 128 KB per core | 64 KB per core | 64 KB per core |
Cache L2 | 1MB per core | 256 KB per core | 256 KB per core |
Cache L3 | N/A | 8 MB | 8 MB |
Core / Thread | 4/4 | 4/8 | 4/8 |
Turbo | Si | Si | Si |
FPU | 128-bit | 128-bit | 128-bit |
Controller memorie | - DDR3-1866 - Dual-channel |
- DDR3-1333 - Dual-channel |
- DDR3-1600 - Dual-channel |
Controller grafico | - Radeon series - DirectX 11 - UVD3 |
- Intel HD Graphics - DirectX 10.1 - Quick Sync |
- Intel HD Graphics - DirectX 11 - Quick Sync |
Controller PCI Express | 16 linee | 16 linee | 16 linee |
Risparmio energetico | - Più stati low-power - PCIe core power gating - PCIe speed power policy - GPU e video decode (UVD3) power gating - AMD Turbo Core (ove previsto) |
- Più stati low-power - CPU core power gating - GPU power gating - Turbo Boost (ove previsto) |
- Più stati low-power - CPU core power gating - GPU power gating - Turbo Boost (ove previsto) |
TDP | 65W e 100W | 65W e 95W | 65W e 77W |
Il numero di transistor di Llano è molto simile a quello che Intel ha integrato nelle CPU Ivy Bridge per le quali è stato necessario un processo produttivo di 22nm. Dunque tutto sommato la fatica di AMD è stata non poca al fine di mantenere un TDP su livelli accettabili, probabilmente raggiunti anche grazie ad estensive tecniche di power gating. A differenza di Intel, però, il maggior numero di transistor non è impiegato in mastodontiche cache L3, che pure sarebbero molto utili, bensì nel core grafico. Il sistema di cache delle APU Llano prevede due livelli contro i tre di Ivy Bridge e Sandy Bridge i quali possono sfruttare il terzo livello della cache anche per le comunicazioni fra CPU e iGPU.
Questo scambio dati nelle APU AMD deve avvenire passando per il controller delle memorie e questo spiega il perché un piccolo miglioramento della banda di memoria porta vantaggi molto importanti nelle prestazioni del controller grafico e perché AMD ha scelto di spingersi fino al supporto di moduli DDR3-1866 con le APU Llano.
Architettura delle APU
La parte x86 delle APU Llano A-Series può contare su due, tre o quattro core Stars che si appoggiano ognuno ad 1MB di cache L2 e 128KB di cache L1. AMD è riuscita ad ottenere un IPC migliorato del 6% circa rispetto ai core di precedente generazione dei Phenom II a 45nm (Deneb) proprio grazie alla cache L2 più ampia e a varie ottimizzazioni sul prefetch e sui buffer di reorder e load/store.
Nel complesso l'architettura non è però molto differente da quella delle CPU Phenom II la quale a sua volta si basa su un progetto vecchio ormai di 5 anni. Trinity utilizza invece core derivati dall'architettura Bulldozer.
Il controller delle memorie utilizzato in Llano permette di gestire moduli DDR3 dual-channel con frequenza massima di 1866MHz ottenendo così una banda dati massima di quasi 30GB/s, sicuramente utile per il core grafico integrato. Occorre tenere però a mente che ci sono delle limitazioni, ovvero per raggiungere stabilmente una frequenza di 1866MHz non si possono installare più di un modulo di memoria per ogni canale.
Essendo la risorsa "memoria" condivisa fra GPU e CPU, AMD ha deciso di gestirla con una politica di allocazione dinamica delle priorità, cosa che potrebbe garantire al chip grafico quasi un accesso esclusivo quando usato per far girare applicazioni 3D (in genere gli applicativi attuali sfruttano difficilmente sia i quattro x86 ed il chip grafico).
Che AMD con le APU voglia fornire un supporto concreto ai casual gamer non rappresenta di certo una novità: per farlo il produttore parte da una architettura di una "vera" GPU discreta tagliando qua e la per risparmiare sul numero di transistor e sui consumi ma lasciando comunque intatta la composizione nel suo complesso. Quel che ne deriva è non solo un chip grafico integrato potente quanto non mai, con prestazioni vicine a quelle di una scheda grafica discreta entry-level, ma anche una soluzione compatibile con tutte le ultime tecnologie in fatto di 3D, accelerazione video e supporto GPGPU.
Nello specifico è stata presa l'architettura Redwood a shader unificati di tipo VLIW 5 delle Radeon HD 5570 e 5670 e sono stati eliminati i controller delle memorie, il modulo Eyefinity e quello CrossFireX. Al contempo AMD ha aggiornato il modulo per l'accelerazione video UVD alla terza generazione, ha lasciato intatto il pieno supporto alle DirectX 11, alla tessellation, agli Shader Model 5.0, al DirectCompute ed alle API OpenGL 4.1. Nessun problema anche per i filtri di anti-aliasing e per il texture filtering nonostante crediamo che, per motivi di prestazioni, nessuno si sognerebbe di giocare con una APU attivando questi filtri.
Specifiche tecniche GPU Sumo vs. GPU entry-level | |||||
GeForce GT 430 | Radeon HD 5570 | Radeon HD 6550D | Radeon HD 6530D | Radeon HD 6410D | |
Sigla GPU | GF108 | Redwood | Sumo | Sumo | Sumo |
Nodo | 40nm | 40nm | 32nm | 32nm | 32nm |
Transistor | 585 milioni | 627 milioni | ~600 milioni | ~600 milioni | ~600 milioni |
Die | 130mm2 | 104mm2 | ~100mm2 | ~100mm2 | ~100mm2 |
Frequenza GPU | 700MHz | 650MHz | 600MHz | 443MHz | 600MHz |
Frequenza shader | 1400MHz | 650MHz | 600MHz | 443MHz | 600MHz |
Banda memoria | 28,8GB/s | 57,6GB/s | 29,8GB/s* | 29,8GB/s* | 29,8GB/s* |
Texture unit | 16 | 20 | 20 | 16 | 8 |
ROPs | 8 | 8 | 8 | 8 | 4 |
Texture fillrate | 11,2GT/s | 13GT/s | 12GT/s | 7,1GT/s | 4,8GT/s |
Pixel fillrate | 5,6GP/s | 5,2GP/s | 4,8GP/s | 3,5GP/s | 2,4GP/s |
MSAA hardware | Si | Si | Si | Si | Si |
Shader processor | 96 | 80 | 80 | 64 | 32 |
Numero di ALU | 96 | 400 | 400 | 320 | 160 |
Shader processor | Scalare | VLIW5 | VLIW5 | VLIW5 | VLIW5 |
Geometry shader | Si | Si | Si | Si | Si |
DirectX | DX 11 | DX 11 | DX 11 | DX 11 | DX 11 |
Shader model | 5.0 | 5.0 | 5.0 | 5.0 | 5.0 |
DirectCompute | 11 | 11 | 11 | 11 | 11 |
OpenCL | Si | Si | Si | Si | Si |
OpenGL | 4.1 | 4.0 | 4.1 | 4.1 | 4.1 |
Engine video | PureVideo HD VP4 | UVD 2 | UVD 3 | UVD 3 | UVD 3 |
Decodifica | -MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
HDMI audio | Esterno | 7.1-ch | 7.1-ch | 7.1-ch | 7.1-ch |
HDMI | 1.4a | 1.3 | 1.4a | 1.4a | 1.4a |
Guardando la tabella delle specifiche si intuisce subito che non è possibile paragonare la iGPU di Llano con un chip grafico integrato come tradizionalmente lo si intende. Con un piccolo sforzo possiamo però provare a realizzare una tabella comparativa fra Sumo e Intel HD Graphics serie 3000 (Sandy Bridge) e serie 4000 (Ivy Bridge).
Specifiche tecniche GPU Sumo vs. iGPU Intel | |||
APU AMD | Sandy Bridge | Ivy Bridge | |
Denominazione | HD 6550D | HD 3000 | HD 4000 |
Frequenza chip | 600 MHz | 1350 MHz | 1350 MHz |
Shader Processors | 400 | 12 | 16 |
TMU | 20 | 1 | 2 |
Memoria | UMA | UMA | UMA |
DirectX / SM | 11 / 5.0 | 10.1 / 4.1 | 11 / 4.1 |
OpenGL | 4.1 | 3.0 | 3.1 |
OpenCL | Si | No | Si |
Decodifica MPEG2, VC1, AVC | Si | Si | Si |
Codifica H.264 | Si | Si | Si |
Codifica MPEG2 | Si | Si | Si |
Decodifica Dual Video | No | Si | Si |
HD Security PAVP | Si | Si | Si |
HD Security HDCP | Si | Si (dual stream) | Si (dual stream) |
Tecnologie proprietarie | UVD 3 | Quick Sync Video | Quick Sync Video |
Versione HDMI | 1.4a + 3D | 1.4 + 3D | 1.4 + 3D |
Audio over HDMI | Si | Si | Si |
Uscite video | DP, HDMI, VGA, DVI | DP, HDMI, VGA, DVI | DP, HDMI, VGA, DVI |
Risoluzione massima | 2560x1600 | 2560x1600 | 2560x1600 |
Display indipendenti | 2 | 2 | 3 |
Intel prova ad insistere sulla frequenza di funzionamento dei suoi chip grafici e, molto facilmente, riesce a spingersi ben oltre il GHz grazie ad una architettura di base davvero semplicistica: basti notare la differenza nel numero di texture unit e di unità di calcolo per comprendere quale sia la differenza di approccio dei due produttori.
L'upgrade alla versione 3.0 del modulo UVD ha permesso ad AMD, infine, di supportare meglio la decodifica di file MPEG-4 Part 2 (DivX ed XviD) oltre a quelli MPEG-2, MVC, VC-1, H.264 e Blu-ray 3D. Rispetto all'UVD 2, il nuovo modulo di accelerazione video è più efficiente nel playback perché usa i suoi moduli fixed function per tutte le fasi del processo di decodifica mentre in precedenza alcune funzioni erano demandate agli shader della GPU, poco ottimizzati per questi scopi. Insomma, il modulo UVD 3 diventa un po' come il modulo Intel Quick Sync Video anche se quest'ultimo esegue funzionalità diverse.
La famiglia di APU
Rispetto al set di prodotti inizialmente reso disponibile, AMD ha aggiunto diverse APU, alcune quad-core compresi modelli della serie K con moltiplicatore completamente sbloccato, altre dual-core e persino un modello triple-core. Nella tabella seguente abbiamo riportato tutti i dettagli.
Elenco processori AMD ed Intel | ||||||||||||
Modello | Core | PP | Socket | Freq. | Turbo | Core/Th | L2 | L3 | Mem. | GPU | TDP | |
Processori AMD | ||||||||||||
AMD A8-3870K | Star | 32nm | FM1 | 3,0GHz | N/A | 4/4 | 4MB | N/A | DDR3 | HD 6550D | 100W | |
AMD A8-3850 | Star | 32nm | FM1 | 2,9GHz | N/A | 4/4 | 4MB | N/A | DDR3 | HD 6550D | 100W | |
AMD A8-3820 | Star | 32nm | FM1 | 2,5GHz | 2,8GHz | 4/4 | 4MB | N/A | DDR3 | HD 6550D | 65W | |
AMD A8-3800 | Star | 32nm | FM1 | 2,4GHz | 2,7GHz | 4/4 | 4MB | N/A | DDR3 | HD 6550D | 65W | |
AMD A6-3670K | Star | 32nm | FM1 | 2,7GHz | N/A | 4/4 | 4MB | N/A | DDR3 | HD 6530D | 100W | |
AMD A6-3650 | Star | 32nm | FM1 | 2,6GHz | N/A | 4/4 | 4MB | N/A | DDR3 | HD 6530D | 100W | |
AMD A6-3620 | Star | 32nm | FM1 | 2,2GHz | 2,5GHz | 4/4 | 4MB | N/A | DDR3 | HD 6530D | 65W | |
AMD A6-3600 | Star | 32nm | FM1 | 2,1GHz | 2,4GHz | 4/4 | 4MB | N/A | DDR3 | HD 6530D | 65W | |
AMD A6-3500 | Star | 32nm | FM1 | 2,1GHz | 2,4GHz | 3/3 | 3MB | N/A | DDR3 | HD 6530D | 65W | |
AMD A4-3420 | Star | 32nm | FM1 | 2,8GHz | N/A | 2/2 | 1MB | N/A | DDR3 | HD 6410D | 65W | |
AMD A4-3400 | Star | 32nm | FM1 | 2,7GHz | N/A | 2/2 | 1MB | N/A | DDR3 | HD 6410D | 65W | |
AMD A4-3300 | Star | 32nm | FM1 | 2,5GHz | N/A | 2/2 | 1MB | N/A | DDR3 | HD 6410D | 65W | |
AMD Phenom II X4 910e | Deneb | 45nm | AM3 | 2,6GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 65W | |
AMD Phenom II X4 905e | Deneb | 45nm | AM3 | 2,5GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 65W | |
AMD Phenom II X4 900e | Deneb | 45nm | AM3 | 2,4GHz | N/A | 4/4 | 2MB | 6MB | DDR2/3 | N/A | 65W | |
Processori Intel | ||||||||||||
Intel Core i5-2390T | SB | 32nm | LGA 1155 | 2,70GHz | 3,50GHz | 2/4 | 128KB/0,5MB | 3MB | DDR3 | HD 2000 | 35W | |
Intel Core i5-2300 | SB | 32nm | LGA 1155 | 2,80GHz | 3,10GHz | 4/4 | 128KB/0,5MB | 6MB | DDR3 | HD 2000 | 95W | |
Intel Core i3-2105 | SB | 32nm | LGA 1155 | 3,10GHz | N/D | 2/4 | 128KB/0,5MB | 3MB | DDR3 | HD 3000 | 65W | |
Intel Core i3-2100T | SB | 32nm | LGA 1155 | 2,50GHz | N/D | 2/4 | 128KB/0,5MB | 3MB | DDR3 | HD 2000 | 45W | |
Intel Core i3-2100 | SB | 32nm | LGA 1155 | 3,10GHz | N/D | 2/4 | 128KB/0,5MB | 3MB | DDR3 | HD 2000 | 65W |
Le APU Llano A-Series non differiscono nel loro aspetto dalle CPU Phenom II e Bulldozer. Ciononostante il socket che AMD propone per queste CPU è ben diverso, FM1 nella fattispecie, invece che l'ormai abituale AM2 / AM3 (con o senza segno più).
L'heatspreader è sempre presente e su di esso una serie di serigrafie riportano le indicazioni del modello corretto.
I piedini, a differenza di quanto accade per le CPU Intel delle ultime generazioni, fuoriescono dal package della CPU e vanno ad infilarsi nei fori del socket FM1. Un piccolo triangolino in rame indica il giusto posizionamento della APU nel socket.
Sistemi di prova
Per eseguire i test sulle CPU abbiamo rispettato le seguenti regole:
- Sulla scheda sono stati installati solo i componenti necessari: CPU, Memoria, Scheda video e Hard disk.
- L'hard disk è stato formattato, sono stati poi installati il sistema operativo, i drivers per le periferiche e, quando necessario, sono state installate patch e aggiornamenti.
- Ogni test è stato ripetuto per tre volte e, se i risultati di qualche test si mostrano troppo lontani dalla media (elevata varianza), il test stesso è stato di nuovo ripetuto, scartando il risultato non corretto.
- Alla fine di ogni sessione di prova l'hard disk è stato formattato.
In merito ai sistemi di prova, ci siamo serviti di differenti piattaforme a seconda del tipo di CPU. Ciò è stato necessario per ottenere un sistema funzionante per ogni tipo di Socket che le CPU utilizzate per la nostra comparazione utilizzano. Ovviamente si è cercato di realizzare i sistemi con componenti simili, quando possibile, uguali.
Sistema di prova | |
Sistema Socket AM3+ | |
Scheda madre | ASUS Crosshair V Formula AMD 990FX |
Processori | AMD FX-8150 (3,6GHz, Turbo 4,2GHz, 8MB L2, 8MB L3, eight core) |
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1866MHz |
Sistema Socket FM1 | |
Scheda madre | ASRock A75 Pro4 con FHX A75 socket FM1 |
Processori |
|
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket AM3 | |
Scheda madre | ASUS Crosshair IV Formula AMD 890FX |
Processori |
|
Memoria | 2GB DDR3 1600 OCZ (1GB x 2) @ 9/9/9/24 - 1333MHz |
Sistema Socket AM2+ | |
Scheda madre | Gigabyte GA-MA790GP AMD 790FX |
Processori |
|
Memoria | 2GB DDR2 1066 Corsair (1GB x 2) @ 5/7/7/24 - 1066MHz |
Sistema Socket LGA 2011 | |
Scheda madre | Intel DX79SI Siler X79 Express |
Processori | Intel Core i7-3960X (3,3GHz, Turbo 3,9GHz, 1,5MB L2, 15MB L3, six core) |
Memoria | 8GB DDR3 2000 (4 x 2GB) @ 1600MHz |
Sistema Socket 1155 LGA (Ivy Bridge) | |
Scheda madre | Intel DZ77GA-70K (Gasper) |
Processori | Core i7-2700K - Turbo Mode ON |
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket 1155 LGA (Sandy Bridge) | |
Scheda madre | ASUS P8Z68 |
Processori |
|
Memoria | 4GB DDR3 2000 (2 x 2GB) @ 1333MHz |
Scheda video | Intel GMA HD 3000 integrata |
Sistema Socket 1156 LGA (Lynnfield) | |
Scheda madre | Intel DP55KG Extreme |
Processori |
|
Memoria | 2GB DDR3 1333 (2 x 1GB) |
Sistema Socket 1156 LGA (Clarkdale) | |
Scheda madre | Intel DH55TC |
Processori | Core i5 661 - Turbo Mode ON |
Memoria | 2GB DDR3 1333 (2 x 1GB) |
Scheda video | Intel GMA HD |
Sistema Socket 1366 LGA | |
Scheda madre | ASUS P6T Intel X58 |
Processori |
|
Memoria | 3GB DDR3 1066 (3 x 1GB) |
Opzioni Comuni | |
Hard Disk | Maxtor 160GB 7200RPM Serial ATA |
Scheda video | Radeon HD4850 512MB |
Scheda audio | Integrata |
Media | DVD Rom 8x |
Alimentatore | Corsair 620W |
Sistema operativo | Windows 7 64-bit |
I test eseguiti sono descritti qui di seguito:
Benchmark sintetici
-
Fritz Chess Benchmark: questo è un tool che misura la potenza del processore di sistema utilizzando il motore per la creazione di giochi di scacchi "Fritz 9 engine". Il risultato del test è espresso in nodi per secondo medi. Il software è fortemente ottimizzato per girare in ambienti multicore ed è capace di attivare fino ad 8 thread contemporaneamente.
-
ScienceMark 2.0: grazie a ScienceMark è possibile misurare le prestazioni del sistema in ambiente di calcolo spinto. Inoltre il software misura le prestazioni della memoria di sistema e della cache integrata nella CPU.
- SiSoft SANDRA 2010: questa suite di benchmark sintetici ci offre un quadro specifico delle prestazioni di ogni componente disponibile all'interno della piattaforma di test come memorie, CPU, disco fisso e così via.
Grafica 3D
-
3DMark06 (versione 1.1.0 Professional): ci permette di valutare le prestazioni grafiche 3D offerte dal sistema. Nel suo computo sono inclusi, in particolare, la CPU, la memoria di sistema ed il controller grafico.
-
World In Conflict (RTS): si tratta di uno strategico in tempo reale, che unisce a questo tipo di giochi una visuale simile a quella degli sparatutto in prima persona e che fa degli effetti particellari e della fisica le sue armi migliori.
-
Crysis: uno dei più indicativi titoli 3D DirectX 10 per effetti grafici e per l´utilizzo della fisica.
Utilizzo generico
-
PovRay (versione 3.6): il tool Persistence of Vision Raytracer (PovRay) permette di creare grafica tridimensionale di elevata qualità. Al suo interno troviamo una scena standard creata proprio per effettuare benchmark sulla CPU che sfrutta la maggior parte delle feature disponibili con questo software. Per rendere ripetibili i nostri test utilizziamo sempre le impostazioni di default del file .ini.
-
Cinebench (versione 10 e versione 11): suite di test multi-piattaforma basato sul software di animazione CINEMA 4D ampiamente utilizzato da studi e case di produzione per la creazione di contenuti 3D. Grazie ad esso possiamo valutare le performance del sottosistema CPU seppure l'influenza di chipset, memorie e scheda grafica installate nel sistema non può essere trascurata. Il software esegue un test di rendering capace di sollecitare uno o tutti i core del processore disponibili.
-
7-Zip (versione 9.15 beta): con questo noto software di compressione dati eseguiamo due diversi benchmark. Il primo viene realizzato utilizzando il tool integrato che restituisce una indicazione sui MIPS (million instructions per second) che il sistema è in grado di offrire (potete confrontare i risultati ottenuti con quelli ufficiali e con quelli del vostro sistema). Il secondo invece prende in considerazione una situazione reale nella quale viene richiesto al sistema di comprimere in formato 7z una cartella da 5,36GB contenente 4.379 file di diversa dimensione e tipologia (immagini, testo, html, video, foto, applicazioni) e 536 sottocartelle e poi di decomprimere la stessa. L'operazione di compressione ha una forte dipendenza dalla memoria cache della CPU e dalla memoria RAM installata nel sistema. Quella di estrazione dipende molto, invece, dalla capacità della CPU di gestire le operazioni su interi. In tutti i casi, il software sfrutta abbastanza bene tutte le risorse (core) di CPU a disposizione.
-
Auto Gordian Knot (versione 2.55): software utile per effettuare backup di DVD o comunque operazioni di transcodifica video nei formati DivX ed XviD. Per le nostre prove utilizziamo il codec XviD che il tool installa di default ed eseguiamo il ripping di un completo DVD (Codice Swordfish) che per l'occasione abbiamo memorizzato su un disco fisso e lo "comprimiamo" in modo da farlo entrare su due CD.
-
Handbrake (versione 0.9.4): un software di transcodifica video open-source multipiattaforma e multithreaded con il quale effettuiamo una conversione video di un intero DVD (Codice Swordfish) in formato adatto per i dispositivi Apple iPod, iPhone e iPad.
-
DaCapo (versione 9.12): questa suite di benchmark permette di valutare il comportamento del sistema quando si utilizzano tool di sviluppo per Java. Esso include tutta una serie di applicazioni reali open source fra cui Tomcat, FOP, Eclipse, Batik, Xalan e altri. Nel nostro caso riportiamo il tempo complessivo necessario all'esecuzione di tutti i test.
Unità di calcolo, cache e memoria
Analizziamo anzitutto le prestazioni per singolo core attraverso benchmark specifici non in grado di sfruttare ambienti multi-threaded. Questi benchmark servono non per individuare un indice di prestazioni generiche visto che ad oggi tutti i software (o almeno la maggior parte) è ottimizzata per lavorare su CPU multi-core, bensì per comprendere meglio le peculiarità di una architettura rispetto ad un'altra ed i casi in cui una maggiore frequenza di funzionamento oppure una differente dotazione di cache possa influire sulle prestazioni.
Science Mark, con i suoi algoritmi Molecular Dynamics e Primordia risulta essere un ottimo indicatore di come vanno le cose considerando un singolo core delle CPU in esame.
Le prestazioni single-core delle tre APU in prova le mettono sugli stessi livelli di una CPU Phenom II di prima generazione, come il modello Phenom II 940. Si nota facilmente che la leggera differenza in termini di tempi di calcolo fra la APU A8-3850 e la CPU Phenom II 940 sia dovuta solo alla frequenza di funzionamento di quest'ultima, di 100MHz superiore. Ovvio è anche il risultato che pone il modello A4-3400 (dual-core) davanti a quello A6-3650 (qaud-core).
Quanto appena detto lo ritroviamo anche nell'algoritmo Primordia il quale mette in luce, però, un avvicinamento fra le soluzioni AMD e quelle Intel probabilmente perché esso sfrutta meno la cache e dunque tende ad ammorbidire le differenze architetturali, lasciando la parola quasi solo alla frequenza di clock.
Al contrario di software come quelli appena visti, Fritz Chess e Truecrypt sono in grado di sfruttare al meglio architetture multi-core. Ecco come si presentano i risultati.
Fritz Chess è un engine di simulazione del gioco degli scacchi capace di sfruttare al massimo ambienti multi-threaded. In questo caso e' ovvio che i modelli che dispongono di un maggior numero di core (fisici o logici che siano) riescano a far meglio e così accade anche per le nostre APU. Il modello A4-3400 chiude la classifica sonoramente battuto dalla CPU Core i3-2100 mentre i due modelli quad-core A6-3650 ed A8-3850 riescono a far meglio ma non tanto da poter superare una CPU Core i5 750 (quad-core, no HT).
Con gli algoritmi di crittografia le cose vanno meglio, specie per i modelli quad-core che riescono a raggiungere quasi le prestazioni delle rivali Core i5-2500K Sandy Bridge. Il modello A4-3400 soccombe invece ancora una volta dietro la CPU Intel Core i3 2100.
Non avendo a disposizione un modulo di accelerazione delle operazioni di crittografia AES e' chiaro che non possiamo chiedere alle APU A-Series di fare gli stessi numeri delle rivali Intel SB ed IB. Escluse queste soluzioni, dunque, il quadro resta quello visto in precedenza.
Oltre alla pura potenza di calcolo è importante valutare la banda dati che le memorie - ed il controller delle memorie ormai integrato in tutte le CPU di nuova generazione - mettono a disposizione.
La banda dati misurata con il SiSoft SANDRA, pone le due APU quad-core un passetto al di sopra delle CPU Phenom II X4 mentre per il modello dual-core A4-3400 i numeri si fermano un gradino al di sotto di quelli dei più vecchi Phenom II. Il confronto con modelli concorrenti come i5 750 o i3-2100 non regge, nonostante la frequenza delle memorie sia la stessa (1333MHz): per poterli raggiungere è necessario utilizzare memorie DDR3-1866.
Anche Science Mark sembra essere d'accordo con il SiSoft SANDRA seppure in questo caso le APU riescono a garantire numeri migliori delle sorelle Phenom II e Phenom II X4.
Rendering e compressione
I software di rendering sfruttano sia le risorse grafiche che quelle di CPU, pertanto risultano un ottimo metodo di misurazione delle loro prestazioni. Prendiamo in considerazione, nel nostro batch di prove, PovRay e Cinebench 10.
Avevamo gia' avuto modo di capire che le prestazioni per singolo core delle APU AMD non possono essere paragonate con quelle delle rivali Intel: i tempi impiegati nel rendering con PovRay sono esattamente il risultato di tutto cio'. Il modello A8-3850 si posiziona quasi sugli stessi tempi del Phenom II 940 (hanno frequenze molto simili, che differiscono di soli 100MHz) mentre l'A4-3400, che funziona a 2,7GHz riesce a battere l'A6-3650 che invece funziona a 2,6GHz.
Ben diversa e' la situazione che ritroviamo in Cinebench 10 o almeno nel benchmark multi CPU della stessa suite. In questo caso il modello A8-3850 riesce a far meglio sia del Core i3-2100 sia del piu' vecchio i5 750, posizionandosi esattamente a ridosso del Phenom II X4 980. Il modello A6-3650, invece, nonostante i suoi quattro core fisici non riesce a superare il Core i3 2100 che invece ne ha solo due (fisici) raddoppiati dalla tecnologia Hyperthreading.
I risultati CPU del Cinebench 11 sono quasi una conferma di quanto visto con il Cinebench 10: le due APU quad-core sono inserite fra il Core i3 2100 ed il Core i7 920 mentre il modello A4 3400 fa esattamente la meta' dei numeri della CPU Sandy Bridge dual-core.
Con 7-zip la potenza troviamo un quartetto di CPU (AMD A8-3850, A6-3650 e Phenom II 940 ed Intel Core i5 750) appollaiate sugli stessi valori Il modello A4-3400 si ferma esattamente a meta'.
Codifica video
I software di codifica video permettono di stressare notevolmente i sottosistemi CPU e memorie, dunque niente di meglio per valutare le performance dei diversi processori.
Tempi tutto sommato interessanti quelli ottenuti dalle APU quad-core nella transcodifica di un video con il software XMPEG seppure le rivali Intel Core i3 2100 e Core i5 750 riescono a fare meglio. Il modello A4-3400 resta invece ben distanziato!
Nelle operazioni di transcodifica con Auto Gordian Knot le cose vanno un po' meglio per le APU Llano che riescono a battere nettamente i propri antenati (Phenom II) come anche le CPU Intel Core i7 920. Non riescono pero' ad insidiare quelle che possono essere considerate piu' diretta concorrenti.
Per le APU Llano quad-core le cose vanno bene in Handbrake, software ancora una volta atto ad effettuare "traduzioni" da un formati video all'altro. Lo stesso non possiamo dire per il modello A4-3400 che evidentemente accusa un ritardo eccessivo non solo a causa dei soli due core ma anche per la limitata disponibilita' di cache L2.
Prestazioni del core grafico
Le tre APU che abbiamo a disposizione per questo articolo integrano tre differenti GPU, basate sulla medesima architettura ma dotate di un differente numero di unità di calcolo, di texturing e di rastering, oltre impostate a frequenze anch'esse diverse. Vediamo dunque come si comportano a paragone con i core grafici integrati della rivale Intel, HD 3000 e HD 4000, oltre che rispetto a due VGA discrete come una GeForce GT 430 (GeForce GT 620) ed una Radeon HD 6570.
Stalker COP, eseguito con le impostazioni di qualità al massimo ma senza filtri di AA, resta comunque una brutta bestia da gestire. Il titolo è basato sulle API DirectX 10 e può girare perciò anche sulla iGPU delle CPU Sandy Bridge ma se non si dispone almeno di una APU A8-3850 con chip grafico 6550D la giocabilità è inesistente.
The Last Remnant (impostazioni qualità al massimo, no AA, DX9) è più leggero rispetto al precedente titolo e qui sia l'iGPU Intel HD 4000 che quella AMD 6550D se le cavano discretamente, anche alla risoluzione di 1680x1050. Gli fps del core grafico integrato nella APU A4-3400 sono molto vicini a quelli della stessa unità del Core i7-2600K.
Con Far Cry 2 (impostazioni qualità al massimo, no AA, DX10) ritroviamo una situazione simile a quella vista con TLR anche se la giocabilità in generale scende ed è garantita solo dalla APU A8-3850 a risoluzioni non superiori a 1280x1024.
Con Devil May Cry (impostazioni qualità al massimo, no AA, DX10), invece, tutte le CPU testate riescono a cavarsela in qualche modo fatta salva la APU A4-3400 che però a 1280x1024 riesce comunque a dire la sua.
HAWX 2 (impostazioni qualità al massimo, no AA, DX11) mette in luce una certa supremazia delle soluzioni Intel ma occorre dire che queste non riescono a gestire tutti gli effetti DirectX 11 del gioco allo stesso modo delle iGPU AMD. Anzi, nel caso del Core i7-2600K (HD 3000) gli effetti DX11 non possono proprio essere attivati in quanto la iGPU è di classe DirectX 10.
Alien vs. Predator (impostazioni qualità medie, no AA, DX11) non è un titolo per tutti! APU e core grafici integrati sono esclusi da questo titolo a meno di non usare impostazioni le più basse possibili e orientarsi sulla APU AMD A8-3850. Ovviamente il titolo non gira affatto sul core grafico Intel HD 3000.
La stessa esclusione vale anche per Lost Planet 2 (impostazioni qualità al massimo, no AA, DX11), anche se per questo titolo esiste una versione DirectX 10. Quel che possiamo notare è che nessuno dei core grafici integrati può far nulla di concreto e che la CPU Core i7-3770K con il suo HD 4000 riesce a fare gli stessi numeri della APU A8-3850: questo non è però dovuto alla potenza della iGPU stessa bensì alla maggiore potenza della CPU (se i core x86 della APU A8-3850 potessero esprimere la stessa potenza di quelli della CPU Core i7-3770K i numeri sarebbero ben diversi).
Applicazioni multimediali
Una CPU con core grafico integrato rappresenta un'ottima soluzione per sistemi multimediali, ai quali sono chiaramente demandati compiti di playback di video in alta definizione. Le APU AMD A-Series offrono una duplice opportunità, quella di eseguire la decodifica attraverso i core x86 e quella di sfruttare la GPU integrata che dispone del modulo UVD3. Per cercare di valutare la sua efficienza abbiamo eseguito alcuni test con due trailer in alta definizione, a risoluzione di 1080p.
Utilizzando la sola potenza dei core x86, alla APU A4-3400 serve il 50% della sua potenza per decodificare il flusso video del trailer di 300.
Esattamente lo stesso accade quando la decodifica è quella del trailer di The Simpson.
PowerDVD (ma anche altri player video) permettono di sfruttare il modulo UVD3 di queste APU per la decodifica video. Ecco dunque che in tal caso entrambi i flussi richiedono appena il 10% della potenza complessiva della APU durante le operazioni di playing.
Ovviamente con la APU A8-3850 le cose possono solo andare meglio, con una occupazione del tempo di CPU che si ferma al 40% quando viene effettuata anche la trasformazione in 3D del flusso video in alta definizione.
Software capaci di sfruttare la potenza della GPU per eseguire calcoli beneficiano molto anch'essi molto dalle APU. Ad esempio VReveal permette di applicare effetti in tempo reale molto pesanti per migliorare la qualità dei video. Utilizzando la sola potenza della CPU, con un video Full HD, non si riesce a vedere l'anteprima oppure non si superano i 4 fps con l'A8-3850. Utilizzando la iGPU si sale già a quasi 10 fps di media con l'A4-3400 e si raggiungono i 15 fps con l'A8-3850.
Consumi
Uno dei campi di sfida più importanti del nostro secolo sembra essere quello della riduzione dei consumi o meglio dell'incremento dell'efficienza energetica. Appare dunque scontato tenerne conto nelle nostre valutazioni. Seguono le misurazioni effettuate sull'assorbimento dell'intero sistema sfruttando il solo core grafico integrato (senza VGA esterna), in quattro diversi scenari.
In modalità IDLE (solo desktop 2D attivo) il sistema realizzato con le APU AMD A-Series si comporta bene ma non così tanto meglio delle CPU top di gamma della serie Ivy Bridge rivale Intel. Il modello A4-3400, come è lecito aspettarsi, è quello che consuma meno di tutti.
Stimolando i soli core x86 la situazione non appare molto rosea nei confronti delle concorrenti Intel. I due modelli quad-core consumano quanto, se non di più, dei modelli di punta delle famiglie Sandy Bridge ed Ivy Bridge. La APU A4-3400 è invece quella meno affamata di risorse, visti i soli due core a disposizione.
Passando invece ad una situazione nella quale ad essere messo sotto pressione è principalmente il core grafico integrato, i consumi sono tutti molto più vicini fra loro.
E' possibile ridurre ancora i consumi?
Inutile negarlo: le APU di AMD appaiono soluzioni quasi perfette per la realizzazione di sistemi a basso costo e HTPC. Sfruttando la discreta potenza dei core x86 - specie nel caso di modelli quad-core - e la relativamente buona potenza della iGPU è facile mettere in piedi un sistema aggiungendo solo scheda madre, memorie e disco rigido. L'eliminazione della scheda grafica discreta dalla lista dei componenti pesa molto in termini di risparmio economico ed energetico ma, grazie all'architettura di quella integrata derivata proprio da queste ultime, non si ha una forte penalizzazione sulle performance.
E' però possibile ottenere un sistema ancor più efficiente utilizzando queste APU? Per rispondere alla domanda è necessario capire cosa sia possibile fare in termini di overclock e/o di riduzione dei consumi. Nel primo caso non c'è quasi nulla da fare a meno di non prendere in considerazione i modelli della serie "K" che hanno moltiplicatori completamente sbloccati. Eliminata questa possibilità, resta quella di ridurre la tensione di funzionamento lasciando invariata la frequenza. Abbiamo eseguito alcuni test con tensioni di funzionamento inferiori a quella di default ed abbiamo verificato gli assorbimenti utilizzando i software WPRIME ed Alien vs. Predator (da soli o assieme per stimolare ora i core x86, ora la iGPU e ora entrambi).
Impostando la tensione ad un valore fisso di 1,3V, le tre APU in prova non mostrano segni di cedimento in quanto a stabilità. In IDLE non si notano però differenze relative ai consumi mentre sfruttando prettamente il modulo grafico integrato i consumi addirittura aumentano. Solo quando mettiamo sotto pressione i core x86 (con WPRIME oppure con WPRIME e AvP) notiamo dei risparmi energetici sostanziosi, fino a quasi il 10% per la APU A4-3400 che guarda caso è quella che meglio risponde al trattamento.
La situazione rimane molto simile anche quando abbassiamo ulteriormente la tensione fino a 1,2V. Ovviamente in questo caso il risparmio energetico aumenta, con il solo WPRIME in esecuzione anche fino ad oltre il 20% (nel caso della APU A8-3850). D'altro canto registriamo un incremento dei consumi quando girano applicazioni capaci di mettere sotto pressione il comparto grafico (Alien vs. Predator).
Il modello A6-3650, evidentemente grazie ad un esemplare molto fortunato capitato per le nostre mani, riesce a rimanere stabile in tutte le condizioni di test anche ad 1,1V (in realtà siamo riusciti ad abbassare la tensione fino ad 1,05V prima di cominciare a vedere qualche segno di cedimento), mentre gli altri due permettono solo di avviare Windows ma non di completare gli altri test. In queste condizioni la situazione dell'A6-3650 migliora rispetto al caso precedente ma non di tanto.
Conclusioni
Anche se le APU AMD di nuova generazione, nome in codice Trinity, sono state annunciate, le versioni desktop arriveranno più avanti e i modelli Llano restano prodotti molto interessanti. Possono essere impiegati con successo nella realizzazione di sistemi a basso costo, con consumi ridotti e che debbano essere integrati all'interno di spazi angusti. La loro migliore risposta la si ottiene sicuramente utilizzando il modulo grafico integrato mentre se necessitate di prestazioni 3D elevate da cercare in una VGA discreta dovrete necessariamente puntare ai modelli top di gamma come A8-3850 e A8-3870K oppure rivolgervi verso altri prodotti.
Per queste APU resta sempre in essere una forte contraddizione rispetto alla concorrenza, aspetto che però le rende anche più bilanciate: ci si trova, in effetti, di fronte a processori quad-core che si posizionano sugli stessi livelli prestazionali di modelli concorrenti dual-core oppure quad-core di almeno due generazioni fa (Core i3 2100 o Core i5 750). Se però guardiamo alle performance 3D della iGPU, queste sono superiori a quelle dei modelli top di gamma delle famiglie di CPU Intel Sandy Bridge ed Ivy Bridge e, come se non bastasse, supportando tutte le feature dei giochi DirectX 11 di ultima generazione, comprese tutte le modalità di AA. L'aggiunta alla iGPU di una VGA Radeon discreta di fascia bassa serve a ben poco, se non per "carpire" prestazioni leggermente migliori.
Con l'arrivo di Trinity AMD ha però mostrato una buona dose di vivacità negli accordi con le software house che hanno cominciato ad ottimizzare i propri prodotti anche per sfruttare la potenza GPGPU delle architetture Radeon, compresa in taluni casi quella delle APU Llano. Se si continuerà su questa strada - e visto che le vendite delle CPU "ibride" rappresentano ormai più della metà di tutto il venduto non vediamo controindicazioni - parte della potenza che dovrebbe essere garantita dai core x86 verrebbe invece fornita dalla iGPU che interverrebbe così anche nelle applicazioni 2D.
Qualche ottimizzazione dovrebbe essere fatta a livello di consumi anche se per ora AMD deve "accontentarsi" del processo produttivo a 32nm di GlobalFoundries, ancora utilizzato in Trinity. Dai nostri test è però emerso che forse un piccolo spazio in questa direzione esiste e permetterebbe un miglioramento dell'efficienza di un fattore pari al 10% circa. In taluni casi siamo riusciti ad abbassare di molto la tensione di funzionamento delle APU in prova e allora abbiamo ottenuto riduzioni anche del 20% e oltre.
Finora non abbiamo tirato in ballo il fattore prezzo ma considerandolo ci si rende conto che a partire dai 50 euro dell'A4-3400 e con un massimo di 100 euro dell'A8-3850 (il modello A6-3650 - che costa 90 euro - potrebbe essere non conveniente visto l'ottimo rapporto prezzo / prestazioni del fratello maggiore) si riesce a portare a casa quasi un sistema completo, cosa che gioca decisamente a favore di AMD (anche per i prodotti della rivale Intel varrebbe la stessa regola ma per avere iGPU con performance accettabili è necessario spostare la propria attenzione verso i modelli più costosi).