Architettura delle APU
La parte x86 delle APU Llano A-Series può contare su due, tre o quattro core Stars che si appoggiano ognuno ad 1MB di cache L2 e 128KB di cache L1. AMD è riuscita ad ottenere un IPC migliorato del 6% circa rispetto ai core di precedente generazione dei Phenom II a 45nm (Deneb) proprio grazie alla cache L2 più ampia e a varie ottimizzazioni sul prefetch e sui buffer di reorder e load/store.
Nel complesso l'architettura non è però molto differente da quella delle CPU Phenom II la quale a sua volta si basa su un progetto vecchio ormai di 5 anni. Trinity utilizza invece core derivati dall'architettura Bulldozer.
Il controller delle memorie utilizzato in Llano permette di gestire moduli DDR3 dual-channel con frequenza massima di 1866MHz ottenendo così una banda dati massima di quasi 30GB/s, sicuramente utile per il core grafico integrato. Occorre tenere però a mente che ci sono delle limitazioni, ovvero per raggiungere stabilmente una frequenza di 1866MHz non si possono installare più di un modulo di memoria per ogni canale.
Essendo la risorsa "memoria" condivisa fra GPU e CPU, AMD ha deciso di gestirla con una politica di allocazione dinamica delle priorità, cosa che potrebbe garantire al chip grafico quasi un accesso esclusivo quando usato per far girare applicazioni 3D (in genere gli applicativi attuali sfruttano difficilmente sia i quattro x86 ed il chip grafico).
Che AMD con le APU voglia fornire un supporto concreto ai casual gamer non rappresenta di certo una novità: per farlo il produttore parte da una architettura di una "vera" GPU discreta tagliando qua e la per risparmiare sul numero di transistor e sui consumi ma lasciando comunque intatta la composizione nel suo complesso. Quel che ne deriva è non solo un chip grafico integrato potente quanto non mai, con prestazioni vicine a quelle di una scheda grafica discreta entry-level, ma anche una soluzione compatibile con tutte le ultime tecnologie in fatto di 3D, accelerazione video e supporto GPGPU.
Nello specifico è stata presa l'architettura Redwood a shader unificati di tipo VLIW 5 delle Radeon HD 5570 e 5670 e sono stati eliminati i controller delle memorie, il modulo Eyefinity e quello CrossFireX. Al contempo AMD ha aggiornato il modulo per l'accelerazione video UVD alla terza generazione, ha lasciato intatto il pieno supporto alle DirectX 11, alla tessellation, agli Shader Model 5.0, al DirectCompute ed alle API OpenGL 4.1. Nessun problema anche per i filtri di anti-aliasing e per il texture filtering nonostante crediamo che, per motivi di prestazioni, nessuno si sognerebbe di giocare con una APU attivando questi filtri.
Specifiche tecniche GPU Sumo vs. GPU entry-level | |||||
GeForce GT 430 | Radeon HD 5570 | Radeon HD 6550D | Radeon HD 6530D | Radeon HD 6410D | |
Sigla GPU | GF108 | Redwood | Sumo | Sumo | Sumo |
Nodo | 40nm | 40nm | 32nm | 32nm | 32nm |
Transistor | 585 milioni | 627 milioni | ~600 milioni | ~600 milioni | ~600 milioni |
Die | 130mm2 | 104mm2 | ~100mm2 | ~100mm2 | ~100mm2 |
Frequenza GPU | 700MHz | 650MHz | 600MHz | 443MHz | 600MHz |
Frequenza shader | 1400MHz | 650MHz | 600MHz | 443MHz | 600MHz |
Banda memoria | 28,8GB/s | 57,6GB/s | 29,8GB/s* | 29,8GB/s* | 29,8GB/s* |
Texture unit | 16 | 20 | 20 | 16 | 8 |
ROPs | 8 | 8 | 8 | 8 | 4 |
Texture fillrate | 11,2GT/s | 13GT/s | 12GT/s | 7,1GT/s | 4,8GT/s |
Pixel fillrate | 5,6GP/s | 5,2GP/s | 4,8GP/s | 3,5GP/s | 2,4GP/s |
MSAA hardware | Si | Si | Si | Si | Si |
Shader processor | 96 | 80 | 80 | 64 | 32 |
Numero di ALU | 96 | 400 | 400 | 320 | 160 |
Shader processor | Scalare | VLIW5 | VLIW5 | VLIW5 | VLIW5 |
Geometry shader | Si | Si | Si | Si | Si |
DirectX | DX 11 | DX 11 | DX 11 | DX 11 | DX 11 |
Shader model | 5.0 | 5.0 | 5.0 | 5.0 | 5.0 |
DirectCompute | 11 | 11 | 11 | 11 | 11 |
OpenCL | Si | Si | Si | Si | Si |
OpenGL | 4.1 | 4.0 | 4.1 | 4.1 | 4.1 |
Engine video | PureVideo HD VP4 | UVD 2 | UVD 3 | UVD 3 | UVD 3 |
Decodifica | -MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
-MPEG2 -MPEG4 -H.264 -WMV -HD WMV -VC-1 -DivX -XviD |
HDMI audio | Esterno | 7.1-ch | 7.1-ch | 7.1-ch | 7.1-ch |
HDMI | 1.4a | 1.3 | 1.4a | 1.4a | 1.4a |
Guardando la tabella delle specifiche si intuisce subito che non è possibile paragonare la iGPU di Llano con un chip grafico integrato come tradizionalmente lo si intende. Con un piccolo sforzo possiamo però provare a realizzare una tabella comparativa fra Sumo e Intel HD Graphics serie 3000 (Sandy Bridge) e serie 4000 (Ivy Bridge).
Specifiche tecniche GPU Sumo vs. iGPU Intel | |||
APU AMD | Sandy Bridge | Ivy Bridge | |
Denominazione | HD 6550D | HD 3000 | HD 4000 |
Frequenza chip | 600 MHz | 1350 MHz | 1350 MHz |
Shader Processors | 400 | 12 | 16 |
TMU | 20 | 1 | 2 |
Memoria | UMA | UMA | UMA |
DirectX / SM | 11 / 5.0 | 10.1 / 4.1 | 11 / 4.1 |
OpenGL | 4.1 | 3.0 | 3.1 |
OpenCL | Si | No | Si |
Decodifica MPEG2, VC1, AVC | Si | Si | Si |
Codifica H.264 | Si | Si | Si |
Codifica MPEG2 | Si | Si | Si |
Decodifica Dual Video | No | Si | Si |
HD Security PAVP | Si | Si | Si |
HD Security HDCP | Si | Si (dual stream) | Si (dual stream) |
Tecnologie proprietarie | UVD 3 | Quick Sync Video | Quick Sync Video |
Versione HDMI | 1.4a + 3D | 1.4 + 3D | 1.4 + 3D |
Audio over HDMI | Si | Si | Si |
Uscite video | DP, HDMI, VGA, DVI | DP, HDMI, VGA, DVI | DP, HDMI, VGA, DVI |
Risoluzione massima | 2560x1600 | 2560x1600 | 2560x1600 |
Display indipendenti | 2 | 2 | 3 |
Intel prova ad insistere sulla frequenza di funzionamento dei suoi chip grafici e, molto facilmente, riesce a spingersi ben oltre il GHz grazie ad una architettura di base davvero semplicistica: basti notare la differenza nel numero di texture unit e di unità di calcolo per comprendere quale sia la differenza di approccio dei due produttori.
L'upgrade alla versione 3.0 del modulo UVD ha permesso ad AMD, infine, di supportare meglio la decodifica di file MPEG-4 Part 2 (DivX ed XviD) oltre a quelli MPEG-2, MVC, VC-1, H.264 e Blu-ray 3D. Rispetto all'UVD 2, il nuovo modulo di accelerazione video è più efficiente nel playback perché usa i suoi moduli fixed function per tutte le fasi del processo di decodifica mentre in precedenza alcune funzioni erano demandate agli shader della GPU, poco ottimizzati per questi scopi. Insomma, il modulo UVD 3 diventa un po' come il modulo Intel Quick Sync Video anche se quest'ultimo esegue funzionalità diverse.