Pagine

Architettura delle APU

La parte x86 delle APU Llano A-Series può contare su due, tre o quattro core Stars che si appoggiano ognuno ad 1MB di cache L2 e 128KB di cache L1. AMD è riuscita ad ottenere un IPC migliorato del 6% circa rispetto ai core di precedente generazione dei Phenom II a 45nm (Deneb) proprio grazie alla cache L2 più ampia e a varie ottimizzazioni sul prefetch e sui buffer di reorder e load/store.

Nel complesso l'architettura non è però molto differente da quella delle CPU Phenom II la quale a sua volta si basa su un progetto vecchio ormai di 5 anni. Trinity utilizza invece core derivati dall'architettura Bulldozer.

Il controller delle memorie utilizzato in Llano permette di gestire moduli DDR3 dual-channel con frequenza massima di 1866MHz ottenendo così una banda dati massima di quasi 30GB/s, sicuramente utile per il core grafico integrato. Occorre tenere però a mente che ci sono delle limitazioni, ovvero per raggiungere stabilmente una frequenza di 1866MHz non si possono installare più di un modulo di memoria per ogni canale.

Essendo la risorsa "memoria" condivisa fra GPU e CPU, AMD ha deciso di gestirla con una politica di allocazione dinamica delle priorità, cosa che potrebbe garantire al chip grafico quasi un accesso esclusivo quando usato per far girare applicazioni 3D (in genere gli applicativi attuali sfruttano difficilmente sia i quattro x86 ed il chip grafico).

Che AMD con le APU voglia fornire un supporto concreto ai casual gamer non rappresenta di certo una novità: per farlo il produttore parte da una architettura di una "vera" GPU discreta tagliando qua e la per risparmiare sul numero di transistor e sui consumi ma lasciando comunque intatta la composizione nel suo complesso. Quel che ne deriva è non solo un chip grafico integrato potente quanto non mai, con prestazioni vicine a quelle di una scheda grafica discreta entry-level, ma anche una soluzione compatibile con tutte le ultime tecnologie in fatto di 3D, accelerazione video e supporto GPGPU.

Nello specifico è stata presa l'architettura Redwood a shader unificati di tipo VLIW 5 delle Radeon HD 5570 e 5670 e sono stati eliminati i controller delle memorie, il modulo Eyefinity e quello CrossFireX. Al contempo AMD ha aggiornato il modulo per l'accelerazione video UVD alla terza generazione, ha lasciato intatto il pieno supporto alle DirectX 11, alla tessellation, agli Shader Model 5.0, al DirectCompute ed alle API OpenGL 4.1. Nessun problema anche per i filtri di anti-aliasing e per il texture filtering nonostante crediamo che, per motivi di prestazioni, nessuno si sognerebbe di giocare con una APU attivando questi filtri.

Specifiche tecniche GPU Sumo vs. GPU entry-level
GeForce GT 430 Radeon HD 5570 Radeon HD 6550D Radeon HD 6530D Radeon HD 6410D
Sigla GPU GF108 Redwood Sumo Sumo Sumo
Nodo 40nm 40nm 32nm 32nm 32nm
Transistor 585 milioni 627 milioni ~600 milioni ~600 milioni ~600 milioni
Die 130mm2 104mm2 ~100mm2 ~100mm2 ~100mm2
Frequenza GPU 700MHz 650MHz 600MHz 443MHz 600MHz
Frequenza shader 1400MHz 650MHz 600MHz 443MHz 600MHz
Banda memoria 28,8GB/s 57,6GB/s 29,8GB/s* 29,8GB/s* 29,8GB/s*
Texture unit 16 20 20 16 8
ROPs 8 8 8 8 4
Texture fillrate 11,2GT/s 13GT/s 12GT/s 7,1GT/s 4,8GT/s
Pixel fillrate 5,6GP/s 5,2GP/s 4,8GP/s 3,5GP/s 2,4GP/s
MSAA hardware Si Si Si Si Si
Shader processor 96 80 80 64 32
Numero di ALU 96 400 400 320 160
Shader processor Scalare VLIW5 VLIW5 VLIW5 VLIW5
Geometry shader Si Si Si Si Si
DirectX DX 11 DX 11 DX 11 DX 11 DX 11
Shader model 5.0 5.0 5.0 5.0 5.0
DirectCompute 11 11 11 11 11
OpenCL Si Si Si Si Si
OpenGL 4.1 4.0 4.1 4.1 4.1
Engine video PureVideo HD VP4 UVD 2 UVD 3 UVD 3 UVD 3
Decodifica -MPEG2
-MPEG4
-H.264
-WMV
-HD WMV
-VC-1
-DivX
-XviD
-MPEG2
-MPEG4
-H.264
-WMV
-HD WMV
-VC-1
-MPEG2
-MPEG4
-H.264
-WMV
-HD WMV
-VC-1
-DivX
-XviD
-MPEG2
-MPEG4
-H.264
-WMV
-HD WMV
-VC-1
-DivX
-XviD
-MPEG2
-MPEG4
-H.264
-WMV
-HD WMV
-VC-1
-DivX
-XviD
HDMI audio Esterno 7.1-ch 7.1-ch 7.1-ch 7.1-ch
HDMI 1.4a 1.3 1.4a 1.4a 1.4a

Guardando la tabella delle specifiche si intuisce subito che non è possibile paragonare la iGPU di Llano con un chip grafico integrato come tradizionalmente lo si intende. Con un piccolo sforzo possiamo però provare a realizzare una tabella comparativa fra Sumo e Intel HD Graphics serie 3000 (Sandy Bridge) e serie 4000 (Ivy Bridge).

Specifiche tecniche GPU Sumo vs. iGPU Intel
APU AMD Sandy Bridge Ivy Bridge
Denominazione HD 6550D HD 3000 HD 4000
Frequenza chip 600 MHz 1350 MHz 1350 MHz
Shader Processors 400 12 16
TMU 20 1 2
Memoria UMA UMA UMA
DirectX / SM 11 / 5.0 10.1 / 4.1 11 / 4.1
OpenGL 4.1 3.0 3.1
OpenCL Si No Si
Decodifica MPEG2, VC1, AVC Si Si Si
Codifica H.264 Si Si Si
Codifica MPEG2 Si Si Si
Decodifica Dual Video No Si Si
HD Security PAVP Si Si Si
HD Security HDCP Si Si (dual stream) Si (dual stream)
Tecnologie proprietarie UVD 3 Quick Sync Video Quick Sync Video
Versione HDMI 1.4a + 3D 1.4 + 3D 1.4 + 3D
Audio over HDMI Si Si Si
Uscite video DP, HDMI, VGA, DVI DP, HDMI, VGA, DVI DP, HDMI, VGA, DVI
Risoluzione massima 2560x1600 2560x1600 2560x1600
Display indipendenti 2 2 3

Intel prova ad insistere sulla frequenza di funzionamento dei suoi chip grafici e, molto facilmente, riesce a spingersi ben oltre il GHz grazie ad una architettura di base davvero semplicistica: basti notare la differenza nel numero di texture unit e di unità di calcolo per comprendere quale sia la differenza di approccio dei due produttori.

L'upgrade alla versione 3.0 del modulo UVD ha permesso ad AMD, infine, di supportare meglio la decodifica di file MPEG-4 Part 2 (DivX ed XviD) oltre a quelli MPEG-2, MVC, VC-1, H.264 e Blu-ray 3D. Rispetto all'UVD 2, il nuovo modulo di accelerazione video è più efficiente nel playback perché usa i suoi moduli fixed function per tutte le fasi del processo di decodifica mentre in precedenza alcune funzioni erano demandate agli shader della GPU, poco ottimizzati per questi scopi. Insomma, il modulo UVD 3 diventa un po' come il modulo Intel Quick Sync Video anche se quest'ultimo esegue funzionalità diverse.