R9 290xNella news precedente abbiamo parlato del numero di ROPs presenti nella GPU Hawaii ma adesso grazie alle informazioni divulgate sul sito Easycom possiamo stilare un quadro completo sulla nuova architettura realizzata da AMD.

Le slide pubblicate confermano il raddoppio delle unità di frontend e backend ma evidenziano anche come queste due zone siano state ridisegnate da AMD.

Si tratta di cambiamenti che non sconvolgono le funzionalità di base rispetto a Tahiti-Cayman ma sono significativi perchè per certi versi avvicinano sempre di più l'architettura di AMD a quella delle ultime GPU di Nvidia.

 hawaii diagram

Il numero di ACE (Asynchronous Command Engines) risulta quadruplicato, passando da 2 a 8 (guarda caso lo stesso numero di ACE di una delle due GPU di AMD presenti nelle console next-gen) e questo è un primo chiaro segno che siamo di fronte ad un'architettura superiore alla GCN di prima generazione.

Geometry Engine e Rasterizer sono stati spostati all'interno dello Shader Engine. I singoli Geometry Engine processano sempre 1 triangolo per clock ma visto che Hawaii dispone di 4 Shader Engine, contro i due di Tahiti-Cayman, il rapporto di triangoli/clock risulta complessivamente raddoppiato (di conseguenza anche l'efficienza in tessellation è stata migliorata del 100%, sempre in via teorica).

Come detto in precedenza le ROPs sono 64, organizzate in 16 unita per ogni Shader Engine.

Lo Shader Core mantiene la struttura di base a 64 SPs più 4 TMUs per Compute Units, ma la nuova disposizione (44 CU organizzate in 11 CU x 4 cluster) rende Hawaii simile a due GPU Pitcairn fuse su singolo die e non ad un Tahiti potenziato. Il numero dei memory controller (64-bit a doppio canale) sale da 6 a 8, per un bus ampio complessivamente 512bit, anche in questo caso è più facile immaginare il controller delle memorie di Hawaii come quello di un dual-pitcairn (infatti occupa meno spazio dell'MC di Tahiti).

Cifre alla mano ecco quali sono gli incrementi segnalati da AMD nel passaggio da Tahiti XT2 a Hawaii XT:

hawaii number

(segnaliamo un errore, la badwidth della 7970 GHz è di 288 GB/s e non 264 GB/s)

Considerando l'utilizzo dello stesso processo produttivo - 28nm - possiamo dire che si tratta di un piccolo miracolo fatto dalla casa di Sunnyvale in relazione alle dimensioni del die e alle frequenze di clock ridotte, soprattutto guardando l'enorme incremento del Pixel fill rate e dei calcoli geometrici.

Fonte: Easycom