Tonga vs. Polaris: sfida clock-to-clock

Il vostro parere, i commenti e le discussioni su tutto quanto pubblicato sul portale di B&C
Avatar utente
Il nabbo di turno
Messaggi: 4101
Iscritto il: venerdì 30 agosto 2013, 19:52

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da Il nabbo di turno »

Fottemberg ha scritto:
Il nabbo di turno ha scritto: Quindi vega, sarà davvero una fiji rivista?
Credo che con Vega AMD oserà di più in quanto a novità, in quanto sarà dedicata alla fascia alta del mercato.
Si in effetti qualcosa in più del semplice raddoppio della cache sarebbe da buttar fuori.
In medio stat virtus!

Avatar utente
george_p
Messaggi: 1651
Iscritto il: venerdì 27 giugno 2014, 14:40

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da george_p »

Fottemberg ha scritto:
Il nabbo di turno ha scritto: Quindi vega, sarà davvero una fiji rivista?
Credo che con Vega AMD oserà di più in quanto a novità, in quanto sarà dedicata alla fascia alta del mercato.
Vista la lunga attesa rispetto a Polaris anche io penso che sia una gpu con diverse caratteristiche, se no che senso avrebbe aspettare 6 mesi o più per un semplice die shrink?

dobermann77
Messaggi: 1081
Iscritto il: martedì 6 agosto 2013, 19:58

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da dobermann77 »

Qualcuno crede che l'unica novità in Vega saranno le HBM2,
secondo me no :cool:

PS: E non a caso sembra che i verdi vogliano anticipare la 1080Ti. Hanno paura di Vega :U

lucusta
Messaggi: 461
Iscritto il: venerdì 2 settembre 2016, 16:19

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da lucusta »

mi spiace, Michele, ma e' un'analisi leggermente superficiale.

il complessivo, compreso 1440p e' 4.8%.
il confronto tra DX11 e DX12 lo puoi effettuare solo su AtoS, Hitman, e TR, ma considera che sono giochi ottimizzati per l'architettura AMD, quindi tutte e due le schede hanno un guadagno.
lo devi effettuare tra la percentuale di incremento prestazionale che hai tra le schede in DX11 e il rapporto percentuale che hai sulle schede in DX12, ma e' un indice sterile se non ben argomentato:
AtoS, tra' 470 e 380x in dx12 mi da' un incremento prestazionale del 4.9%, mentre in DX11 e' "solo" del 106.8%;
il rapporto percentuale tra queste percentuali e' dell'1.8% in favore delle DX11!
risulta quindi che polaris guadagna di piu' in DX11 rispetto a tonga di quanto faccia in DX12, ma e' anche giusto, in quanto Polaris ha avuto un incremento migliorativo rispetto alle altre architetture AMD proprio in DX11.
il senso e' che AMD da GNC gen 1 ad oggi non ha molti problemi in DX12, API che si sposano bene con la sua architettura, ma in DX11.
il suo impegno, in questi anni, e' stato proprio di compensare il divario che aveva in DX11 operando su cluster di calcolo molto piccoli, e minimizzando percio' l'overload di computazione.
hitman, che e' un gioco che si adatta bene ad AMD gia' in DX11, non ha incrementi prestazionali cosi' sensazionalistici, sia con API DX11 che DX12, mentre TR varia si e' no dell'1%.
tutti questi possono essere considerati, comunque, fluttuazioni nel sampling che rientrano in una deviazione standard.

stessa cosa nel tassellation.

di tutto questo pero' non hai considerato che hai operato un notevole downclock delle ram, ma senza operare aggiustamenti dei timing, cosa impossibile se non s'interviene da bios.
diminuendo le frequenze hai notevolmente aumentato i timing della ram su polaris (di ben il 33%).
i timing sulla ram sono generalmente di periodo temporale simile; cambiano i cicli in cui intervengono, ma aumenta la frequenza, compensando l'incremento numerico del timing e portandoti comunque a 6-7ns.
se tu diminuisci la frequenza senza riadattare i timing, hai portato le ram ad operare a 8-10nm, ed e' sensibile, molto sensibile, perche' hai notevolmente diminuito la banda utile.
il vantaggio di aumentare la frequenza della ram e' perche' hai un fattore di divisione piu' ampio per i timing, riuscendo ad andare a recuperare anche frazioni di ns.
significa che Polaris avrebbe avuto molto piu' respiro usando gli stessi timing di tonga.

in tutto questo non hai considerato il guadagno sul consumo, vero punto di forza di questa architettura, che e' costruita soprattutto per limitarlo.

insomma, il margine ottenuto da AMD con Polaris e' soprattutto sul consumo e su un minimo guadagno in DX12;
gran parte dei vantaggi sul consumo se li e' giocati andando a porre i chip il 25% oltre la soglia di miglior rendimento dei transistor, ma se vai a riparametrizzare sulle potenze espresse (ossia cerchi di ottenere con polaris le stesse prestazioni che con tonga), noterai che c'e' stato un reale miglioramento... 2 a 1 (e conta che devi trovare il modo di sottrarre il consumo delle ram).

AMD ha semplicemente portato l'esempio di hawaii per evidenziare il progresso su DX11.

sull'altra sponda, invece, c'e' stato un decremento prestazionale dell'architettura, perche' hanno dovuto aggiungere.
Pascal VS Maxwell perde il 4% di efficienza, ma Maxwell era il modo migliore di operare le DX11 con il minor consumo.
purtroppo pero' solo le DX11...

ti seguo comunque con rispetto e stima :^_^:

Avatar utente
Mitch
Messaggi: 10815
Iscritto il: mercoledì 30 novembre 2011, 9:24
Località: Benevento

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da Mitch »

Questa non voleva essere un'analisi super-approfondita. Mi è servita per mostrare come Tonga e Polaris siano due architetture molto simili, cosa non proprio evidentissima se uno guarda solo i diagrammi a blocchi rilasciati da AMD (non quelli editati da me per l'articolo xD).
"Happiness is an attitude. We either make ourselves miserable, or happy and strong. The amount of work is the same."

Avatar utente
ermanno
Messaggi: 330
Iscritto il: sabato 30 maggio 2015, 15:44

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da ermanno »

Se non ricordo male, fiji aveva bisogno di un controller di memoria nuovo per supportare più di 4gb di memoria. Quindi almeno quello lo devo aggiornare.
Dal punto di vista prestazionale, fiji è ancora competitiva in alcuni titoli dx12/vulkan. O almeno mi sembrava fosse così, non ho controllato molto. E quindi mi aspetto che non spendano un dollaro in nuove features. :asd:
Staranno aspettando che GlobalFoundries affini il processo produttivo? Boh.
Comunque prima escono e meglio è. :U

Avatar utente
AMDfusion
Messaggi: 171
Iscritto il: mercoledì 1 luglio 2015, 5:53

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da AMDfusion »

lucusta ha scritto:mi spiace, Michele, ma e' un'analisi leggermente superficiale.

il complessivo, compreso 1440p e' 4.8%.
il confronto tra DX11 e DX12 lo puoi effettuare solo su AtoS, Hitman, e TR, ma considera che sono giochi ottimizzati per l'architettura AMD, quindi tutte e due le schede hanno un guadagno.
lo devi effettuare tra la percentuale di incremento prestazionale che hai tra le schede in DX11 e il rapporto percentuale che hai sulle schede in DX12, ma e' un indice sterile se non ben argomentato:
AtoS, tra' 470 e 380x in dx12 mi da' un incremento prestazionale del 4.9%, mentre in DX11 e' "solo" del 106.8%;
il rapporto percentuale tra queste percentuali e' dell'1.8% in favore delle DX11!
risulta quindi che polaris guadagna di piu' in DX11 rispetto a tonga di quanto faccia in DX12, ma e' anche giusto, in quanto Polaris ha avuto un incremento migliorativo rispetto alle altre architetture AMD proprio in DX11.
il senso e' che AMD da GNC gen 1 ad oggi non ha molti problemi in DX12, API che si sposano bene con la sua architettura, ma in DX11.
il suo impegno, in questi anni, e' stato proprio di compensare il divario che aveva in DX11 operando su cluster di calcolo molto piccoli, e minimizzando percio' l'overload di computazione.
hitman, che e' un gioco che si adatta bene ad AMD gia' in DX11, non ha incrementi prestazionali cosi' sensazionalistici, sia con API DX11 che DX12, mentre TR varia si e' no dell'1%.
tutti questi possono essere considerati, comunque, fluttuazioni nel sampling che rientrano in una deviazione standard.

stessa cosa nel tassellation.

di tutto questo pero' non hai considerato che hai operato un notevole downclock delle ram, ma senza operare aggiustamenti dei timing, cosa impossibile se non s'interviene da bios.
diminuendo le frequenze hai notevolmente aumentato i timing della ram su polaris (di ben il 33%).
i timing sulla ram sono generalmente di periodo temporale simile; cambiano i cicli in cui intervengono, ma aumenta la frequenza, compensando l'incremento numerico del timing e portandoti comunque a 6-7ns.
se tu diminuisci la frequenza senza riadattare i timing, hai portato le ram ad operare a 8-10nm, ed e' sensibile, molto sensibile, perche' hai notevolmente diminuito la banda utile.
il vantaggio di aumentare la frequenza della ram e' perche' hai un fattore di divisione piu' ampio per i timing, riuscendo ad andare a recuperare anche frazioni di ns.
significa che Polaris avrebbe avuto molto piu' respiro usando gli stessi timing di tonga.

in tutto questo non hai considerato il guadagno sul consumo, vero punto di forza di questa architettura, che e' costruita soprattutto per limitarlo.

insomma, il margine ottenuto da AMD con Polaris e' soprattutto sul consumo e su un minimo guadagno in DX12;
gran parte dei vantaggi sul consumo se li e' giocati andando a porre i chip il 25% oltre la soglia di miglior rendimento dei transistor, ma se vai a riparametrizzare sulle potenze espresse (ossia cerchi di ottenere con polaris le stesse prestazioni che con tonga), noterai che c'e' stato un reale miglioramento... 2 a 1 (e conta che devi trovare il modo di sottrarre il consumo delle ram).

AMD ha semplicemente portato l'esempio di hawaii per evidenziare il progresso su DX11.

sull'altra sponda, invece, c'e' stato un decremento prestazionale dell'architettura, perche' hanno dovuto aggiungere.
Pascal VS Maxwell perde il 4% di efficienza, ma Maxwell era il modo migliore di operare le DX11 con il minor consumo.
purtroppo pero' solo le DX11...

ti seguo comunque con rispetto e stima :^_^:
L'architettura è cambiata moltissimo, ma fare test di paragone con la fascia medio bassa non ha molto senso anche perchè, in quella fascia di mercato non conta la potenza bruta ma l'efficienza energetica. Se analizziamo bene polaris come architettura possiamo dire che le performance aumentano drasticamente con l'aumentare anche se di poco con il numero di core, basti pensare che la rx 480 con soli 32 ROPs e 144 TMUs e con circa 2300 core supera in performance la serie 290/390 avvicinandosi molto alle volte alla Fury (base) e superando nettamente una gtx 980... Quindi se una 480 riesce ad avere tali risultati una vega base con lo stesso numero di core e anche con lo stesso quantitativo di ROPs/TMUs di una FuryX, farà un vero e proprio massacro nei benchmark in qualunque gioco senza contare il supporto delle HBM2. Detto ciò le differenze architetturali ci sono e come ma nella fascia medio bassa non la si nota molto solo per questioni consumi.

Ps: locusta ma tu sei lo stesso locusta che scrive su HDblog? :hmm:

lucusta
Messaggi: 461
Iscritto il: venerdì 2 settembre 2016, 16:19

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da lucusta »

mitch,
sono molto simili finchè si stà su DX12; su DX11 polaris riesce ad eliminare molto overload, grazie alla suo schema che è in grado di "unire" 4 blocchi da 4 in uno da 16 senza surpluss di calcolo.
in finale, anche se prendi hawaii e' molto simile in DX12... e' in DX11 che quest'ultimo e' molto penalizzato, ed è per questo che impressiona di piu' dal passaggio DX11 a DX12.

in piu' la differenza piu' marcata e' sulla lunghezza delle ROPs; per ora ancora non sono sfruttate (proprio perche' in DX11 e pseudo DX12 la migliore lunghezza della ROP e' 64 e non 72).
quello si vedra sul VR, che porterà molte sorprese.
AMD ha introdotto GNC da anni, ma per vederne i benefici si è dovuto attendere le DX12; ora introduce ROPs da 72, e per vederne i benefici (in VR) servirà attendere il codice adatto.

@AMDfusion:
no, lui e' l-O-custa, io sono l-U-custa; due persone diverse.

e no, nella fascia media l'efficienza e' posta in secondo piano; e' la resa economica che conta: chip piccoli uguale poco guadagno, che massimizzi con la produzione, quindi piu' ne escono buoni, piu' ne fai, piu' guadagni.

e no, 480 ha 36 CU e non 32 CU, che invece sono in 470.
vedi sopra perchè e' interessante questa cosa.

Avatar utente
AMDfusion
Messaggi: 171
Iscritto il: mercoledì 1 luglio 2015, 5:53

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da AMDfusion »

lucusta ha scritto:mitch,
sono molto simili finchè si stà su DX12; su DX11 polaris riesce ad eliminare molto overload, grazie alla suo schema che è in grado di "unire" 4 blocchi da 4 in uno da 16 senza surpluss di calcolo.
in finale, anche se prendi hawaii e' molto simile in DX12... e' in DX11 che quest'ultimo e' molto penalizzato, ed è per questo che impressiona di piu' dal passaggio DX11 a DX12.

in piu' la differenza piu' marcata e' sulla lunghezza delle ROPs; per ora ancora non sono sfruttate (proprio perche' in DX11 e pseudo DX12 la migliore lunghezza della ROP e' 64 e non 72).
quello si vedra sul VR, che porterà molte sorprese.
AMD ha introdotto GNC da anni, ma per vederne i benefici si è dovuto attendere le DX12; ora introduce ROPs da 72, e per vederne i benefici (in VR) servirà attendere il codice adatto.

@AMDfusion:
no, lui e' l-O-custa, io sono l-U-custa; due persone diverse.

e no, nella fascia media l'efficienza e' posta in secondo piano; e' la resa economica che conta: chip piccoli uguale poco guadagno, che massimizzi con la produzione, quindi piu' ne escono buoni, piu' ne fai, piu' guadagni.

e no, 480 ha 36 CU e non 32 CU, che invece sono in 470.
vedi sopra perchè e' interessante questa cosa.
Sbagliato persona allora sorry :D , comunque non mi riferivo ai CU ma ai ROPs che, ne ha solo 32 rispetto alla serie 290/390 che di ROPs ne aveva 64 e ben 160 TMUs. L'architettura è diventata dannatamente efficiente con polaris ed è una cosa abbastanza evidente, ma aspetterò Vega per cambiare la mia 270x toxic :)

Avatar utente
Alessio89
Messaggi: 8097
Iscritto il: martedì 29 novembre 2011, 23:47

Re: Tonga vs. Polaris: sfida clock-to-clock

Messaggio da Alessio89 »

Ho riportato la recensione su B3D e ne hanno separato il messaggio per dare il via ad una discussione dedicata :)

https://forum.beyond3d.com/threads/perf ... cus.59645/

Rispondi