Domenica 7 luglio è stata finalmente rilasciata in via ufficiale la nuova linea di CPU Ryzen 3000, caratterizzata dall’utilizzo della nuova uArch Zen2 (Almeno per quanto concerne i modelli privi di iGPU. La APU sono dotate dell'uArch Zen+ già vista nelle CPU Ryzen della serie 2000).
L’attesa è stata così snervante ed i risultati ottenuti dalle prime recensioni sono stati così incredibili, che attualmente le nuove CPU Ryzen sono sold-out quasi ovunque. Nulla è contato per AMD l’aver cercato di “far magazzino” per oltre tre mesi. Tutti vogliono la propria CPU Ryzen 3000! Come dimostrato dall'immagine qui in basso, sono state vendute più di 4500 CPU Ryzen 3000 in 5 giorni nel solo negozio online tedesco Mindfactory. Un lancio a dir poco epocale per AMD, che ha bissato il successo già straordinario della prima generazione di CPU Ryzen.
Dati di vendita al 12/07/19
Particolare interessante, a ruba sta andato il modello di punta Ryzen 9 3900X (12C/24T), segno di come gli utenti Enthusiast stessero aspettando a braccia aperte una CPU in grado di regalare prestazioni da HEDT a “basso” prezzo. Anche molti possessori della CPU Core i9-9900K di Intel si sono lasciati tentare dalla CPU di AMD. Questo significa che AMD si è finalmente inserita nel mercato più remunerativo, quello delle CPU tra i 400 ed i 600 Dollari, fino ad oggi ad esclusivo appannaggio di Intel: un mercato caratterizzato da notevoli volumi di vendita e da un elevato margine utile.
CPU | uArch | Nodo | Core/Thread | Freq/Turbo | L2 Cache | L3 Cache | TDP | Prezzo |
Ryzen 3 3200G | Zen+ | 12nm FF | 4/4 | 3.6/4.0 GHz | 4x512KB | 4 MB | 65W | $99 |
Ryzen 5 3400G | Zen+ | 12nm FF | 4/8 | 3.7/4.2 GHz | 4x512KB | 4 MB | 65W | $149 |
Ryzen 5 3600 | Zen2 | 7N | 6/12 | 3.6/4.2 GHz | 6x512KB | 32 MB | 65W | $199 |
Ryzen 5 3600X | Zen2 | 7N | 6/12 | 3.8/4.4 GHz | 6x512KB | 32 MB | 95W | $249 |
Ryzen 7 3700X | Zen2 | 7N | 8/16 | 3.6/4.4 GHz | 8x512KB | 32 MB | 65W | $329 |
Ryzen 7 3800X | Zen2 | 7N | 8/16 | 3.9/4.5 GHz | 8x512KB | 32 MB | 105W | $399 |
Ryzen 9 3900X | Zen2 | 7N | 12/24 | 3.8/4.6 GHz | 12x512KB | 64 MB | 105W | $499 |
Per il momento, aspettando la nostra recensione delle CPU Ryzen 3000, vogliamo solamente offrire una visione d'insieme della nuova uArch di AMD, senza però scendere eccessivamente nei particolari.
Zen+ è stato poco più di un refresh dell'uArch Zen, come abbiamo avuto modo di osservare nei nostri test. AMD, in particolare, ha cercato di migliorare Bandwidth e Latenze della Cache, così da aumentare le performance in quelle applicazioni Cache Sensitive (Ad esempio i videogiochi) che vedevano eccessivamente avvantaggiate le CPU di Intel. AMD, inoltre, sfruttando il nodo 12nm FF di GlobalFoundries (Evoluzione dei 14nm FF sempre di GloFo) è riuscita ad aumentare le frequenze operative, limitando così - probabilmente - il principale punto debole della prima generazione di CPU Ryzen. Unitamente al cambio di processo produttivo, AMD ha introdotto la tecnologia XFR2, così da poter garatire un turbo boost più elevato.
Con l'uarch Zen2 AMD ha effettuato un major update nel design, in quanto le modifiche sono sostanziali ed anche molto profonde. Come avevamo riportato alla presentazione della prima generazione di Ryzen, il team dietro Zen si è trovata costretta a riciclare (affinandoli, naturalmente) un po' di "moduli" derivati da Bulldozer, Star e Jaguar: la Branch Prediction Unit di BD, il design della Cache di Star, l'Hashed Perceptron System di Jaguar, ecc.
A distanza di due anni, in tutta sicurezza, il team Zen è riuscito ad implementare una serie di novità in grado di portare notevoli miglioramenti. Prima di tutto, Zen2 offre una migliore Branch Prediction Unit (AMD ha dichiarato che è stata completamente ridisegnata), unitamente ad una Cache dal design più sofisticato. Secondo AMD, la nuova Branch Prediction Unit (BPU) garantirebbe un miglioramento del 30% nelle predizioni (Un'altra novità è l'introduzione del TAGE predictor specificatamente per la Cache L2). Tutto questo si è reso necessario per sfruttare la nuova Floating Point Unit, ora in grado di sfruttare le istruzioni AVX2 (all'Hot Chips di agosto AMD fornirà tutti i dettagli a riguardo).
A sinistra lo schema dell'unità di Load/Store di Zen, a destra di Zen2
uArch | Zen | Zen2 |
Cache L1 | 8 x 64 KB 4-way set associative instruction cache 8 x 32 KB 8-way set associative data cache |
8 x 32 KB 8-way set associative instruction cache 8 x 32 KB 8-way set associative data cache |
Cache L1 Org. | 4-way, 256 set | 8-way, 64 set |
Cache L2 | 8 x 512 KB 8-way set associative unified cache | 8 x 512 KB 8-way set associative unified cache |
Cache L3 | 2 x 8 MB 16-way set associative shared cache | 32 MB 16-way set associative shared cache |
Possiamo notare come lo spazio risparmiato dal dimezzamento della Cache L1-I (da 64KB a 32KB) abbia permesso ad AMD di raddoppiare la dimensione della cache micro-op (da 4-way a 8-way), favorendo una maggiore efficienza grazie anche la raddoppio della Cache L3, sempre di tipo Victim Cache (AMD utilizza questa tipologia di Cache fin dall'Athlon64): questa è utilizzata come "parcheggio" per quelle informazioni che non possono essere stockate nella Cache L2 (Nelle CPU Intel, a parte quelle con uArch Skylake-X, i dati della Cache L2 sono disponbili anche nella Cache L3. La Cache L3 è cioè di tipo "Inclusive" e vi ridondanza di informazioni).
L'introduzione di una nuova e più efficiente Branch Prediction Unit, la Cache ridisegnata, la migliorata unità di Load/Store, l'aggiunta di una terza AGU e molto altro farebbero parte di una nuova strategia da parte di AMD che lascerebbe presagire l'abbandono del progetto Fusion, secondo quanto riporta Hiroshige Goto, guru giapponese delle CPU. AMD, infatti, avrebbe intenzione di proseguire su questa strada con Zen 3 e Zen 4, studiando core sempre più "massicci" e complessi, al fine di offrire CPU potenti ed efficienti. Bulldozer (Int oriented) era stato sviluppato per essere utilizzato in combinazione con le GPU (FP oriented). Zen, al contrario, è nato per essere una CPU a tutto tondo a cui affiancare acceleratori discreti. Per il momento, quindi, addio al progetto HSA (Heterogeneous System Architecture). Zen è una risposta diretta alle uArch Core di Intel.
In ultimo, con Zen2 AMD ha introdotto tre nuove istruzioni (Alcune attese anche con Ice Lake), come anticipato in questo nostro tweet di 9 mesi fa.
About the new Zen2 instructions:
— Bits And Chips - Eng (@BitsAndChipsEng) 8 novembre 2018
CLWB (Since Skylake)
RDPID (Ready with Ice Lake)
WBNOINVD (Ready with Ice Lake)
Source: https://t.co/HRdxRdPiId
AMD is leapfrogging Intel in every field.
- CLWB permette ad un software di ripristinare i dati nella memoria non voltatile al fine di prevenire la perdita di informazioni qualora il sistema riceva un comando di alt;
- RDPID permette di prevenire il completo utilizzo di Cache e Memoria da parte di una macchina virtuale;
- WBNOINVD permette di pulire una porzione di cache istantamentamente quando un'istruzione è pronta per essere eseguita all'interno della pipeline.
Zen, e più ancora Zen2, come abbiamo avuto modo di riportare nel paragrafo precedente, nascono soprattutto per venire incontro alle esigenze del mercato Server e solo in un secondo momento alle esigenze del mercato Consumer. Proprio per questo si è reso necessario l'utilizzo del protocollo di comunicazione PCI-E 4.0, al posto dell'ormai antiquato PCI-E 3.0, in combinazione con la tecnologia Infinity Fabric 2 (in grado di garantire latenze molto più basse rispetto alla prima iterazione). Le CPU EPYC "Rome" (Zen2) avranno il doppio dei core delle CPU EPYC "Naples" (Zen) e per fornire un'adeguata banda passante (Soprattutto in sistemi 2S) il PCI-E 3.0 sarebbe stato insufficiente. Per fare un confronto, la banda di trasferimento PCI-E 4.0 tra CPU arriva a 31,5 GB/s, mentre la banda di trasferimento del protocollo di comunicazione QuickPath Interconnect di Intel si ferma a 25,6 GB/s.
AMD, per rendere il tutto più semplice da produrre, ha deciso di integrare nel Die Zen2 (denominato CCD - Core Chiplet Die) il minimo necessario, come è possibile osservare dallo schema realizzato sulla foto del Die di Zen2 (Fonte: Fritzchens Fritz), sfruttando al massimo il design Chiplet (nome più commerciale della tecnologia MCM - Multi Chip Module). Addio ai CTRL DDR4, ai CTRL SATA e a molto altro On-Die. Tutto ciò ha permesso di realizzare un Die snello (74mm2), semplice da produrre in cui la possibilità di incorrere in difetti è ridotta al minimo. Questo, quindi, garantisce una resa produttiva molto elevata (Già oggi siamo oltre all'85% su un processo moderno come i 7nm di TSMC).
Nel chip di I/O (Chiamato da AMD "I/O Die"), invece, possiamo notare il CTRL DDR4 Dual Channel, oltre a tutto quanto concerne la connettività: connessioni PCI-E 4.0, 2 porte SATA III, il CLOKGEN, 4 porte USB 3.1 Gen2, le connessioni Infinity Fabric 2, ecc. Questo chip è prodotto a 12nm presso GlobalFoundries, e grazie alle ottime rese produttive raggiunte da questo nodo risulta anche molto economico da produrre.
Come già detto, tutto ciò è stato reso possibile dall'utilizzo del protocollo di comunicazione PCI-E 4.0. Osservando le slide qui di seguito, il design delle CPU EPYC2 (Rome) risulta ora molto semplice rispetto a quello delle CPU EPYC (Naples). Per il mercato Consumer l'utilizzo del PCI-E 4.0 non sarebbe stato essenziale, ma si è comunque deciso di mantenerlo per una sorta di continuità: realizzare ex-novo un altro I/O Die solo per sfruttare il PCI-E 3.0 sarebbe stato uno spreco di denaro, in quanto il PCI-E 4.0 è retrocompatibile con lo standard 3.0. Inoltre, utilizzare il PCI-E 4.0 avrebbe portato un notevole vantaggio sulle piattaforme Consumer ed Enthusiast nei confronti di Intel. Ad esempio, la piattaforma AM4 di AMD è l'unica in grado di sfruttare adeguatamente gli SSD M.2 NVMe PCI-E 4.0.
La presentazione del nuovo chipset X570 si è resa necessaria per sfruttare il protocollo di connessione PCI-E 4.0 integrato in Zen2. Tutte le altre feature introdotte con Zen2 (che vedremo in seguito), invece, sono pienamente sfruttabili anche con i chipset precedenti previo aggiornamento del BIOS.
Molti si sono lamentati del costo delle schede madri X570, ma c'è da considerare un paio di fattori per comprendere il perché di questo costo maggiorato rispetto alle schede X370 e X470.
In primis, realizzare una circuiteria adatta per il protocollo di comunicazione PCI-E 4.0 non è così economico come per il PCI-E 3.0. Il routing delle tracce sulle schede madri deve essere più pulito e minore deve essere il "disturbo" delle tracce vicine. Per fare un paragone "molto alla buona", possiamo mettere sullo stesso piano le linee PCI-E 4.0 alle linee del comparto audio delle schede madri di fascia media ed alta. Queste ultime, per avere un suono pulito, sono nettamente isolate dal resto della circuiteria. Non va poi dimenticato che anche i materiali utilizzati devono essere di qualità superiore e ciò ha un costo.
Secondariamente, alla buon'ora, i vari produttori di schede madri hanno deciso di realizzare dei prodotti effettivamente di alto livello, caratterizzati da un'ottima componentistica unita ad buon supporto software. Il costo di queste schede madri è elevato perché le sezioni d'alimentazione e di dissipazione devono essere non solo adatte ad ospitare CPU da 16 core, ma devono anche essere adatte ad overclockarle. Prendere una scheda madre X570, quindi, equivale a non avere remore nel prossimo futuro.
Curiosità: secondo quanto riportato da Ian Cutress di Anandtech, il chipset X570 non sarebbe altro che il chip di I/O realizzato a 12nm, "riciclato" per l'occasione (E con i due canali DDR4 disabilitati). Si tratterebbe di un'ottima strategia da parte di AMD, in quanto le permetterebbe di utilizzare un unico design per due prodotti diversi. La potenza del design Chiplet!
AMD viene in aiuto ai futuri utilizzatori delle CPU Ryzen della serie 3000 mostrando, tramite una slide di facile lettura, quale tipologia di DDR4 sia consigliabile acquistare per ottenere le migliori prestazioni. Fortunatamente non dovremo svenarci, in quanto le migliori memorie da abbinare alle prossime CPU saranno quelle operanti alla frequenza massima di 3733 MHz. Andando oltre si avrà un degrado delle prestazioni.
Questo accadrà perché AMD ha deciso di limitare la frequenza di scambio dati tra i vari chiplet (CCD) a 1800-1866 MHz. Al contrario, nelle prime due generazioni di CPU Ryzen questa frequenza era sbloccata (Funzionava sempre alla frequenza delle DDR4), ma poteva provocare anche instabilità (Da qui l'elevata dipendenza delle CPU Ryzen per le alte frequenze delle DDR4). In questo modo, invece, la stabilità verrà garantita al 99,9% ed al contempo permetterà di ottenere prestazioni eccellenti.
Nel caso si vogliano utilizzare memorie dalle frequenze maggiori, il ratio verebbe automaticamente dimezzato, permettendo così di tornare alla stabilità a scapito, comunque, delle latenze e della banda passante tra i chiplet.
L'introduzione della connessione PCI-E 4.0 (Doppia bandwidth rispetto alla connessione PCI-E 3.0), una migliorata gestione della Cache e una migliorata gestione intrinseca delle latenze delle memorie permetteranno alle CPU Ryzen 3000 di sfruttare le memorie DDR4 in maniera più efficace rispetto alle prime due generazioni di CPU.
Con le CPU Ryzen 3000 AMD ha deciso di mantenere inalterata la funzionalità XFR2, introducendo il Precision Boost Overdrive (PBO) in combinazione con la funzionalità Precision Boost 2.
Partiamo dal Precision Boost 2. Questa funzionalità è stata affinata per garantire frequenze di Boost più precise in relazione al carico di lavoro, alle temperature ed al consumo energetico, il tutto determinato in tempo reale attraverso una serie di sensori dislocati all'interno del Die. Questa funzionalità migliorata permetterà mediamente una più elevata frequenza di boost su tutti i core, così da aumentare le prestazioni della CPU in ogni ambito di utilizzo. La funzionalità XFR2 offre una migliore gestione delle frequenze massime, soprattutto quando la CPU è corredata da un buon sistema di dissipazione. Questo permetterà di spremere al massimo la CPU, in una modalità simile ad un overclock manuale, ma rimanendo entro i limiti del TDP.
Il Precision Boost Overdrive (PBO) è una sorta di summa delle due funzionalità appena descritte, in quanto permette di raggiungere frequenze ancora maggiori a quelle certificate per la CPU nel caso si verifichino due condizioni: la presenza di un ottimo sistema di dissipazione e l'uso di un'ottima scheda madre (Non per forza X570. Anche una B450 o una X470 va bene). Si tratta di overclock bonus automatico che farà sicuramente piacere agli utenti, in quanto renderà quasi del tutto inutile il classico overclock manuale. L'aver spostato su I/O Die i controller della memoria DDR4 e molti altri componenti ha inoltre permesso di limitare al massimo l'accumulo di "calore" presso i core x86, favorendo ancor di più il raggiungimento di frequenze operative maggiori.
N.B. La frequenza Turbo pubblicizzata per le CPU Ryzen 3000 è quella riferita all'XFR2. La frequenza raggiungibile tramite PBO non è garantita ed è solo un "di più" nel caso si possiedano determinate condizioni operative!
Per il momento abbiamo parlato delle tre principali funzionalità che gestiscono le frequenze nelle CPU Ryzen 3000, in parte già viste nelle CPU Ryzen 1000 e 2000, ma ve ne sono altre due estremamente importanti ed altrettanto sofisticate.
Fino ad oggi le CPU Ryzen hanno sfruttato la metodologia Hybrid thread expansion per gestire i thread: i thread dei software vengono diramati tra tutti i core della CPU, anche tra diversi CCX (Cosa che ha causato parecchi problemi con le CPU Threadripper nei videogiochi, ad esempio). Ora le CPU Ryzen 3000 sfruttano la metodologia Thread Grouping: i thread vengono distribuiti in un singolo CCX e, qualora ve ne fosse bisogno, vengono distribuiti gli altri nei CCX più vicini. Questo, se da un lato potrebbe "far scaldare" maggiormente un CCD rispetto ad un altro (qualora la CPU fosse dotata di due CCD), dall'altro lato permetterebbe una maggiore efficienza nella gestione dei thread e quindi prestazioni maggiori.
Una seconda feature molto importante è relativa alla gestione delle frequenze. Questa, chiamata Clock Ramping, è sfruttabile solo a partire dal May Update di Windows 10 (Per questo motivo le CPU AMD hanno avuto dei discreti boost prestazionali nei benchmark grazie a questo update). Questa funzionalità permette alle CPU AMD di salire di frequenza (Turbo) in maniera molto più rapida ed è sfruttata insieme alla funzionalità chiamata Collaborative Power Performance Control 2: quest'ultima ha ridotto i tempi di risposta per aumentare o diminuire la frequenza operativa ad appena 2 millisecondi, contro i 30 millisecondi precedentemente necessari (Dalle CPU Ryzen 2000 in giù). Il tutto si traduce, naturalmente, in maggiori performance.
Chiudiamo questa breve introduzione a Ryzen 3000 e Zen2 parlando delle recensioni appena uscite. Al pari di quanto accaduto con Ryzen 1000 e 2000, anche in questo caso ci troviamo di fronte a recensioni molto differenti tra loro per metodologie e, quindi, per risultati ottenuti.
Come abbiamo avuto modo di riportare in questo editoriale (scritto in inglese per venire incontro anche ad un pubblico estero), i recensori non riescono a seguire una linea metodologica "scientifica" e spesso non citano - più o meno volontariamente - l'hardware ed il software utilizzato (Vi è quindi l'impossibilità di replicare e verificare i risultati ottenuti). Consideriamo, inoltre, che molte testate - anche prestigiose, come Anandtech - aggiornano le proprie configurazioni di rado (ogni 12-18 mesi): questo significa che le patch software dedicate ai processori Intel per sopperire alle vulnerabilità software non sono state utilizzate, con tutto quello che ne consegue. In altre parole, le CPU Intel sono più veloci di quanto non dovrebbero (Qui un test di Puget System su quanto le piattaforme Intel perdono nei software professionali una volta installate queste patch).
Citiamo, ancora, il fatto che molte testate non siano ancora in grado - o per imperizia o per malafede - di utilizzare adeguatamente le ultime feature descritte in questo articolo (PBO, XFR2, ecc), facendo così lavorare le CPU Ryzen 3000 al di sotto delle proprie possibilità. 200 o 300 MHz in meno spesso possono significare il sorpassare o meno le CPU Intel dirette rivali nei vari benchmark.
Concludiamo, in ultimo, affermando che - comunque siano state realizzate queste recensioni - BIOS e software (Ad esempio, Ryzen Master) sono ancora molto acerbi e che le reali prestazioni delle CPU Ryzen 3000 le potremo vedere solo tra un paio di mesi. Già ora queste CPU hanno raggiunto un ottimo livello prestazionale, ma a parer nostro solo con la presentazione della CPU Ryzen 9 3950X avremo ben chiara la bontà di questa nuova famiglia di processori.