Nell'agosto del 1999 AMD presentò ufficialmente al pubblico l'architettura K7, immettendo in commercio i primi processori Athlon, con frequenze di 500, 550, 600 e 650 Mhz. AMD progettò una piattaforma completamente nuova in proprio, abbandonando lo storico Socket 7, e per questo avvenimento coniò un nome per le proprie CPU. Al pari di Intel anche le future CPU di AMD sarebbero state conosciute con un nome, non con un numero, per migliorarne la visibilità presso il pubblico. Questo nome, comunque, non fu accolto troppo bene da parte della stampa. Ad esempio John Dvorak, giornalista che ha lavorato per prestigiose testate, tra cui InfoWorld e PC Magazine, affermò all'epoca: "It sounds more like a pair of sneakers. Or perhaps a new ointment".
Abbandonando il gossip, la CPU fu il risultato di diverse decisioni molto lungimiranti da parte di Sanders e colleghi. Solo una si rivelò errata.
Nella seconda metà degli anni '90 Sanders strinse un accordo strategico con Motorola, impegnata anch'essa nella produzione di CPU, principalmente per i Macintosh, per dividersi le spese di R&D riguardo l'utilizzo di un diverso materiale di interconnessione dei circuiti integrati. Questa alleanza consentì l'utilizzo del Rame al posto dell'Alluminio, permettendo di aumentare la frequenza di funzionamento delle CPU, diminuendone al contempo il consumo energetico.
Sempre in quegli anni, nel 1996, Sanders portò a sé un ingegnere dalle notevoli capacità, Dirk Meyer, uno dei principali progettisti dei processori Alpha, al tempo un punto di riferimento nel settore Server.
In ultimo, sempre Sanders, decise di collaborare più strettamente con IBM, leader con Intel nel settore delle fonderie, per aggiornare le proprie linee produttive, così da giungere al meglio all'allora avveniristico processo produttivo a 180nm. Sanders era convinto che il successo dovesse passare necessariamente dalle FAB, punto nodale di una buona architettura. Un'azienda che avesse voluto aver successo in questo mercato avrebbe dovuto non solo avere un ottimo progetto, ma anche delle ottime FAB per realizzarlo fisicamente, tanto che nel 1994 affermò: "Real man have fabs".
Grazie a questo notevole tatto strategico AMD riuscì a concepire, probabilmente, il proprio più grande successo. Forse non commerciale ma sicuramente tecnologico, superiore anche agli Athlon 64, il K7.
Preview architettura K7 su Maximum PC (Gennaio 1999) Pagg. 56-57-61
Come le precedenti generazioni di CPU di AMD, K5 e K6, anche K7 sarebbe stato Out-of-Order, ma avrebbe abbracciato innumerevoli innovazioni per chiudere definitivamente il gap nei confronti delle CPU Intel in campo multimediale.
Prima di tutto si potenziò l'unità di calcolo in virgola mobile (FPU), triplicandone le unità (da 1 a 3) e potenziandone la capacità di elaborazione tramite una diminuzione delle latenze. Dal documento “Floating Point Division and Square Root Algorithms and Implementation in the AMD-K7 Microprocessor”, scaricabile qui: “In order to achieve high overall floating point performance with high operating frequencies, we determined it was necessary to minimize the latencies of the fundamental operations. Reducing the number of logic levels per pipeline stage to increase operating frequency can easily cause functional unit latencies to increase by a proportional amount, with little net gain in overall performance. To realize a true performance gain, improvements in the algorithms for the operations are required to reduce the latency of the fundamental operations”.
Sull'esperienza del K6-III la cache fu aumentata, anche se non fu mantenuta la L2 On-Die a causa degli eccessivi costi. Il Processo Produttivo iniziale sarebbe stato ancora il rodato 250nm utilizzato con il K6-III quindi un K7 con la cache L2 integrata avrebbe occupato una superficie immensa, con un conseguente prezzo di commercializzazione incompatibile con il mercato di riferimento, quello di fascia bassa. Il K7 si limitò ad integrare ben 128KB di cache L1 (64+64), il quadruplo di quanto offrivano al tempo il Pentium II e il Pentium III.
Sanders sapeva che un basso prezzo di commercializzazione sarebbe stato essenziale, non avendo AMD ancora un marchio forte come Intel, quindi si decise, almeno per la cache L2, di giocare la partita in modo conservativo. Se nei Pentium II e Pentium III la cache L2 viaggiava alla metà della frequenza della CPU, quella più economica dell'Athlon avrebbe viaggiato al 33% o al 40% della stessa. In questo modo si sarebbe potuto giocare molto di più sui prezzi, senza intaccare eccessivamente le prestazioni. La poderosa Cache L1 avrebbe fatto da contraltare.
Ma il pezzo forte sarebbe stato il nuovo Bus di connessione, preso in prestito da Alpha su Licenza, su suggerimento del già citato Meyer. Una delle pecche della vecchia piattaforma Socket 7 era la limitata bandwidth della memoria e il Bus della CPU limitato a 100 MHz. AMD acquistò la licenza per il Bus EV6, utilizzato originariamente con la CPU Alpha 21264, il quale permetteva di raddoppiare la velocità effettiva del Front Side Bus. Per andare sul pratico, il Pentium III con bus a 133 Mhz e chipset i820, coadiuvato delle costose RDRAM di Rambus, aveva una bandwidth teorica di 1,06 GB/s. L'Athlon, con un bus reale di 100 Mhz (e di 200 Mhz, grazie all'EV6) avrebbe avuto una bandwidth teorica di ben 1,6 GB/s. Sempre Meyer, spinto dall'esperienza accumulata in Alpha, spinse per avere una CPU con una pipeline integer molto corta, così da essere meno dipendente dall'unità di branch prediction, conscio di quanto quella AMD fosse inferiore rispetto a quella Intel. Fu quindi deciso che la pipeline dovesse essere lunga 10 stadi, un buon compromesso tra efficienza e frequenza taorica massima raggiungibile. Secondo studi interni ad AMD questa configurazione sarebbe stata sufficiente per raggiungere il gigahertz di frequenza e qualche mese dopo ciò si sarebbe effettivamente avverato. Per fare un confronto, il Pentium III nelle varie versioni aveva pipeline lunghe tra i 12 e i 17 stadi, mentre quella del K6 era lunga 6 stadi.
Il quadro era pronto, ma la cornice? Sanders era prima di tutto un esperto di Marketing e sapeva che l'utenza vedeva le scelte di Intel come le migliori. Poiché Intel aveva scelto di abbandonate i Socket ZIF in favore dello SLOT 1 il CEO di AMD decise di seguire come un'ombra la rivale, progettando una piattaforma in proprio su cartuccia: lo Slot A. Questa decisione, costata circa due anni di investimenti, si rivelò poi del tutto inutile.
Intel, nell'agosto del 1998, tornò allo ZIF e lanciò il Socket 370. Lo Slot 1 era troppo limitante, ma soprattutto erano troppo costose da produrre le cartucce. Il Package PGA, nelle sue varianti, risultava economicamente migliore. Questa decisione fu presa anche per motivazioni strategiche. Intel sapeva benissimo che per AMD studiare una nuova piattaforma avrebbe richiesto ingenti investimenti, figuriamoci due!
Questi intoppi non smorzarono il morale alla casa di Sunnyvale, ed anzi gli sforzi si moltiplicarono. Sfruttando al massimo il potenziale dello Slot A, in meno di un anno furono buttati nella mischia tre revisioni dell'Athlon: Argon (la prima), Pluto e Orion. Non solo, ma nel marzo del 2000 immise in commercio in grandi volumi la prima CPU commerciale ad 1 GHz, scatenando il panico tra i fanboy della casa di Santa Clara. Anche le fonderie di AMD si rivelarono migliori di quelle Intel.
Copertina di Maximum PC, Maggio 1999: l'Athlon a 1 GHz fa scalpore
Spinta da questi grandi successi, anche commerciali, AMD tirò fuori a tempo di record il nuovo socket ZIF, l'ormai immortale Socket 462, conosciuto ai più come Socket A. La sfida ad Intel era ancora aperta.