Genere
ND
Lingua
ND
PEGI
ND
Prezzo
ND
Data di uscita
ND

Radeon 8500

Anteprima

ATi al contrattacco parte terza: la presentazione ufficiale

Finalmente ci sono tutti i crismi dell'ufficialità: il nuovo chip ATi si chiama Radeon 8500, include Smartshader, Truform e altre interessanti novità che lo porteranno a competere a tutto campo con il GeForce 3 di nVidia. Appaiono anche una versione economica, il Radeon 7500 e una versione professionale, la FireGL 8800. Si dia inizio alle danze!

di Antonino Tumeo, pubblicato il

SMOOTHVISION

Il Radeon, non possiamo negarlo, non è mai stato molto eccellente nel campo dell'antialiasing, né questa è stata una delle caratteristiche, pur supportate dal chip grafico, pubblicizzate da ATi. Certo è che con la sfortunata breve esperienza del Voodoo 5, si sono potute vedere gli eccellenti effetti portati da una implementazione ben fatta di questa funzione, su tutti i tipi di giochi, vecchi o nuovi che siano, e di qualsiasi genere. Esperienza da cui nVidia ha tratto insegnamento per l'HRAA (High Resolution Anti Aliasing) del GeForce 3 con l'innovativo filtro QuincunX. Questo filtro, equivalente prestazionalmente ad un 2X ma qualitativamente abbastanza vicino al 4X, non faceva altro che, esattamente come un filtro 2X, generare due campioni dello stesso pixel e shiftarli, ma poi li interpolava non solo tra loro, ma anche considerando tre singoli campioni dei tre pixel adiacenti.
ATi, con Smoothvision ha fatto un altro piccolo passo avanti. Il discorso, piuttosto semplice in pratica, è quello di rendere i filtri programmabili. Invece che fornire dei filtri fissi (2X, 4X, QuincunX) da applicare indipendentemente dal gioco, ATi offre ai programmatori la possibilità di realizzare il proprio personale filtro, decidendo la "posizione" di ciascun campione e su quali pixel sia necessario applicare l'anti-aliasing. Fino a 16 filtri possono essere programmati, ciascuno in grado di lavorare con fino a 16 (!) campioni (utilizzarli tutti significherebbe demolire le prestazioni in un gioco, ma rende l'idea della flessibilità dell'implementazione), ed è possibile decidere l'applicazione di un determinato filtro sulla base del singolo pixel. Un tale sistema senza dubbio richiede un impegno leggermente maggiore agli sviluppatori, ma apre la strada ad un utilizzo più diffuso di questa funzione (vengono comunque forniti alcuni filtri base già pronti che possono essere attivati o disattivati a scelta). Da ricordare anche che il supporto pieno per il multisampling fornisce il supporto per tecniche particolari come il motion blur e il depth of field.

HYPERZ II

ATi, con il Radeon, è stata la prima società ad affrontare apertamente, e cercare di risolvere, i problemi di larghezza di banda di memoria dovuti a chip ad alte prestazioni con memorie, per quanto costose, non abbastanza rapide da fornire tutto il supporto necessario. HyperZ, il nome dato dalla società canadese alla tecnologia introdotta per ottimizzare questa situazione, include tre tecniche diverse che agiscono sullo Z Buffer (la zona di memoria dove vengono salvati i dati sulla posizione in profondità dei pixel che compongono la scena 3D): Fast Z-Clear (cancellazione immediata dei dati dello Z buffer con un solo comando), Z-Compression (la compressione dei dati dello Z Buffer) e Hierarchical-Z (analisi dei dati di profondità ed eliminazione dei pixel di superfici che risultano coperte da altri oggetti dalla coda di rendering).
Questa tecnologia, per quanto non del tutto decisiva, era piuttosto importante nell'economia dell'architettura Radeon, e gli dava la possibilità di eccellere particolarmente a 32 bit alle alte risoluzioni (quando i problemi di banda di memoria diventano significativi) soprattutto se paragonato con le schede basate su GeForce 2, che non presentano alcun tipo di accorgimento di questo genere. nVidia, in tutta risposta, è partita fin dalle fondamenta del problema per il GeForce 3, ed ha ridisegnato il controller della memoria (Crossbar Memory Controller), dividendo il bus da 128 bit (da moltiplicare per 2, perché con memorie DDR vengono trasferiti sempre 2 bit per ciclo di clock) in 4 tronconi da 32 bit indipendenti tra loro (è stata cioè aumentata la granularità), in modo da ottimizzare ogni accesso in memoria. All'efficiente controller di memoria è poi stato affiancato un sistema di Z Compression e di Z Occlusion Culling (tecnica di rimozione dei pixel nascosti analoga allo Hierarchical-Z).
Naturale quindi aspettarsi la risposta di ATi, su entrambi i fronti. Ed infatti, per quanto riguarda il controller di memoria, il bus da 128 bit (adesso in grado di trasferire 2 bit per ciclo di clock in modalità DDR) è stato diviso in due canali da 64 bit, e possono venire gestiti memorie di tipo SGRAM, SDRAM e DDR SDRAM fino a 300 MHz. Con le memorie a 275 MHz che dovrebbero essere fornite sulla Radeon 8500, la banda di memoria in questa maniera dovrebbe salire fino a 8,8 GB/s.
Ma per migliorare ulteriormente questa cifra, non poteva mancare una nuova versione di HyperZ. HyperZ II è in tutto e per tutto un'evoluzione del già efficace HyperZ. La componente che ha subito maggiori ottimizzazioni è Hierarchical Z. Lo schermo, per decidere quali pixel devono venire scartati perché nascosti da altri pixel, viene diviso in tanti blocchi. Se tutti i pixel del blocco sono coperti, il blocco viene scartato. Se c'è qualche pixel non nascosto, il blocco viene spedito alla pipeline di rendering nella sua interezza. Il vecchio Radeon utilizzava blocchi di 8x8 pixel, il Radeon 8500 utilizza invece blocchi 4x4, che rendono l'algoritmo certamente più efficiente (se i blocchi sono più piccoli, decidere di visualizzarli perché c'è qualche pixel non coperto è meno oneroso di un intero blocco 8x8, che può avere una maggioranza di pixel nascosti). Inoltre, possono venire scartati per ogni ciclo di clock 64 pixel invece degli 8 del vecchio Radeon o i 16 del GeForce 3. Invariato il Fast Z Clear, mentre è stato migliorato l'algoritmo di Z-Compression, che dovrebbe fornire (stando a quello che dice ATi), un incremento di prestazione del 20%. Grazie ad HyperZ II la banda di 8,8 GB/s dovrebbe riuscire così a toccare dei picchi anche di 12 GB/s.

CHARISMA ENGINE II E PIXEL TAPESTRY II

Il Charisma Engine era il motore di trasformazione ed illuminazione del Radeon 256. Benché, come è naturale che fosse, nella nuova versione del Charisma Engine del Radeon 8500 sia stata inclusa l'unità per i Vertex Shader, la maggior parte dei giochi adesso in circolazione si avvale ancora dell'unità di illuminazione e trasformazione a funzioni fisse. ATi dunque ha pensato che anche il vecchio motore meritasse di essere ottimizzato. La parte a funzioni fisse del Charisma Engine II ottiene degli indubbi vantaggi rispetto al GeForce 3 grazie alla maggiore frequenza del chip (250 MHz contro 200), ma stando ai dati forniti da ATi è in grado ad ogni modo di elaborare una quantità molto superiore di triangoli: ben 62,5 milioni.
Sotto il nome di Pixel Tapestry architecture era invece indicata la sezione di rendering del vecchio Radeon. Nel Radeon 8500 questa sezione prende il nome di Pixel Tapestry II (che strano...). Oltre all'evoluta unità di Pixel Shading, già discussa prima, sono pertinenti a questa sezione le pipeline di rendering. Ed è qui la novità che probabilmente tutti attendevano: il numero di pipeline. Ricorderete che nel Radeon erano presenti solo 2 pixel pipeline, in grado di elaborare un pixel ma ben tre texel per ciclo di clock ciascuna. Dunque, nella versione a 183 MHz (quella che costituiva il top di gamma), i dati di fill rate teorici massimi assommavano a 366 Mpixel/s e 1098 Mtexel/s. Bisogna però anche ricordare che i programmatori dovevano usare qualche accorgimento per poter sfruttare i tre texel per pixel, e forse solo il motore di Serious Sam lo ha fatto... seriamente (scusate il gioco di parole). Nel Radeon 8500, le pixel pipeline sono diventate quattro, esattamente come nel GeForce 3, ma sono supportati due pixel per ciclo di clock (sembrerebbe che visto il supporto abbastanza carente, siano stati abbandonati le tre texture per pixel). Ciò dovrebbe quindi portare, per via dei 250 MHz di frequenza del core, a fill rate massimi teorici (naturalmente sempre condizionati dalla larghezza di banda) di 1 Gpixel/s e 2 Gtexel/s. Tuttavia, ATi tiene a sottolineare che le pipeline del nuovo chip possono accedere a 6 texture per passata (cioè, possono caricare i dati per sei texel, anche se in più cicli di clock, senza dover rielaborare i dati della geometria) mentre il vecchio Radeon poteva sì accedere a 3 texel per ciclo di clock con ciascune pipeline, ma per ogni ciclo dovevano essere ricaricati i dati di geometria.