Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Radeon HD 7970 Reprise: PCIe-bandbredd, överklockning och tillståndet för anti-aliasing

Med lanseringen av AMD:s Radeon HD 7970 är det tydligt att AMD återigen har återtagit prestandakronan för singel-GPU. Men även om 7970-talets plats i den nuvarande GPU-hierarkin är väl etablerad, försöker vi fortfarande att bättre förstå detaljerna i AMD:s nya Graphics Core Next Architecture. Vad fungerar den bra på och vad är den svag på? Hur kan GCN skalas med framtida GPU:er? Etc.

Nästa vecka kommer vi att ta en titt på CrossFires prestanda och prestandan för AMD:s första drivrutinsuppdatering. Men under tiden ville vi undersöka några andra aspekter av 7970: PCIe-bandbreddens inverkan på prestanda, överklockning av vår referens 7970 (och dess prestandapåverkan) och vad AMD gör för kantutjämning med det överraskande tillägget av SSAA för DX10+ tillsammans med en intressant teknisk demo som implementerar MSAA och komplex belysning sida vid sida. Så låt oss börja.

PCIe-bandbredd: När har du tillräckligt?

Med lanseringen av PCIe 3 ville vi ta en titt på vilken inverkan den extra bandbredden skulle få. Historiskt sett har nya PCIe-revisioner kommit ut långt före hårdvara som verkligen behöver bandbredden, och med 7970 och PCIe 3 verkar detta återigen vara fallet. I vår ursprungliga 7970-recension såg vi att det fanns ett litet antal befintliga beräkningsapplikationer som omedelbart kunde dra nytta av den större bandbredden, men hur är det med spel? Vi satte oss ner med vår benchmark-svit och körde den på ett antal olika PCIe-bandbredder för att hitta ett svar.

PCIe-bandbreddsjämförelse (varje riktning)

PCIe 1.x

PCIe 2.x

PCIe 3.0

x1

250 MB/sek

500 MB/sek

1 GB/sek

x2

500 MB/sek

1 GB/sek

2GB/sek

x4

1 GB/sek

2GB/sek

4GB/sek

x8

2GB/sek

4GB/sek

8 GB/sek

x16

4GB/sek

8 GB/sek

16 GB/sek

För ett givet spel är mängden data som skickas per bildruta i stort sett konstant oavsett upplösning, så vi har valt att testa allt på 1680×1050. Vid de högre bildhastigheter som denna upplösning erbjuder på vår 7970, borde detta generera mer PCie-trafik än högre, mer GPU-begränsade upplösningar, och göra effekten av olika mängder PCIe-bandbredd mer uppenbar.

I den övre delen är resultaten inte förvånande. I våra informella tester inför lanseringen av 7970 såg vi inga skillnader mellan PCIe 2 och PCIe 3 värda att notera, och våra formella tester backar upp detta. Under spel är det absolut ingen märkbar skillnad i prestanda mellan PCIe 3 x16 (16GB/sek) och PCIe 2 (8GB/sek). Inte heller fanns det någon skillnad mellan PCIe 3 x8 (8GB/sek) och de andra tidigare nämnda bandbreddskonfigurationerna.

Framöver kommer detta att vara goda nyheter för Ivy Bridge-ägare. Även med endast 16 PCIe 3-banor tillgängliga från CPU:n, bör det inte finnas någon prestandastraff för att använda x8-konfigurationer för att möjliggöra CrossFire eller annan användning som skulle råna en 7970 av 8 banor. Men vad sägs om befintliga Sandy Bridge-system som bara kan stödja PCIe 2? Det visar sig att saker och ting inte är lika bra.

Att flytta från PCIe 2 x16 (8GB/sek) till PCIe 2 x8 (4GB/sek) medför en generellt liten straffavgift på 7970. Men som de flesta tester är detta helt beroende av själva spelet. Med spel som Metro 2033 är skillnaden obefintlig, medan Battlefield 3 och Crysis bara tappar 2-3% och DiRT3 lider mest och tappar 14% av sin prestanda. DiRT3:s lägsta bildhastigheter ser ännu sämre ut och sjunker med 19 %. Eftersom DiRT3 är ett av våra spel med högre prestanda i första hand kommer den verkliga skillnaden inte att vara så stor – den är fortfarande långt över 60 fps hela tiden – men det är klart att i fel situation bara ha 4 GB/sek PCIe-bandbredd kan flaskhalsa en 7970.

Om vi ​​slutligen tar ytterligare ett steg till PCIe 3 x2 (2GB/sek), ser vi prestandan fortsätta att sjunka spel för spel. Crysis, Metro, Civilization V och Battlefield 3 håller sig fortfarande ganska stabila, efter att ha förlorat mindre än 5 % av sin prestanda jämfört med PCIe 3 x16, men DiRT 3 fortsätter att falla, medan Total War: Shogun och Portal 2 börjar spännas. Vid dessa hastigheter är DiRT3 bara 72 % av sin ursprungliga prestanda, medan Shogun och Portal 2 ligger på 81 % respektive 92 %.

Det som i slutändan står klart är att 8 GB/sek bandbredd, antingen i form av PCIe 2 x16 eller PCIe 3 x8, kommer att behövas för att helt mata 7970:an. 16 GB/sek (PCIe 3 x16) verkar vara överdrivet för ett enda kort vid denna tidpunkt, och 4 GB/sek eller 2 GB/sek kommer att flaskhalsa 7970 beroende på spel. Den goda nyheten är att även vid 2 GB/sek är flaskhalsarna ganska begränsade, och baserat på vårt urval av benchmarks ser det ut som att en handfull spel kommer att ha flaskhalsar. Ändå finns det ett bra argument här för att 7970CF-ägare kommer att vilja ha ett PCIe 3-system för att undvika flaskhalsar på sina kort – i själva verket kan detta vara den största fördelen med PCIe 3 just nu, eftersom det borde ge tillräckligt med bandbredd för att göra en x8/x8 konfiguration lika snabbt som en x16/x16-konfiguration, vilket möjliggör maximal GPU-prestanda med Intels vanliga processorer.