成功的R3x0架構是否將延續ATI的技術優勢?
繼Nvidia在4月14日發表NV40核心的GeForce 6800Ultra,和Nvidia並列全球繪圖處理器雙雄的ATI亦於5月4日正式公布採用代號「Loki」第四代Radeon核心「R420」的Radeon X800Pro。NV40和R420的相繼發表,除了將奠定未來兩年消費性繪圖晶片的技術基礎,也充分彰顯了這兩家公司迥異的市場規畫、技術走向及思考模式。延續R3x0的基礎架構
R420核心採用臺積電130nm製程生產,雖然電晶體數目沒有到達NV40如此驚人的程度,但是也多達1億6千萬,幾乎是前代R300/R350核心的兩倍。R420Pro晶片運作時脈475MHz,記憶體則為900MHz、256位元寬的GDDR3 SDRAM,理論頻寬28.8GB/s。
有別於GeForce 6800Ultra及XGI Volari Duo的兩組5V/12V外接電源及巨大的散熱機構,Radeon X800Pro延續Radeon 9700/9800的規畫,僅需一組外接電源,而且散熱機構也不會佔用第一條PCI的空間。另外,據了解,採用R420家族的顯示卡最高耗電量均不會超過80W,相較於「建議使用者採用480W電源供應器」、最高耗電量直逼150W的GeForce 6800Ultra,這是一個非常明顯的優勢。
有別於一年前ATI所公布的時程表以及外界普遍的猜測,R420並未支援DirectX 9.0c以及Shader 3.0架構,Pixel Shader的資料精確度也僅維持24位元、而非32位元。換言之,R420僅為R3x0架構的放大版,DirectX 9.0c及Shader 3.0將延至R500。
不過,值得注意的是,R420的Pixel Shader架構並非毫無改進。Pixel Shader 2.0原先定義單一包含32個Texture存取、64個純量ALU運算及64個向量ALU運算的160個指令,ATI將其擴張至512個Texture存取、512個純量ALU運算及512個向量ALU運算,所以單一Pixel Shader指令數多達1536個,超過Pixel Shader 2.0a及2.0b的定義,實體暫存器數目亦有所增加。雖然仍不及Pixel Shader 3.0,不過這已經足以大幅提升程式設計者對R420最佳化的彈性。重頭戲:特殊的全景反鋸齒技術
除了效能之外,畫面輸出的品質也成為顯示晶片技術發展的顯學,而ATI在全景反鋸齒(FSAA)技術上一直有其獨到之處,也一直維持對Nvidia的技術優勢。就以Nvidia在NV40提供的4×RGAA(Rotated Grid Anti-Alias)演算法為例,ATI早已實作於R300之上。另外,NV40僅有4×RGAA,而R420已經提供6×RGAA。ATI更進一步,在R420發展了一種有趣的新技術:Temporal Anti-Alias,只要畫面超過60fps,就可以利用人眼的視覺暫留,透過奇偶數畫面採用不同的RGAA取樣點,實作兩倍FSAA的效果。透過此種全新的FSAA模式,在理論上,R420可以用2×RGAA實作4×RGAA,最多可用硬體支援的6×RGAA實作12×RGAA,而事實上,硬體並不提供6×以上的RGAA。
這種新的FSAA模式,其實用性是一個很值得探討的課題。首先,這個技術的重點在於人眼的視覺暫留效果,而人眼的視覺暫留大約在24至30fps之間,所以必須要求達到穩定的60fps以上,否則該模式就會自動關閉。另外,顯示設備也是一個重點,該模式在CRT顯示器上並不會造成問題,但是對LCD就不是這樣了,如果更新率不到60Hz(16ms),這就會造成畫面上明顯的閃動,而市面上此類產品目前仍是少數。
不過,值得注意的是,該技術需要顯示晶片提供動態更改取樣點格式(Sample Pattern)的硬體功能,而該功能早已實作於R3x0。日前也有消息指出,只要驅動程式配合,不只是R420,舊有的R3x0系列亦可支援這種全新的FSAA模式。由於NV40只有4×RGAA,超過這個模式以上的都是效率低落的OGAA,所以在啟動超過4×的FSAA下,R420的效能要大勝NV40並非不可能之事。當然,現今有多少應用程式及遊戲在超過4×FSAA時,可以維持穩定的60fps,那又是另一個值得思考的問題。效能有待驅動程式最佳化來提升
R420Pro的測試效能讓人有些失望,並沒有達到NV40 Ultra的高水準。另外,R420的驅動程式並不完善,AquaMark3以及SPEC ViewPerf 7.1.1的ugs-03均無法正常執行,而3DMark03更需要另外下載針對R420的修正檔案才能全程跑完。當然,這是新產品剛推出的必然現象,經過驅動程式的最佳化,日後一定還會有效能成長的空間。只是,這對於NV40而言,也是一樣的。
在Fillrate9的精確度測試項目中,透過執行36個Pixel Shader指令的像素填充率,亦證實了Pixel Shader資料精確度的確僅有24位元,足以證明R420並非全新的架構,僅為R3x0系列的延伸。姑且不論Shader 3.0的支援是否有其必要性,NV40雙層式Pixel Shader執行單元架構絕對是延續R3x0的R420所無法比擬的,所以ATI企圖透過提升晶片時脈的方式來抗衡Nvidia的架構優勢,就是一個很自然的做法。ATI修正未來時程所造成的影響
在去年ATI和Nvidia所透露的時程表資料中,ATI預定R420將會支援Shader 3.0,而Nvidia則暫定NV40僅支援Shader 2.0,現在卻完全顛倒,這背後的因素相當的值得探究。
據了解,因為取得了微軟Xbox2的整合型繪圖晶片組訂單,讓ATI決定將研發資源集中至Xbox2及R500核心,導致R420的預定規格被大幅的降低,先前被曝光的Xbox2「Xenon」架構圖似乎證實了這種看法。另外,IBM與臺積電之間的製程技術能力差距,也可能對這兩家公司的決策造成決定性的影響。
不過,很明顯的,ATI採取的保守路線並非沒有利基。首先,DirectX 9.0c中的新增功能,並不會很快的普及,既有的Shader 2.0很可能還是近年的主流。另外,隱而不現的,ATI傾向實用化的產品設計方向,並不刻意不惜血本追求效能,這從延續R3x0的卡板設計以及獨創性的Temporal Anti-Alias就可略見一二。ATI和Nvidia截然不同的路線,究竟誰會勝出,這就有待時間來證明了。文⊙劉人豪
熱門新聞
2025-02-26
2025-02-25
2025-02-26
2025-02-24
2025-02-24