扛起CUDA大旗 GeForce GTX 200深入評測

GeForce GTX 200圖形處理架構(gòu)

來源：超能網(wǎng)　更新日期：2008-06-20 作者：佚名

CES消費電子展專題報道年度評選盛典獲獎揭曉

內(nèi)容導(dǎo)航：　　分頁瀏覽 | 全文瀏覽

◆ GeForce GTX 200圖形處理架構(gòu)

　　GTX 200是首款使用NVIDIA第二代統(tǒng)一架構(gòu)渲染及運算引擎的顯卡。對比GeForce 8或者9系顯卡，新架構(gòu)能夠帶來約1.5倍的性能增長。

GeForce GTX 280的圖形處理架構(gòu)

　　想必大家都記得GeForce 8系列以及GeFeforce 9系列的核心是基于一個可擴(kuò)展處理器陣列(Scalable Processor Array，SPA)結(jié)構(gòu)，GTX 200系列所用的是一個重新設(shè)計加強(qiáng)以及延展的SPA結(jié)構(gòu)。

　　SPA結(jié)構(gòu)里面包含了一些TPC單元，TPC的全稱根據(jù)用途的不同而有所不同。在圖形處理模式時它被稱為貼圖處理群（Texture Processing Cluster），而在并行計算模式時它被稱為線程處理群（Thread Processing Cluster）。每一個TPC包含了一定數(shù)量的流處理單元（Streaming multiprocessors,SMs），而每一個流處理單元內(nèi)部又包含了8個流處理器核心（Stream Processors,SPs,或者thread Processors）。另外，每一個SM內(nèi)部也包含了一定數(shù)量的紋理過濾處理器（Texture Filtering Processor），除了在3D圖形模式上有著很大的作用之外，在運算模式下也非常有用處，如大型圖像的放大縮小等等。

　　第二代統(tǒng)一渲染架構(gòu)和G80以及G92所使用的第一代統(tǒng)一渲染架構(gòu)相比，在兩方面有著巨大的進(jìn)步。首先，每一個TPC內(nèi)的SM數(shù)目從第一代的兩個增加至三個；第二是每一個GPU內(nèi)的TPC從8個增加至10個（GTX 260為8個），TPC和SM數(shù)量上的增加直接導(dǎo)致了SP的數(shù)目增加至240個（GTX 260只有192個）。

GTX 200與前代產(chǎn)品的SP比較

　　GPU的處理核心SP基于傳統(tǒng)的處理器核心設(shè)計，能夠進(jìn)行整數(shù)，浮點計算，邏輯運算等操作，從硬體設(shè)計上看就是一種完全為多線程設(shè)計的處理核心，擁有復(fù)數(shù)的管線平臺設(shè)計，完全勝任每線程處理單指令的工作。

　　GPU內(nèi)的線程分成多種，包括像素、幾何以及運算三種不同的類型，在三維圖像處理模式下，大量的線程同時處理一個shader program以達(dá)到最大化的效率，所以GTX 200 GPU的核心內(nèi)很大一部分面積都作為計算之用，和CPU上大部分面積都被緩存所占據(jù)有所不同，大約估計在CPU上有20%的晶體管是用作運算之用的，而（GTX 200）GPU上有80%的晶體管用作運算。GPU處理的首要目標(biāo)是運算以及數(shù)據(jù)吞吐量，而CPU內(nèi)部晶體管的首要目的是降低處理的延時以及保持管線繁忙，這也決定了GPU在密集型計算比起CPU來更有優(yōu)勢。

　　從上面的GeForce GTX 280的圖形處理架構(gòu)圖可以看到10個TPCs，每個TPCs包含了三個SMs，每個SMs又包含了8個流處理器核心，這樣流處理器核心總量達(dá)到了240個。

返回高清播放機(jī)頻道首頁