◆ GeForce GTX 200圖形處理架構(gòu)
GTX 200是首款使用NVIDIA第二代統(tǒng)一架構(gòu)渲染及運(yùn)算引擎的顯卡。對(duì)比GeForce 8或者9系顯卡,新架構(gòu)能夠帶來(lái)約1.5倍的性能增長(zhǎng)。
|
想必大家都記得GeForce 8系列以及GeFeforce 9系列的核心是基于一個(gè)可擴(kuò)展處理器陣列(Scalable Processor Array,SPA)結(jié)構(gòu),GTX 200系列所用的是一個(gè)重新設(shè)計(jì)加強(qiáng)以及延展的SPA結(jié)構(gòu)。
SPA結(jié)構(gòu)里面包含了一些TPC單元,TPC的全稱(chēng)根據(jù)用途的不同而有所不同。在圖形處理模式時(shí)它被稱(chēng)為貼圖處理群(Texture Processing Cluster),而在并行計(jì)算模式時(shí)它被稱(chēng)為線程處理群(Thread Processing Cluster)。每一個(gè)TPC包含了一定數(shù)量的流處理單元(Streaming multiprocessors,SMs),而每一個(gè)流處理單元內(nèi)部又包含了8個(gè)流處理器核心(Stream Processors,SPs,或者thread Processors)。另外,每一個(gè)SM內(nèi)部也包含了一定數(shù)量的紋理過(guò)濾處理器(Texture Filtering Processor),除了在3D圖形模式上有著很大的作用之外,在運(yùn)算模式下也非常有用處,如大型圖像的放大縮小等等。
第二代統(tǒng)一渲染架構(gòu)和G80以及G92所使用的第一代統(tǒng)一渲染架構(gòu)相比,在兩方面有著巨大的進(jìn)步。首先,每一個(gè)TPC內(nèi)的SM數(shù)目從第一代的兩個(gè)增加至三個(gè);第二是每一個(gè)GPU內(nèi)的TPC從8個(gè)增加至10個(gè)(GTX 260為8個(gè)),TPC和SM數(shù)量上的增加直接導(dǎo)致了SP的數(shù)目增加至240個(gè)(GTX 260只有192個(gè))。
|
GPU的處理核心SP基于傳統(tǒng)的處理器核心設(shè)計(jì),能夠進(jìn)行整數(shù),浮點(diǎn)計(jì)算,邏輯運(yùn)算等操作,從硬體設(shè)計(jì)上看就是一種完全為多線程設(shè)計(jì)的處理核心,擁有復(fù)數(shù)的管線平臺(tái)設(shè)計(jì),完全勝任每線程處理單指令的工作。
GPU內(nèi)的線程分成多種,包括像素、幾何以及運(yùn)算三種不同的類(lèi)型,在三維圖像處理模式下,大量的線程同時(shí)處理一個(gè)shader program以達(dá)到最大化的效率,所以GTX 200 GPU的核心內(nèi)很大一部分面積都作為計(jì)算之用,和CPU上大部分面積都被緩存所占據(jù)有所不同,大約估計(jì)在CPU上有20%的晶體管是用作運(yùn)算之用的,而(GTX 200)GPU上有80%的晶體管用作運(yùn)算。GPU處理的首要目標(biāo)是運(yùn)算以及數(shù)據(jù)吞吐量,而CPU內(nèi)部晶體管的首要目的是降低處理的延時(shí)以及保持管線繁忙,這也決定了GPU在密集型計(jì)算比起CPU來(lái)更有優(yōu)勢(shì)。
從上面的GeForce GTX 280的圖形處理架構(gòu)圖可以看到10個(gè)TPCs,每個(gè)TPCs包含了三個(gè)SMs,每個(gè)SMs又包含了8個(gè)流處理器核心,這樣流處理器核心總量達(dá)到了240個(gè)。