- 本文導(dǎo)航
- 第1頁:前言
- 第3頁:GeForce GTX 200圖形處理架構(gòu)
- 第5頁:GeForce GTX 200并行計(jì)算架構(gòu)
- 第7頁:GTX 200融入PhysX技術(shù)
- 第9頁:GeForce GTX 280實(shí)物欣賞
- 第11頁:GeForce GTX 280散熱器剖析
- 第13頁:GeForce GTX 280高清回放測試
- 第15頁:GeForce GTX 280溫度與超頻測試
- 第17頁:巔峰之戰(zhàn):GTX 280 vs 9800GX2
- 第19頁:初探GTX 260 SLI性能
- 第21頁:體驗(yàn)CUDA:Elemental transcoder
- 第2頁:全新的GTX 200千呼萬喚始出來
- 第4頁:GTX 200的主要改進(jìn)
- 第6頁:讓NVIDIA野心勃勃的CUDA
- 第8頁:GTX 200具有先進(jìn)的動(dòng)態(tài)電源管理
- 第10頁:GeForce GTX 280內(nèi)部細(xì)節(jié)特寫
- 第12頁:GeForce GTX 260實(shí)物欣賞
- 第14頁:GeForce GTX 280功耗測試
- 第16頁:測試平臺(tái)及說明
- 第18頁:全面壓倒:GTX 280 vs Radeon HD 3870X2
- 第20頁:體驗(yàn)CUDA:Folding@home
- 第22頁:GTX 200的精彩:雙架構(gòu)設(shè)計(jì)
◆
自從2006年11月NVIDIA革命性統(tǒng)一架構(gòu)(Unified Shader)的G80誕生以來,基于G8x核心的顯卡有8800GTX、8800GTS、8600 GTS、8600 GT、8500 GT、8400 GS、8800 Ultra,以G80為基礎(chǔ)的基于G9x核心的顯卡有8800GT、8800GTS 512、8800GS、9600GT、9800GX2,在18個(gè)月時(shí)間內(nèi),NVIDIA依靠成熟的G80架構(gòu),衍生出數(shù)代GPU產(chǎn)品,顯然這些產(chǎn)品都是換湯不換藥,簡單的改良設(shè)計(jì)加上規(guī)格上的增減,讓NVIDIA賺得盆滿缽滿。
NVIDIA的老大創(chuàng)建的所謂“黃氏定律”,聲稱將每六個(gè)月將產(chǎn)品升級(jí)一次,性能翻番,然而NVIDIA在過去的一年內(nèi)略顯沉寂,我們一直期待有突破性的產(chǎn)品面世,直到今天,2008年6月16日,全新的NVIDIA GeForce GTX 200系列顯卡才在千呼萬喚中步入歷史舞臺(tái)。
|
GeForce GTX 200系列顯卡的GPU不僅使用了第二代的統(tǒng)一渲染架構(gòu),更加入了相比前代性能大有提升的并行計(jì)算架構(gòu)。GTX 280的開發(fā)遵循著兩個(gè)原則即"Beyond Gaming"以及"Gaming Beyond"。
Beyond Gaming指的是GPU的架構(gòu)目前已經(jīng)進(jìn)化到不僅僅只用來運(yùn)算3D游戲的畫面。GPU面臨的工作不但有游戲,還包括了針對(duì)普通用戶和專家的非游戲密集運(yùn)算型程序。
Gaming Beyond指GTX 200系列顯卡能夠發(fā)揮出驚人的畫面效果,帶來完全真實(shí)的畫面體驗(yàn)以及細(xì)致的人物紋理,同時(shí)帶來準(zhǔn)確的物理特效。
|
GTX 200新架構(gòu)設(shè)計(jì)目標(biāo):
- 核心性能是8800GTX的兩倍;
- 為未來游戲使用的大量復(fù)雜shader以及顯存改變核心架構(gòu)設(shè)計(jì),讓其性能更加平衡;
- 改進(jìn)架構(gòu)內(nèi)每瓦效能以及每平方毫米效能;
- 為DirectX10的特性而改變Geometry Shading以及Stream Out
- 提高特別為CUDA以及GPU物理運(yùn)算(PhysX)而加強(qiáng)的運(yùn)算性能。
- 改進(jìn)電源管理能力,包括待機(jī)狀態(tài)下顯著減少的能源消耗。
![]() |
NVIDIA GeForce GTX 200系列顯卡有兩種型號(hào),即全規(guī)格的GTX 280和稍低規(guī)格的GTX 260。
◆
GTX 200是首款使用NVIDIA第二代統(tǒng)一架構(gòu)渲染及運(yùn)算引擎的顯卡。對(duì)比GeForce 8或者9系顯卡,新架構(gòu)能夠帶來約1.5倍的性能增長。
|
想必大家都記得GeForce 8系列以及GeFeforce 9系列的核心是基于一個(gè)可擴(kuò)展處理器陣列(Scalable Processor Array,SPA)結(jié)構(gòu),GTX 200系列所用的是一個(gè)重新設(shè)計(jì)加強(qiáng)以及延展的SPA結(jié)構(gòu)。
SPA結(jié)構(gòu)里面包含了一些TPC單元,TPC的全稱根據(jù)用途的不同而有所不同。在圖形處理模式時(shí)它被稱為貼圖處理群(Texture Processing Cluster),而在并行計(jì)算模式時(shí)它被稱為線程處理群(Thread Processing Cluster)。每一個(gè)TPC包含了一定數(shù)量的流處理單元(Streaming multiprocessors,SMs),而每一個(gè)流處理單元內(nèi)部又包含了8個(gè)流處理器核心(Stream Processors,SPs,或者thread Processors)。另外,每一個(gè)SM內(nèi)部也包含了一定數(shù)量的紋理過濾處理器(Texture Filtering Processor),除了在3D圖形模式上有著很大的作用之外,在運(yùn)算模式下也非常有用處,如大型圖像的放大縮小等等。
第二代統(tǒng)一渲染架構(gòu)和G80以及G92所使用的第一代統(tǒng)一渲染架構(gòu)相比,在兩方面有著巨大的進(jìn)步。首先,每一個(gè)TPC內(nèi)的SM數(shù)目從第一代的兩個(gè)增加至三個(gè);第二是每一個(gè)GPU內(nèi)的TPC從8個(gè)增加至10個(gè)(GTX 260為8個(gè)),TPC和SM數(shù)量上的增加直接導(dǎo)致了SP的數(shù)目增加至240個(gè)(GTX 260只有192個(gè))。
|
GPU的處理核心SP基于傳統(tǒng)的處理器核心設(shè)計(jì),能夠進(jìn)行整數(shù),浮點(diǎn)計(jì)算,邏輯運(yùn)算等操作,從硬體設(shè)計(jì)上看就是一種完全為多線程設(shè)計(jì)的處理核心,擁有復(fù)數(shù)的管線平臺(tái)設(shè)計(jì),完全勝任每線程處理單指令的工作。
GPU內(nèi)的線程分成多種,包括像素、幾何以及運(yùn)算三種不同的類型,在三維圖像處理模式下,大量的線程同時(shí)處理一個(gè)shader program以達(dá)到最大化的效率,所以GTX 200 GPU的核心內(nèi)很大一部分面積都作為計(jì)算之用,和CPU上大部分面積都被緩存所占據(jù)有所不同,大約估計(jì)在CPU上有20%的晶體管是用作運(yùn)算之用的,而(GTX 200)GPU上有80%的晶體管用作運(yùn)算。GPU處理的首要目標(biāo)是運(yùn)算以及數(shù)據(jù)吞吐量,而CPU內(nèi)部晶體管的首要目的是降低處理的延時(shí)以及保持管線繁忙,這也決定了GPU在密集型計(jì)算比起CPU來更有優(yōu)勢。
從上面的GeForce GTX 280的圖形處理架構(gòu)圖可以看到10個(gè)TPCs,每個(gè)TPCs包含了三個(gè)SMs,每個(gè)SMs又包含了8個(gè)流處理器核心,這樣流處理器核心總量達(dá)到了240個(gè)。
◆
·SIMT架構(gòu)
NVIDIA的統(tǒng)一渲染以及運(yùn)算架構(gòu)使用了兩種不同的處理模式,在使用TPC執(zhí)行指令時(shí)該模式被稱為MIMD(Multiple instruction multiple data),在使用每一個(gè)SM執(zhí)行指令時(shí),模式被稱為SIMT(single instruction, multiple thread)。
SIMT改進(jìn)了純SIMD(single instruction, multiple data)設(shè)計(jì),能夠同時(shí)保證性能以及可編程特性。在擁有可擴(kuò)充性的同時(shí),SIMT并沒有一個(gè)固定的矢量寬度(vector width),這使得在SIMT處理模式下,運(yùn)算速度可以全速展開,完全和矢量寬度脫離關(guān)系。
相反,如果輸入信息較MIMD或SIMD寬度少的話,SIMD模式會(huì)開始低負(fù)載運(yùn)作,SIMT保證所有流處理器能夠在任何使用都能夠被充分利用。在一個(gè)編程者的角度來看,SIMT同樣允許線程使用自己的路徑。由于分支機(jī)構(gòu)(branching)是由硬件來控制的,所以并不需要在矢量寬度(vector width)內(nèi)手動(dòng)管理分支。
·同時(shí)支持大量線程
GTX 200系列顯卡的GPU能夠同時(shí)支持超過三萬個(gè)線程(thread),基于硬件的線程管理保證了所有流處理器核心能夠100%全部利用。核心架構(gòu)的設(shè)計(jì)避免CPU內(nèi)經(jīng)常出現(xiàn)的延時(shí)問題:如果某個(gè)線程正在等待讀取緩存信息,那么GPU能夠?qū)崿F(xiàn)一個(gè)完全即時(shí)沒有損耗的轉(zhuǎn)換,將另一個(gè)等待處理的線程交由空閑部分繼續(xù)處理。
SIMT多線程指令單元處在SM內(nèi)部,能夠管理安排以及處理一組32個(gè)平行的線程,被稱為"warps"。前一代的GeForce 8或者GeForce 9 GPU每SM只能同時(shí)處理24個(gè)warps,而GTX 200系列顯卡的GPU能夠達(dá)到32warps/SM的效率。我們可以看到,憑借SM以及TPC數(shù)量的增多,可同時(shí)處理的線程數(shù)量也由GeForce 8和9系列的12888上升至30720個(gè)(1024*3*10=30720)。
·加大的寄存器組
和GeForce 8或9系產(chǎn)品相比,在GTX200系列顯卡中本地寄存器組的大小增加了一倍,在以往,寄存器組往往會(huì)因?yàn)檫^小導(dǎo)致信息必須轉(zhuǎn)存至顯存中,增大的寄存器組能夠允許顯卡更快速有效地處理大且復(fù)雜的shader。雖然寄存器組容量加大了,不過在核心die內(nèi)這些額外的寄存器只占用了不多的些許面積。
現(xiàn)在的游戲越來越多地使用復(fù)雜的shader,需要更加大的寄存器組空間。
·改進(jìn)的Dual Issue
在SM內(nèi)部的特殊功能單元(Special Function Unit,SFU)負(fù)責(zé)超越數(shù)的運(yùn)算,屬性插值(從一個(gè)原始的頂點(diǎn)屬性中解釋像素屬性,interpreting pixel attributes from a primitive vertex attributes),以及處理浮點(diǎn)MUL指令。GT200內(nèi)每一個(gè)獨(dú)立的流處理核心都以幾乎全速的速度,用Dual issue的方法來運(yùn)算:使用核心內(nèi)部的MAD單元處理MADs(multiply add operations)以及MULs(3flops/SP),另外在同一時(shí)間也使用SFU單元來進(jìn)行MUL運(yùn)算。改進(jìn)和直接的測試表明這種結(jié)構(gòu)能夠帶來93%~94%的效率。
在GPU內(nèi)部的所有特殊功能單元陣列能夠?yàn)轱@卡帶來幾乎1Tflops的single -precision, IEEE 754浮點(diǎn)運(yùn)算能力。
·支持雙精度浮點(diǎn)運(yùn)算
在GTX 200核心架構(gòu)內(nèi)部有一個(gè)非常重要的新特點(diǎn):支持double precision、64bit雙精度浮點(diǎn)運(yùn)算。這對(duì)高端的科學(xué)工程以及金融運(yùn)算更加有利,能夠?yàn)槠鋷矸浅8呔_度的結(jié)果,每一個(gè)SM內(nèi)都有一個(gè)double-precision 64bit的浮點(diǎn)運(yùn)算單元,整個(gè)芯片內(nèi)總共有30個(gè)。
這些double precision單元能進(jìn)行融合的MAD演算,完全兼容與IEEE 754R浮點(diǎn)運(yùn)算規(guī)格。所有TPC內(nèi)部的double precision性能幾乎等同與一個(gè)八核的XeonCPU,接近90Gflops。
·改進(jìn)的紋理性能
8800GTX核心內(nèi)部擁有8個(gè)TPC,允許進(jìn)行每頻率內(nèi)64像素的紋理過濾,每頻率32像素尋址,每頻率32像素的兩倍反鋸齒雙線性過濾(8bit整數(shù))或者32-雙線性過濾像素(8bit整數(shù)或者16bit浮點(diǎn)),而GTX 200改進(jìn)的紋理性能平衡了尋址能力和過濾能力。
·提高Shader to texture比例
由于游戲和其他圖形程序的需要,系統(tǒng)正在使用越來越多的復(fù)雜化shader,為了重新平衡顯卡的運(yùn)算能力,GTX 200系列GPU的設(shè)計(jì)重新調(diào)整了Shader to texture的比例,通過在TPC內(nèi)部增加1個(gè)SM讓Shader to texture的比例上升了50%,這讓GTX 200系列顯卡在處理目前以及將來的游戲時(shí)能夠更加有效率。
·ROP改進(jìn)
GeForce 8系列的ROP系統(tǒng)支持multisampled,supersampled,透明適應(yīng)以及Sampling抗鋸齒等功能,對(duì)于GTX 200同樣支持這些特性,ROP單元數(shù)量由6個(gè)增加到8個(gè)之外,總的ROPs數(shù)達(dá)到32個(gè),相對(duì)于G80每時(shí)鐘周期24像素的輸出和12像素的混合速度,GTX 200均提升至每時(shí)鐘周期32像素,更加有利于高分辨率以及AA環(huán)境中速度的提升。
·1GB的Framebuffer
現(xiàn)在的3D游戲采用了大量的紋理來提高畫面的真實(shí)度,例如用普通的map提高表面真實(shí)度,用立方map來增強(qiáng)反射效果,用高分辨率的perspective shadow map來模擬soft shadow。這些map使得渲染每一幀畫面都需要大量的顯存,而不像傳統(tǒng)的游戲,有base texture就可以了。另外,Deferred rendering引擎在multiple render時(shí),需要有一個(gè)預(yù)先渲染圖片特性的過程,這意味著又需要額外的顯存,還有就是很耗顯存的反鋸齒技術(shù),這些技術(shù)使得內(nèi)存和帶寬的需求都大大高于以前。
Geforce GTX 280和GTX 260分別支持1024MB和896MB的Framebuffer,是上一代顯卡的兩倍。1GB顯存將使高分辨率的反鋸齒能力得到提升。
·幾何shading和stream out
比起上一代顯卡,GTX 200將內(nèi)部緩存輸出結(jié)構(gòu)提高了6倍,使幾何渲染和stream out的速度大大提升。
·512bit顯存接口
GTX 200的最大顯存帶寬從原來的384bit提高到了512bit,擁有8個(gè)64-bit-wide FrameBuffer單元,為了使texture單元在被有效利用的同時(shí),又不會(huì)出現(xiàn)不足,F(xiàn)reamBuffer帶寬需要反復(fù)調(diào)整達(dá)到最佳,NVIDIA的工程師測試了許多應(yīng)用程序,最終達(dá)到了這個(gè)目的。
GTX 200 GPu的framebuffer總效率得到了提高,為了支持更高速度的顯存,重新設(shè)計(jì)了framebuffer重要的path,使得顯卡最高能支持到1.1GHz的DDR3顯存,內(nèi)存的存取模式和緩存算法也都得到了改良。另外硬件壓縮加大了數(shù)據(jù)傳輸率,而實(shí)際上是增加了framebuffer帶寬,也提升了顯卡在高分辨率下的性能。
GeForce GTX 200并行計(jì)算架構(gòu)
◆
前面說過,GTX 200不再僅是一塊娛樂級(jí)的顯卡,開始注重非游戲的密集型計(jì)算任務(wù),這也是GTX 200與以往GPU最大的不同,GTX 200的并行計(jì)算架構(gòu)為NVIDIA倡導(dǎo)的GPU Computing打下了堅(jiān)實(shí)基礎(chǔ)。
|
上圖展示了GTX 280在并行運(yùn)算模式下的架構(gòu),一個(gè)硬件級(jí)別的線程管理器在最上方,管理著TPC所處理的不同線程。除此以外你還可以輕易發(fā)現(xiàn)在在并行運(yùn)算架構(gòu)下該圖還包括了紋理緩存和顯存位寬單元(memory interface unit)。紋理緩存用以和顯存相結(jié)合,提高緩存的讀取效率,加大帶寬和加快讀寫速度。“Atomic”單元能夠執(zhí)行顯存的讀取-改動(dòng)-寫入操作,該單元能夠提供到顯存位置的granular access,幫助減少并行運(yùn)算數(shù)據(jù)存儲(chǔ)量以及數(shù)據(jù)存儲(chǔ)管理。
|
一個(gè)TPC(Thread Processing Cluster)在并行計(jì)算模式下的結(jié)構(gòu)如上圖,可以看見每三個(gè)SMs內(nèi)都有一個(gè)邏輯的16k大小的共享緩存,每一個(gè)流處理器核心都能夠和SM內(nèi)的其他核心共享信息,省下了從外部緩存系統(tǒng)中讀取信息的時(shí)間,這種設(shè)計(jì)大大加快了處理器的運(yùn)算速度,同時(shí)提高了各種算法的效率。
在并行計(jì)算模式下,Streaming Processor稱之為Thread Processor(線程處理器),仍然是前代的標(biāo)量設(shè)計(jì),即1MAD+2SFU,因此對(duì)于GTX 280來說,其浮點(diǎn)運(yùn)算能力達(dá)到了933GFLOPs(3*1296*240=933120),幾乎是Intel四核處理器9650的十倍之多,意味著GPU在浮點(diǎn)運(yùn)算中有得天獨(dú)厚的優(yōu)勢。
◆
|
·GPU+CPU異構(gòu)運(yùn)算概述
異構(gòu)運(yùn)算(heterogeneous computing)的想法是這樣的,通過使用計(jì)算機(jī)上的主要處理器,如CPU以及GPU來讓程序得到更高的運(yùn)算性能。一般來說,CPU由于在分支處理以及隨機(jī)內(nèi)存讀取方面有優(yōu)勢,在處理串聯(lián)工作方面是好手。在另一方面,GPU由于其特殊的核心設(shè)計(jì),在處理大量有浮點(diǎn)運(yùn)算的并行運(yùn)算時(shí)候有著天然的優(yōu)勢。完全使用計(jì)算機(jī)性能實(shí)際上就是使用CPU來做串聯(lián)工作,而GPU負(fù)責(zé)并行運(yùn)算,簡單來講,異構(gòu)運(yùn)算就是“使用合適的工具做合適的事情”。
那么什么程序是以串聯(lián)工作為主而什么程序又是以并行的運(yùn)算為主呢?其實(shí)只有很少很少的程序使用純粹的串聯(lián)或者并行的,大部分程序同時(shí)需要兩種運(yùn)算形式。編譯器、文字處理軟件、瀏覽器、e-mail客戶端等都是典型的串聯(lián)運(yùn)算形式的程序。而視頻播放,視頻壓制,圖片處理,科學(xué)運(yùn)算,物理模擬以及3D圖形處理(Raytracing及光柵化)這類型的應(yīng)用就是典型的并行處理程序。
CUDA是業(yè)界的首款并行運(yùn)算語言,而且其非常普及化,目前有高達(dá)7千萬的PC用戶可以支持該語言,以下三大特點(diǎn)讓GTX 280能夠完全勝任并行運(yùn)算:
·GPU運(yùn)算架構(gòu):GTX280的核心是為并行運(yùn)算所設(shè)計(jì)的,包含了各種有利于并行運(yùn)算的特性,如共享緩存設(shè)計(jì),Atomic操作以及雙精度浮點(diǎn)計(jì)算的支持。
·大量核心設(shè)計(jì):具有240個(gè)運(yùn)行在1.3GHz的微型核心,GTX280可以說是PC上進(jìn)行浮點(diǎn)運(yùn)算的利器。
·大型帶寬設(shè)計(jì):由于數(shù)據(jù)的吞吐量大,圖形運(yùn)算程序的效率被CPU上的帶寬瓶頸給卡住了,由于GTX280上有8個(gè)處于核心內(nèi)部的顯存控制器,GTX 280的顯存帶寬能夠達(dá)到142GB/s,大量提高了基于顯卡的高清視頻壓縮、物理模擬以及圖像處理程序的效率。
·CUDA是什么?
|
CUDA(Compute Unified Device Architecture)是一個(gè)新的基礎(chǔ)架構(gòu),這個(gè)架構(gòu)可以使用GPU來解決商業(yè)、工業(yè)以及科學(xué)方面的復(fù)雜計(jì)算問題。它是一個(gè)完整的GPGPU解決方案,提供了硬件的直接訪問接口,而不必像傳統(tǒng)方式一樣必須依賴圖形API接口來實(shí)現(xiàn)GPU的訪問。在架構(gòu)上采用了一種全新的計(jì)算體系結(jié)構(gòu)來使用GPU提供的硬件資源,從而給大規(guī)模的數(shù)據(jù)計(jì)算應(yīng)用提供了一種比CPU更加強(qiáng)大的計(jì)算能力。CUDA采用C語言作為編程語言提供大量的高性能計(jì)算指令開發(fā)能力,使開發(fā)者能夠在GPU的強(qiáng)大計(jì)算能力的基礎(chǔ)上建立起一種效率更高的密集數(shù)據(jù)計(jì)算解決方案。
GPGPU使用圖形的API如DirectX或者OpenGL來進(jìn)行運(yùn)算,這將需要編程人員擁有大量的圖形API以及硬件相關(guān)技術(shù)。而且,編程架構(gòu)也收到了隨機(jī)讀取寫入以及線程配合的限制。編寫并行運(yùn)算的程序很復(fù)雜,因?yàn)樗婕暗绞褂么罅緾PU作為同一個(gè)簇共同工作的問題。有的桌面程序由于比較難把單一線程的工作量分配給不同線程工作,需要減慢速度才能和多核CPU配合上,這是由于CPU本來就是一個(gè)串行的處理器,大量的CPU需要一個(gè)非常復(fù)雜的軟件與其相配合工作。
CUDA去除了這種需要手動(dòng)管理平行處理的障礙,使用CUDA為基礎(chǔ)編寫的程序?qū)嶋H上仍然為一個(gè)串行的程序。
·核心架構(gòu):GPU VS CPU
- 設(shè)計(jì)目的:CPU核心設(shè)計(jì)是越快越好地處理處理線性指令。而GPU的核心設(shè)計(jì)為越快越好地同時(shí)處理多個(gè)流指令。
- 晶體管:CPU內(nèi)使用的晶體管大部分被用來作成指令緩存,等待分配中心,硬件分支預(yù)測甚至是大型的核心內(nèi)緩存。這些特性讓其在處理單線程任務(wù)時(shí)獲得高速的性能。GPU內(nèi)大量的晶體管都被用作處理器陣列,多重線程處理部分,共享型緩存以及數(shù)個(gè)顯存管理器。這些特性并不能加速某個(gè)特定線程的處理速度,而是為了千百個(gè)線程同時(shí)運(yùn)作,優(yōu)化線程間通訊,以及保持高速顯存帶寬而設(shè)計(jì)的。
- 緩存:CPU使用緩存來減少與內(nèi)存之間的延時(shí)問題。GPU使用緩存(或者軟件控制的共享緩存)來加大帶寬
- 延時(shí)管理:CPU使用大緩存和分支預(yù)測部分來處理CPU和其他部分之間的延時(shí)。這使用了大量的核心空間,同樣也導(dǎo)致了能源消耗量大的問題。GPU利用同時(shí)處理大量線程的優(yōu)勢來解決延時(shí)問題。如果某個(gè)線程正在等待從顯存返回的信息,GPU能夠?qū)⑵淞⒖剔D(zhuǎn)向處理其他信息,中間不消耗任何時(shí)間差。
- 多線程處理:CPU的每一個(gè)核心支持單線程或者雙線程。而支持CUDA的GPU內(nèi)每一個(gè)SM(Streaming multiprocessor)都支持多達(dá)1024個(gè)線程。所以在切換線程的時(shí)候GPU是無需浪費(fèi)額外的運(yùn)算時(shí)間。
- SIMD VS SIMT:CPU使用SIMD(single instruction, multiple data)單元來進(jìn)行向量處理。而GPU使用SIMT(single instruction multiple thread)來進(jìn)行可拓展的線程處理,SIMT并不需要編程者來把信息轉(zhuǎn)換成向量處理所需的形式而且它也允許線程的任意分支。
- 顯存控制器:Intel CPU 目前并沒有將內(nèi)存控制器整合到核心內(nèi),而支持CUDA的GPU整合了8個(gè)核心內(nèi)的顯存控制器,如此一來和CPU相比GPU就擁有了多達(dá)10倍的內(nèi)存/顯存帶寬。
|
NVIDIA正是想憑借GTX 200強(qiáng)大的計(jì)算能力以及CUDA這個(gè)架構(gòu),將計(jì)算機(jī)轉(zhuǎn)變成一個(gè)以GPU為計(jì)算中心的平臺(tái)。
◆
現(xiàn)在的PhysX物理加速技術(shù)廣泛應(yīng)用于超過150款的游戲中,并在各個(gè)領(lǐng)域有超過1萬名開發(fā)者在使用,可支持各種游戲平臺(tái)。
|
今年2月NVIDIA收購了物理加速處理器廠商Ageia,將這一頗有前途的技術(shù)收歸囊中,顯然PhysX物理加速技術(shù)自然會(huì)逐漸融入到NVIDIA的產(chǎn)品中,NVIDIA在其后稱他們正在努力將物理引擎移植到CUDA架構(gòu)中。全新的GTX 200系列成為NVIDIA高調(diào)宣傳支持PhysX技術(shù)的顯卡。
當(dāng)PhysX結(jié)合驚人的GPU并行計(jì)算能力,可以提供一個(gè)指數(shù)倍增的物理處理效能,同時(shí)將游戲帶入另一個(gè)全新的境界,提供各種豐富具有臨場感的物理物效游戲場境。
|
不過目前的驅(qū)動(dòng)還不支持PhysX,NVIDIA承諾在近一兩周內(nèi)會(huì)推出新的驅(qū)動(dòng)以支持PhysX技術(shù),到時(shí)游戲玩家就能通過NVIDIA顯卡來進(jìn)行物理加速,而需要調(diào)用CPU資源的Havok物理加速引擎將會(huì)面臨NVIDIA PhysX的挑戰(zhàn)。
|
GTX 200具有先進(jìn)的動(dòng)態(tài)電源管理
◆
自G80架構(gòu)出現(xiàn)之后,NVIDIA放棄了原先GPU中2D、3D頻率的區(qū)分,無論什么情況下,GPU的頻率都是恒定不變的,這種狀況一直延續(xù)到GeForce GTX 200誕生之前(之前我們?cè)u(píng)測過的GeForce 9500GT也具有2D/3D頻率之分,但9500GT是還未發(fā)布的產(chǎn)品)。
而NVIDIA的對(duì)手AMD在ATI Radeon HD 3800系列時(shí)開始引入Powerplay節(jié)能技術(shù),這種技術(shù)有助于在GPU空閑或少量使用的狀態(tài)下減少電量消耗,從而達(dá)到降噪節(jié)能的目的,也成為AMD顯卡的一大賣點(diǎn),放棄了2D/3D頻率之分的NVIDIA顯卡顯然在這一點(diǎn)上有些吃虧。
到了GTX 200系列,NVIDIA重新引入了電源管理機(jī)制,GTX 200 GPU內(nèi)置了比以往的GPU更動(dòng)態(tài)、更靈活的電源管理,包括4種新的供電模式:
·待機(jī)/2D供電模式(約25w)
·藍(lán)光高清回放模式(約35W)
·全3D模式(根據(jù)特定情況--最差情況下TDP236W)
·HybridPower模式(實(shí)際為0W)
使用支持Hybrid Power的nForce主板,譬如基于780a芯片組的主板,GTX200在系統(tǒng)處理非密集型圖形計(jì)算或者視頻輸出的時(shí)候可以完全關(guān)閉,將處理工作交給主板內(nèi)置CPU, 在需要進(jìn)行3D密集型計(jì)算功能時(shí),NVIDIA的顯卡驅(qū)動(dòng)可以無縫轉(zhuǎn)換到特定的獨(dú)立顯卡模式。
|
每一張GTX200GPU都內(nèi)置了監(jiān)控器,能夠即時(shí)監(jiān)控到GPU內(nèi)部的運(yùn)行數(shù)據(jù),之后給系統(tǒng)驅(qū)動(dòng)發(fā)出不同的信號(hào),GPU驅(qū)動(dòng)則根據(jù)這些信號(hào),動(dòng)態(tài)地將顯卡調(diào)整至正確的運(yùn)行模式(譬如,調(diào)整至特定的運(yùn)行時(shí)鐘和電壓水平),將顯卡的耗電量降至最低--而這些步驟用戶都無須進(jìn)行操作,完全自動(dòng)。
不僅如此,GPU還內(nèi)含時(shí)鐘控制電路,能有效地“關(guān)閉”特定時(shí)間段內(nèi)(以每千分之一秒計(jì)算)未被使用的GPU內(nèi)部電路區(qū)域,加強(qiáng)在非全速運(yùn)行時(shí)減低GPU耗電量的功能。所有這些特色功能能讓GTX200顯卡實(shí)現(xiàn)峰值時(shí)的十分之一功耗(GTX280上約為25w),你所有的應(yīng)用都能被包含在這個(gè)省電功能范圍內(nèi)(譬如游戲,視頻回放,瀏覽網(wǎng)頁等等) 其他很多部分的GTX200管線都被重新設(shè)計(jì)以求更強(qiáng)的性能和減少多種數(shù)據(jù)處理的瓶頸。
對(duì)于GTX 280而言,其正常的核心/shader/顯存頻率應(yīng)該為602/1296/1107MHz,在待機(jī)/2D模式(進(jìn)行文檔處理、瀏覽網(wǎng)頁等)下,其頻率會(huì)下降到一個(gè)相當(dāng)?shù)偷乃,?00/100/100MHz,有輕松的顯示負(fù)荷時(shí),如播放高清視頻,則頻率會(huì)達(dá)到300/100/297MHz,只在在顯卡處于較高負(fù)荷時(shí),才會(huì)在全頻率下運(yùn)行,這樣的一種動(dòng)態(tài)電源管理,大大地節(jié)省能源消耗。
◆
![]() |
![]() |
![]() |
![]() |
GTX 280與其它三塊頂級(jí)顯卡體積相當(dāng),整卡長度同樣是26.6cm,均是雙卡槽設(shè)計(jì),不過風(fēng)扇的進(jìn)風(fēng)口卻增大了,從9800 GTX的60mm直徑增大到了70mm直徑。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
GeForce GTX 280內(nèi)部細(xì)節(jié)特寫
◆
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
GTX 280的供電模塊與以往nVIDIA的高端顯卡大不相同,看不到以往那種大量電容矗立的情形,而采用了大量的陶瓷貼片電容,綜合性能更好。
![]() |
![]() |
![]() |
![]() |
![]() |
NVIO芯片最早出現(xiàn)于G80系列顯卡,雖然NVIO功能強(qiáng)大,但實(shí)際上G80采用90nm制造工藝,核心的晶體管數(shù)已經(jīng)太多,只好將部分2D功能移出GPU。后來的G92由于采用65nm技術(shù),NVIO芯片被整合到GPU核心,F(xiàn)在GTX 200核心晶體管數(shù)達(dá)到了14億,NVIO芯片又只好在外“露宿”了。NVIO芯片真正支持10bit每通道的色彩輸出能力,使顯卡實(shí)現(xiàn)TMDS和雙400MHz RAMDAC、雙Dual-Link XHD DVI輸出功能。
![]() |
◆
![]() |
整卡功耗達(dá)到236W的GTX 280對(duì)散熱器是一個(gè)嚴(yán)峻的考驗(yàn),不過初看起來,這個(gè)散熱器和9800GTX所用的并沒什么大不同,散熱面積也只有2000cm^2左右,不過仔細(xì)端詳之后,你會(huì)發(fā)現(xiàn)GTX 280散熱器上的熱管達(dá)到了8根之多,這些熱管分別將熱量從銅底座導(dǎo)向散熱鰭片與外殼。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
◆
GTX 260相當(dāng)于縮水版的GTX 280,TPC只有7個(gè),SP總數(shù)為192個(gè),顯存位寬為448bit,顯存容量只有896MB,核心/顯存頻率為576/999MHz。
![]() |
在產(chǎn)品外形上,GTX 260與GTX 280基本一致,只有一些細(xì)小的差別,如電源接口GTX 260只需要2個(gè)6-pin的PCIE電源接口就可以了,并沒有工作狀態(tài)指示燈。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
GTX 260的顯存同樣是hynix H5RS5223CFR系列,不同的是,GTX 260顯存的系列號(hào)為N0C,Hynix規(guī)定其額定頻率只有1000MHz,而NVIDIA規(guī)定GTX 260顯存工作頻率正是1000MHz;另一方面,GTX 280顯存的系列號(hào)為N2C,額定工作頻率為1200MHz,這意味著GTX 260的超頻空間將不如GTX 280大。
此外,GTX 260共14顆GDDR3芯片,顯存容量為64MBx14=896MB,少于GTX 280的1GB。
![]() |
![]() |
◆
GTX 280在高清回放上并沒有作什么特別改進(jìn),還是延用了G9X系列的VP2引擎。我們對(duì)GTX 280的高清回放性能作了簡單測試,為了更好體現(xiàn)它的硬件解碼能力,選用了低端的Intel Celeron 460處理器(2.4GHz,12*200MHz),這樣可以較合理地測試顯卡播放高清視頻的能力。
測試片源選用了Remux格式的3部高清視頻,分別是采用VC-1視頻編碼的DEJAVU(時(shí)空線索)、H264/AVC編碼的X-MAN3(X戰(zhàn)警3)、MPEG-2編碼的Pioneer_DEMO2006(先鋒演示),三大編碼齊全。
![]() |
從CPU占用率可以看出,NVIDIA GeForce GTX 280與NVIDIA其它G9x芯片處于同一水準(zhǔn),具備完整的H.264硬件加速功能,對(duì)VC-1編碼的視頻解碼還稍有欠缺,對(duì)MPEG2編碼,因?yàn)槠渚幋a相對(duì)較簡單,目前NVIDIA和AMD都是使用了選擇性硬解碼,因此CPU占用率也比較高。
實(shí)際應(yīng)用中,與GTX 280這樣高端顯卡搭配的應(yīng)該是高端的CPU,因此CPU占用率并沒有我們測試的數(shù)據(jù)這么夸張,比如用QX9650 CPU時(shí),播放VC-1編碼視頻時(shí),CPU占用率一般只在5%左右,這也是NVIDA一直不在高端顯卡中加入全VC-1硬解碼的VP3引擎的原因,在高端平臺(tái)中,VP2足夠了。
◆
從前面我們知道,GTX200系列GPU內(nèi)置了比以往的GPU更動(dòng)態(tài)更靈活的電力控制機(jī)制,按NVIDIA官方的資料來說,在待機(jī)時(shí)整卡功耗只有25W,全3D模式下最多236W,而236W是NVIDIA顯卡有史以來最高的功耗(整卡功耗,不單指GPU),看來14億個(gè)晶體管和1GB的顯存并非只是用來看的,發(fā)熱量隨之“茁壯成長”,按著NVIDIA提供的數(shù)據(jù),搭建GTX 280平臺(tái)至少需要550W的電源,如果組成SLI系統(tǒng),則電源要求達(dá)到750W。
來看看在實(shí)際應(yīng)用中,GTX 280新的電力管理有什么作用,高負(fù)荷下功耗又會(huì)達(dá)到多少。
測試時(shí)所有顯卡均為零售產(chǎn)品、默認(rèn)頻率以及使用原裝散熱器。我們利用Brenenstuhl功耗測試儀記錄了實(shí)際功耗值,請(qǐng)注意這個(gè)成績指的是整機(jī)功耗,而不是獨(dú)立的顯卡功耗,由于平臺(tái)一致,所以數(shù)據(jù)是具有參考價(jià)值的。
成績分兩種模式獲得,一個(gè)是在操作系統(tǒng)內(nèi)待機(jī)15分鐘,另外一個(gè)是使用ATITOOL進(jìn)行Show 3D View,讓顯卡在高負(fù)荷下運(yùn)行,記錄它們穩(wěn)定時(shí)的功率。
測試平臺(tái):
Intel Core 2 Quad QX9650(400MHzX10)
Asustek MAXIMUS EXTREME
ADATA DDR3-1066 1GBx2
Seagate ES.2 500G
Evercool 大黃蜂 CPU Cooler
Silverstone DA750 PSU
可以看到,GTX 280的功耗可以用冰火兩重天來形容了,在待機(jī)時(shí)功耗比55nm制程且有“Powerplay”技術(shù)的Radeon HD 3870X2更低,僅有142W,足足低了9W,對(duì)比于同門的9800GX2(其最高整卡功耗197W),在待機(jī)下GTX 280的功耗優(yōu)勢非常明顯,這完全取決于GTX200系列GPU中植入了先進(jìn)的動(dòng)態(tài)電力管理機(jī)制,比起對(duì)手的“Powerplay”似乎更勝一籌。
不過在全3D模式下,GTX 280的功耗劇增,非常之驚人,比起9800GX2和3870X2,分別高出58W和81W,功耗之王的盛名看來是非GeForce GTX 280莫屬。
◆
剛看到在高負(fù)荷下GTX 280的功耗確實(shí)驚人,GPU的溫度是不是也同樣驚人呢?
![]() |
在默認(rèn)頻率下,運(yùn)行ATITOOL Show 3D View時(shí)GPU的溫度比我們想象中要低,不過也有83℃,在以前測試中,8800 GTS 512MB在高負(fù)載時(shí)GPU溫度能達(dá)到81℃,因此對(duì)于GTX 280的發(fā)熱量不用過分擔(dān)心,目前的散熱器還是可以壓制得住的。
在比較空閑時(shí),顯卡出風(fēng)口的溫度約50℃,當(dāng)顯卡處于高速運(yùn)行狀態(tài)時(shí),出風(fēng)口的溫度也飆升到了60多度,在夏天你會(huì)覺得陣陣熱風(fēng)襲來,冬天就好了,它會(huì)是很好的暖手工具。
在工作中風(fēng)扇的噪音并不明顯,可以觀察到其轉(zhuǎn)速并不快,在高負(fù)荷時(shí)轉(zhuǎn)速會(huì)略有提高,噪音也是在可以接受的范圍內(nèi)。
![]() |
可能是由于個(gè)體原因,測試用的這張顯卡核心頻率只能由602MHz超到655MHz,相應(yīng)的shader頻率提升到1410MHz,顯存最高可以超到1253MHz(默認(rèn)頻率為1107MHz,顯存的規(guī)格為1200MHz),可以說核心超頻能力并不高。我們另外收到的Zotac GeForce GTX 280 AMP顯卡,其默認(rèn)核心頻率雖然達(dá)到了700MHz,但Shader頻率只有1400MHz,要知道光超核心頻率并沒有多大作用。
原裝散熱器勉強(qiáng)可以控制住GTX 280燃燒的芯,但想要更好的超頻和控制更低的溫度,更換第三方散熱器是必須的,目前來說,適用的散熱器還幾乎未見,要等上些時(shí),不過已有廠商推出了水冷版的GTX 280。
![]() |
◆
進(jìn)行測試的驅(qū)動(dòng)都是目前最新的驅(qū)動(dòng)程序,GeForce GTX 280使用的是Forceware 177.34 Beta驅(qū)動(dòng),從這個(gè)版本開始加入對(duì)CUDA的支持,而GeForce 9800GX2使用的是175.16 WHQL驅(qū)動(dòng),Radeon HD 3870X2則使用了最新的催化劑8.5版本。
具體的游戲設(shè)置,開啟了所有可以打開的特效,并設(shè)置為最好的效果,另外AA和AF均由游戲內(nèi)建的情況決定,我們不使用驅(qū)動(dòng)面板進(jìn)行強(qiáng)制性驅(qū)動(dòng),對(duì)于沒有內(nèi)建benchmark的游戲,采用Fraps來測試。
由于這次測試的顯卡都是最頂級(jí)的,因此只測試了1680*1050和1920*1200兩個(gè)分辨率下的成績。
◆
在GeForce GTX 280還未面世之前,GeForce 9800GX2是這個(gè)星球上最強(qiáng)的娛樂級(jí)顯卡,不過它是一塊“SLI”模式的雙GPU顯卡,兩者的價(jià)格也相當(dāng)接近,9800GX2的參考價(jià)為$599(國內(nèi)售價(jià)4999元),GTX 280的參考價(jià)為$649(國內(nèi)參考售價(jià)4999元),面對(duì)規(guī)格高出很多的單GPU顯卡GTX 280,雙GPU的9800GX2還能保住性能王位嗎?
![]() |
作為三個(gè)月前發(fā)布的產(chǎn)品,9800GX2雖然延用了G80的第一代統(tǒng)一架構(gòu),但憑借雙GPU在2/5的測試項(xiàng)目中還是領(lǐng)先于GeForce GTX 280,當(dāng)然更多的測試中,新一代架構(gòu)的GTX 280還是取得優(yōu)勢,有所有34項(xiàng)數(shù)據(jù)中,雙方互有長短,最終的結(jié)果是相對(duì)于9800GX2,GTX 280平均領(lǐng)先4%。
本是同根生,但GTX 280還是非常無情地將9800GX2趕下神壇,將性能王者的皇冠占為已有。
全面壓倒:GTX 280 vs Radeon HD 3870X2
◆
作為對(duì)手AMD目前最高端的產(chǎn)品Radeon HD 3870X2,GTX 280顯然也是有必要與之比較一下的,雖然我們都能料到是什么樣的結(jié)果。
這樣的結(jié)果是意料中的事,GTX 280全面壓倒Radeon HD 3870X2,在以前的GeForce 9800GX2的測試中,也有很相似的結(jié)果,不過是9800GX2換成了GTX 280,雙GPU換成了單GPU,可以看出NVIDIA在產(chǎn)品線上的一個(gè)大踏步前進(jìn)。
◆
GTX 200系列顯卡可以支持2 Way/3 Way SLI,而參考價(jià)$399的GTX 260更適合組建SLI平臺(tái),其SLI效率會(huì)如何呢?
![]() |
![]() |
由于時(shí)間關(guān)系,我們只能做一個(gè)簡單的測試,在3DMark Vantage Extreme模式下,GTX 260 SLI的效能提升達(dá)到了86.7%,非?捎^,關(guān)于這一點(diǎn),我們將會(huì)繼續(xù)跟進(jìn)做測試測試。
◆
Folding@home是美國史丹佛大學(xué)推動(dòng)的分散式運(yùn)算計(jì)劃,目的在于使用聯(lián)網(wǎng)式的計(jì)算方式和大量的分布式計(jì)算能力來模擬蛋白質(zhì)折疊的過程,并指引對(duì)由折疊引起的疾病的一系列研究。ATI早在2006年就加入了這個(gè)計(jì)劃,最新的客戶端能支持Radeon HD 2000/3000系列顯卡,NVIDIA一直無緣這項(xiàng)可以說是全球最普及的顯卡通用計(jì)算應(yīng)用。在上個(gè)月,NVIDIA宣布CUDA顯卡即將加入Folding@home計(jì)劃,NVIDIA表示,目前全球有7000萬塊CUDA顯卡(GeForce 8及以上及Quadro和Tesla系列),平均擁有100GFLOPS的浮點(diǎn)運(yùn)算能力,如果這其中有0.1%參與Folding@Home,就能夠?yàn)樵撚?jì)劃帶來7PFLOPS的運(yùn)算能力,遠(yuǎn)遠(yuǎn)高于全世界最強(qiáng)大的超級(jí)計(jì)算機(jī)(運(yùn)算能力不足1PFLOPS)。
一直強(qiáng)調(diào)GPU Computing的GTX200系列首當(dāng)其沖,我們拿到了利用CUDA開發(fā)的支持GTX200的Folding@home的客戶端,進(jìn)行了簡單試用,在Forceware 177.34 beta驅(qū)動(dòng)中開始加入了對(duì)CUDA的支持。
![]() |
Folding@Home是以ns/day來衡量性能的,我們看到GTX 280能提供570ns/day的計(jì)算能力,要注意的這只是截圖時(shí)的數(shù)據(jù),實(shí)際上最后計(jì)算得到的結(jié)果是620ns/day。
作為對(duì)比,運(yùn)行Folding@Home時(shí),一顆四核心的CPU的計(jì)算能力為4ns/day,而Radeon HD3870的計(jì)算能力為170ns/day,可以看到擁用240個(gè)流處理器的GTX 280在這樣的密集式并行計(jì)算中有著具大優(yōu)勢。
體驗(yàn)CUDA:Elemental transcoder
◆
利用CUDA實(shí)現(xiàn)GPU計(jì)算來為應(yīng)用程序提速,Badaboom就是很好的一例,這是一款CUDA開發(fā)的視頻轉(zhuǎn)換軟件,可以把mpeg2的視頻轉(zhuǎn)換為ipod或者iphone這樣的所使用的H.264視頻格式。
![]() |
我們選取了一段碼率較高的MPEG2視頻,可以看到GTX 280的處理速度達(dá)到了80FPS左右,如果碼率較小,還可以達(dá)到100FPS以上甚至更高。328MB的MPEG2視頻轉(zhuǎn)換成17.4MB的iPhone可用的MP4視頻(640*365),只用了37s。
同樣的平臺(tái)下(Intel Core2 Quad QX9650),使用Wondershare iPhone Video Converter軟件進(jìn)行同樣的轉(zhuǎn)換格式工作,相當(dāng)是用CPU進(jìn)行計(jì)算,得到的結(jié)果是耗時(shí)107s,幾乎是用GTX 280轉(zhuǎn)換耗時(shí)的三倍。
![]() |
再一次可以領(lǐng)略到GPU Computing的強(qiáng)悍之處,相比于CPU,GPU在某些領(lǐng)域的計(jì)算能力確實(shí)可以達(dá)到CPU的數(shù)倍。
GTX 200的精彩:雙架構(gòu)設(shè)計(jì)
◆
作為圖形芯片領(lǐng)域的領(lǐng)頭羊,NVIDIA倡導(dǎo)未來GPU才是計(jì)算機(jī)核心的理念,并提出了“GPGPU(通用圖形處理器)”概念,同時(shí)推出OptimizedPC的戰(zhàn)略,鼓勵(lì)電腦廠商在電腦上采用更主流的顯示芯片,而減少對(duì)高性能處理器的使用,實(shí)際上也是最近“CPU和GPU到底誰重要”的話題。
GeForce GTX 200的發(fā)布并沒有象以前的產(chǎn)品那樣,大肆宣傳其3D性能,而將重點(diǎn)放在其GPU Computing上。GeForce GTX 200同時(shí)注重并行計(jì)算和圖形處理,可以說是雙架構(gòu)設(shè)計(jì)的統(tǒng)一體,在圖形處理功能的基礎(chǔ)上大幅提升了并行計(jì)算能力。GTX 200設(shè)計(jì)遵循的兩個(gè)原則"Beyond Gaming"和"Gaming Beyond"實(shí)際上是雙架構(gòu)設(shè)計(jì)的一種很好地詮釋。
![]() |
·強(qiáng)大的并行計(jì)算能力
GTX 280有240個(gè)處理器,其浮點(diǎn)運(yùn)算能力達(dá)到了933GFLOPs,幾乎是Intel四核處理器9650的十倍之多,意味著GPU在浮點(diǎn)運(yùn)算中有得天獨(dú)厚的優(yōu)勢,再加上支持雙精度浮點(diǎn)運(yùn)算以及142GB/s的顯存帶寬等增強(qiáng)特性,使得GTX 280擁有強(qiáng)大的并行計(jì)算能力,而基于C語言的CUDA平臺(tái)被越來越多的開發(fā)者所采用,CUDA 2.0的發(fā)布也讓它變得更加易于使用,GTX 200對(duì)于NVIDIA的“GPGPU”理念將會(huì)有著非常重要的推動(dòng)作用,意義非凡。
在我們測試的兩個(gè)CUDA應(yīng)用實(shí)例中,可以發(fā)現(xiàn)GTX 280在分布式計(jì)算和密集型計(jì)算時(shí)有著比CPU強(qiáng)上很多倍的能力,隨著CUDA的飛速發(fā)展,越來越多的程序可以使用GPU來作計(jì)算,處理能力比CPU更為強(qiáng)悍,無論對(duì)于消費(fèi)者還是NVIDIA來說,都是非常樂觀和期待的。
另外隨著驅(qū)動(dòng)對(duì)PhysX的支持,玩家更是可以體驗(yàn)到物理加速的快感。
·無與倫比的圖形處理能力
和GTX 200的并行計(jì)算能力相比,這次它在3D性能方面顯得要低調(diào)很多,而實(shí)際上,GTX 280卻擁有無與倫比的圖形處理能力,240個(gè)SP、512bit顯存帶寬、1GB的顯存,這些歷史最高記錄已經(jīng)讓它出落成一個(gè)人見人愛的“大美人”,各路諸雄無不拜倒在它裙下,相比雙GPU的GeForce 9800GX2和Radeon HD 3870X2,各有4%和29%的領(lǐng)先,這足以讓GTX 280成為這個(gè)宇宙最強(qiáng)的娛樂級(jí)顯卡。
GTX 200的SLI效率也很不錯(cuò),初步測試的結(jié)果顯示能達(dá)到80%以上,另一方面,它的動(dòng)態(tài)電耗管理也是一個(gè)亮點(diǎn),在待機(jī)下能顯著減少能耗,有很好的實(shí)際價(jià)值。
·GTX 280參考售價(jià)4999元
![]() |
GeForce GTX 280的官方參考價(jià)為649美元,國內(nèi)參考價(jià)基本在4999元,將在會(huì)17號(hào)大量鋪貨,而參考價(jià)399美元的GTX 260的鋪貨時(shí)間則要等到6月26號(hào)。
我們?cè)谝郧熬蛨?bào)道過,GeForce 9800GX2的壽命只有三四個(gè)月,現(xiàn)在看不假,GTX 200將會(huì)取代現(xiàn)在9800GX2的位置,9800GX2或許是歷史上最短命的性能之王吧?
不管怎么說,GTX 200有著許多值得一寫的地方,對(duì)于NVIDIA來說,GTX 200是一顆很重要的旗子,除了要占領(lǐng)3D性能的制高點(diǎn)外,更是要去搶CPU的飯碗,GPU與CPU之爭的好戲還在后頭呢。