巔峰之作 4GB顯存GTX680四星大將評測

來源:泡泡網(wǎng) 更新日期:2012-05-06 作者:佚名

突破1GHz GTX680參數(shù)規(guī)格一覽

    NVIDIA的GPU從G80時代開始,其MIMD(多指令多數(shù)據(jù)流)一直以高效能而著稱,但也存在一個讓人頭疼的問題——GPU流處理器數(shù)量較少、浮點運算能力太低,這同樣限制了N卡在游戲以及計算方面的實際性能。

    這種情況在GTX680發(fā)布之時終于得以終結,每個SM流處理器數(shù)量從GTX580的32個猛增到192個,共計1536個流處理器和HD6970相同! 流處理器與核心同頻率,不再是兩倍。這些大刀闊斧的改進讓GK104的浮點運算能力翻番,性能也凌駕于HD7970之上!

    現(xiàn)在NVIDIA的Geforce GTX680正式發(fā)布還不到一個月,影馳便推出了4GB顯存的非公版產(chǎn)品——GTX680四星大將。影馳GTX680四星大將不僅顯存翻倍,而且擁有 1110MHZ的基礎核心頻率,動態(tài)加速可高達1162MHZ,如此強大的規(guī)格能帶來什么樣的性能?小編這就帶大家來體驗這塊4GB顯存的卡皇!

    突破1GHz,GTX680參數(shù)規(guī)格一覽

    是時候揭開GTX680的真面目了,我們先來看看它的規(guī)格參數(shù):

    使用“開普勒”核心的NVIDIA GEFORCE GTX680擁有1536個CUDA核心,默認頻率1006MHz,加速頻率為1058MHz,配備2GB 256Bit GDDR5、6000MHz頻率的顯存,外接供電為雙6Pin,熱設計功耗為195W,顯示輸出接口為2個Dual-Link DVI、1個HDMI和1個Displayport 1.2。

    GTX680與GTX580、HD7970、HD6970的對比表格:

    GTX680采用全新28納米制造工藝,與NVIDIA上代旗艦GTX580相比,CUDA核心數(shù)量暴增至1536個,核心頻率飆升至1006MHz,成 為首款默認核心頻率超過1GHz的旗艦級顯卡。而令人吃驚的是,晶體管數(shù)量和核心面積卻都有所減少,遠遠低于GTX580和HD7970,這樣一來供電方 面僅需要雙6Pin外接PCI-E供電,熱設計功耗也僅有195W,成為近年來最為省電的旗艦顯卡。顯存方面,GTX680采用了256Bit GDDR5,而顯存頻率大幅提高,達到了創(chuàng)紀錄的6000MHz。此外,這次GEFORCE GTX680可以支持4屏顯示,在顯示接口的配備上也有所改進,將使用多年的DVIx2+MiniHDMI的組合改為DVIx2+HDMI+DP。

開普勒之架構:流處理器暴增之謎

   

    基于效能和計算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構,NVIDIA雖然還是采用SIMT架構,但也借鑒了AMD“較老”的SIMD 架構之作法,降低控制邏輯單元和指令發(fā)射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當中容納了192個核心的壯舉就變成了現(xiàn)實!

    通過上面這個示意圖就看的很清楚了,CUDA核心的縮小主要歸功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強化運算單元削減控制單元的意圖就很明顯了。

    此時相信有人會問,降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構將會一去不復返了?理論上來說效率肯定會有損失,但實際上并沒有想 象中的那么嚴重。NVIDIA發(fā)現(xiàn)線程的調度有一定的規(guī)律性,編譯器所發(fā)出的條件指令可以被預測到,此前這部分工作是由專門的硬件單元來完成的,而現(xiàn)在可 以用簡單的程序來取代,這樣就能節(jié)約不少的晶體管。

    隨意在開普勒中NVIDIA將一大部分指令派發(fā)和控制的操作交給了軟件(驅動)來處理。而且GPU的架構并沒有本質上的改變,只是結構和規(guī)模以及控制方式 發(fā)生了變化,只要驅動支持到位,與游戲開發(fā)商保持緊密的合作,效率損失必然會降到最低——事實上NVIDIA著名的The Way策略就是干這一行的!

    這方面NVIDIA與AMD的思路和目的是相同的,但最終體現(xiàn)在架構上還是有所區(qū)別。NVIDIA的架構被稱為SIMT(Single Instruction Multiple Threads,單指令多線程),NVIDIA并不像AMD那樣把多少個運算單元捆綁為一組,而是以線程為單位自由分配,控制邏輯單元會根據(jù)線程的任務量 和SM內部CUDA運算單元的負載來決定調動多少個CUDA核心進行計算,這一過程完全是動態(tài)的。

    但不可忽視的是,軟件預解碼雖然大大節(jié)約了GPU的晶體管開銷,讓流處理器數(shù)量和運算能力大增,但對驅動和游戲優(yōu)化提出了更高的要求,這種情況伴隨著AMD度過了好多年,現(xiàn)在NVIDIA也要面對相同的問題了,希望他能做得更好一些。

開普勒之核心:SMX與SM的改動細節(jié)

   

    全新的Kepler相比上代的Fermi架構改變了什么,看架構圖就很清楚了:

    GK104相比GF110,整體架構沒有大的改變,GPU(圖形處理器集群)維持4個,顯存控制器從6個64bit(384bit)減至4個64bit(256bit),總線接口升級至PCIE 3.0。剩下的就是SM方面的改變了:

    這里之所以要把GF104這顆中端核心的SM架構圖也列出來,是因為GF104相比高端的GF100核心做了一些細小的改動,這些改動也被沿用到了GK104當中。另外從核心代號上來看,GK104其實就是用來取代GF104的,而取代GF100的核心另有他人。

    NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX,原因就是暴增的CUDA核心數(shù)量。但實際上其結構與上代的SM沒有本質區(qū)別,不同的只是各部分單元的數(shù)量和比例而已。具體的區(qū)別逐個列出來進行對比:

    1. NVIDIA現(xiàn)在把流處理器稱為CUDA核心;

    2. SFU(Special Function Units,特殊功能單元)是比CUDA核心更強的額外運算單元,可用于執(zhí)行抽象的指令,例如正弦、余弦、倒數(shù)和平方根,圖形插值指令也在SFU上執(zhí)行;

    3. Warp是并行線程調度器,每一個Warp都可以調度SM內部的所有CUDA核心或者SFU;

    4. Dispatch Unit是指令分派單元,分則將Warp線程中的指令按照順序和相關性分配給不同的CUDA核心或SFU處理;

    5. LD/ST就是載入/存儲單元,可以為每個線程存儲運算源地址與路徑,方便隨時隨地的從緩存或顯存中存取數(shù)據(jù);

    6. TMU是紋理單元,用來處理紋理和陰影貼圖、屏幕空間環(huán)境光遮蔽等圖形后期處理;

    通過以上數(shù)據(jù)對比不難看出,GK104暴力增加CUDA核心數(shù)量的同時,SFU和TMU這兩個與圖形或計算息息相關處理單元也同比增加,但是指令分配單元 和線程調度器還有載入/存儲單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略,此時如何保證把指令和線程填滿一個CUDA核心,將是一 個難題。

非公版做工超強

   

    影馳GTX680四星大將顯卡依然是我們熟悉的風格:藍色PCB加上銀白色的雙風扇散熱器。

    相比NVIDIA公版的GTX680使用的雙6PIN電源接口,影馳GTX680四星大將使用了6PIN+8PIN電源接口,可以提供更大的功率是GPU穩(wěn)定運行在更高的頻率之上。

    由于影馳GTX680四星大將使用了4GB的顯存,所以背面也布滿了顯存顆粒。頻率同公版GTX680保持一致,為6008MHZ。

    對于超頻玩家來說,每一相供電都是壓榨顯卡性能的重要配備,而影馳 GeForce GTX680 四星大將配備了5相核心供電,total power輸入由原來的150w飆升到225w,比公版更強。

    采用了Direct FET MOSFET,其電流輸入輸出高達40A且轉換效率高達89.09%比起公版GTX680所采用的八爪魚MOSFET擁有更卓越的性能、更酷冷的溫度。配合5相核心供電,能為GPU提供強大的電流支持。

    影馳GeForce GTX680 四星大將采用了新一代的雙子星散熱器,其散熱器TDP設計高達250W,大大高于公版的225W設計。而配合其供電相數(shù)、供電能力,將顯卡每一分的能耗性能壓榨至極限。

    DIYER一直強調個性身份,而影馳GeForce GTX680 四星大將采用了LED設計,更加炫麗,燈光效果更加更顯DIY個性。

測試平臺簡介:3960X+X79

   

    測試平臺我們使用目前性能最強勁的intel i7 3960X處理器,配合強大的技嘉X79UD7主板。

    3960X CPU默認頻率高達3.3GHZ,擁有6核心12線程,同時可以提供原生的PCI-E3.0總線,不會對GTX680造成總線上的瓶頸。

性能測試及總結

   

    通過與公版GTX680的對比我們發(fā)現(xiàn)在功耗增加不多的情況下影馳GTX680四星大將的性能較公版產(chǎn)品提高13.60%。尤其是吃顯存的地鐵2033提升尤為明顯,達到了28%的性能提升。

    總結:集成兩個雙通道DVI 完整尺寸的HDMI DP接口,并且首度支持4屏是GTX680的一大優(yōu)勢。但公版2GB的顯存容量顯然不是喜歡多屏和超高分辨游戲玩家的最佳選擇。影馳GTX680四星大將的誕生為這些頂級玩家提供了方便。

    而公版GTX680超頻會有著TDP以及默認頻率的限制,GTX680四星大將通過魔盤K可以將顯卡最大TDP限制調高,讓TDP限制不再是限制顯卡頻率 提升的瓶頸,再通過魔盤設置提升動態(tài)超頻幅度,輕松讓顯卡運行在默認設定更高的頻率下。而即使不超頻,四星大將基礎核心頻率也達到了1110MHZ,動態(tài) 提速核心頻率更是達到了史無前例的1162MHZ,這對于追求高性能的極限玩家來說無疑非常具有吸引力。

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論