09-12年顯卡功能拓展:CUDA和Stream分析
★ 09-12年顯卡功能拓展:CUDA、Stream、DirectCompute、OpenCL
提起GPU通用計算,自然會讓人想到NVIDIA的CUDA、ATI的Stream以及開放式的OpenCL標準,再加上微軟推出的DirectCompute,四種技術標準令人眼花繚亂,他們之間的競爭與從屬關系也比較模糊。
首先我們來明確一下概念:
1. OpenCL類似于OpenGL,是由整個業(yè)界共同制定的開放式標準,能夠對硬件底層直接進行操作,相對來說比較靈活,也很強大,但開發(fā)難度較高;
2. DirectCompute類似于DirectX,是由微軟主導的通用計算API,與Windows集成并偏向于消費領域,在易用性和兼容性方面做得更出色一些;
3. CUDA和Stream更像是圖形架構或并行計算架構,NVIDIA和ATI對自己的GPU架構自然最了解,因此會提供相應的驅動、開發(fā)包甚至是現(xiàn)成的應用程序,通過半開放的形式授權給程序員使用。
其中ATI最先提出GPGPU的概念,F(xiàn)olding@Home和AVIVO是當年的代表作,但在被AMD收購后GPGPU理念擱淺;此后NVIDIA后來者居上,首次將CUDA平臺推向市場,在這方面投入了很大的精力,四處尋求合作伙伴的支持,并希望CUDA能夠成為通用計算的標準開發(fā)平臺。
在NVIDIA大力推廣CUDA之初,由于OpenCL和DirectCompute標準尚未定型,NVIDIA不得不自己開發(fā)一套SDK來為程序員服務,這套基于C語言的開發(fā)平臺為半開放式標準,只能用于NVIDIA自家GPU,因此并未得到業(yè)界的認可,AMD認為CUDA是封閉式標準,不會有多少前途,AMD自家的Stream雖然是完全開放的,但由于資源有限,對程序員幫助不大,因此未能得到大量使用。
就如同GPU能同時支持DirectX與OpenGL那樣,NVIDIA和AMD對DirectCompute和OpenCL都提供了無差別支持,真正的GPU通用計算之戰(zhàn),不在CUDA與Stream之間,而是OpenCL與DirectCompute之爭,DX11時代才剛剛開始……
● CUDA通用計算遍地開花
雖然GPU通用計算的概念最早由ATI提出并率先應用,但NVIDIA早已后來者居上。通過我們此前的諸多報道來看,CUDA軟件無論數(shù)量還是質量都遠超Stream,即便是同時支持CUDA和Stream的軟件,對于Stream的支持也都要晚上幾個月,N卡用戶有更多的選擇,而A卡用戶有得用就不錯了,HD7000在架構上已經接近CUDA核心了,但軟件方面依然是軟肋。
最近兩年,GPU通用計算在民用領域的應用出現(xiàn)了爆炸性成長的局面,CoreAVC CUDA解碼器、GPU倍線視頻、MediaShow、MediaCoder、暴風轉碼等一批更好用、更實用的軟件,讓普通用戶真正感受到了通用計算技術所帶來的好處。
參考文章:游戲外的精彩!GPU通用計算軟件大放送