有大佬能給講一下顯示卡的具體引數比較嗎?
顯示卡主要看三個引數:
浮點運算能力
。如果你玩遊戲,最重要的是:單精度浮點數(single precision,FP32),越大越好,因為目前渲染能力主要是這個量決定。
視訊記憶體大小與視訊記憶體頻寬
。大小是指你一次性從計算機記憶體能夠轉入顯示卡視訊記憶體的最大資料量,這個量越大越好,因為可以減少CPU-GPU資訊交換的延遲(準確說是PCIe介面的瓶頸);頻寬是指GPU的吞吐資料量,這個量也越大越好,因為可以減少記憶體複製至視訊記憶體的時間。
其他硬體功能
。包括但不限於光線追蹤(Ray tracing),張量核運算(Tensor core)。如果你做精密運算,雙精度浮點數(double precision,FP64)閹割情況等。
其實維基百科會把這些引數都列出來,可以直接判斷顯示卡效能。但是釋出會/很多網站僅僅列出一部分,這個時候就需要自己計算:
單精度浮點數=核心數*核心頻率
視訊記憶體頻寬=視訊記憶體位寬*視訊記憶體頻率
其中核心數我一般會用主著色器(main shader processor)數量*2,準確來說應該是要看流處理器(streaming processor)、流多處理器(streaming multiprocessor)數量,但是很多情況下也是不會給出。
舉個栗子,我們用喜聞樂見的1050Ti:
https://en。wikipedia。org/wiki/List_of_Nvidia_graphics_processing_units
紅色的部分是單精度浮點數計算要用的:
核心數(768*2)*基礎核心頻率(1290)=1981440=1981。4 GFLOPS
核心數(768*2)*超頻核心頻率(1392)=1981440=2138。1 GFLOPS
看看是不是恰好等於Single Precision(單精度浮點運算能力)
綠色的部分是視訊記憶體頻寬計算要用的:
視訊記憶體位寬(128/8 byte)*視訊記憶體頻率(7000)=112000=112。0 GB/s
看看是不是恰好等於Bandwidth(視訊記憶體頻寬)
根據:2:1(Tesla系列,TITAN V);3:1(TITAN、TITAN Z);8:1(Geforce Fermi);24:1(Geforce Kepler);32:1(Geforce Maxwell、Geforce Pascal、Geforce Turing)的換算,你可以直接從FP32得到FP64運算能力,也看出老黃日益精湛的閹割水平。
“遊戲市場要啥雙精度?” “搞科研怎麼會缺錢?”
最後手動連結之前對下一代計算顯示卡的討論:
如何看待Nvidia於2020年5月4日釋出的全新Ampere GPU A100 (GA100核心)?