您當前的位置:首頁 > 攝影

關於解決vega顯示卡hotspot溫度異常的一些經驗

作者:由 似水 發表于 攝影時間:2022-01-11

前段時間入手的二手vega56上水by冷頭後 hotspot高溫異常,昨天新入手的vega64上了這個by的冷頭依然存在hotspot高溫的問題,但將之前溫度異常的56裝回黑風散熱器拷機溫度又正常了 問題症狀是滿載下gpu溫度 視訊記憶體溫度均正常 hotspot會超過100度到達110度將黑屏宕機

具體問題詳情見

https://www。

chiphell。com/thread-192

7610-1-1。html

查了半天 包括外國的一些論壇 網上目前均對hotspot這個溫度代表什麼部位沒什麼明確說法,有說是gpu跟hbm視訊記憶體之間的縫隙的(絕大部分vega56/64封裝都是樹脂填充 根本不存在用矽脂填充散熱的說法),也有說是代表任何部件中最高溫度部分的(包含gpu視訊記憶體供電或者其他任何原件)。但是根據會宕機的情況看,這個數值是有實際意義的 不僅是顯示一個毫無作用的縫隙溫度。

另外得知 有此現象的基本為使用by冷頭和拆過散熱器的群體。

今天反覆拆機好幾次,結合CHH壇友“

manyhn

”和“

ycy9128

”的經驗,自己發現了大概的問題所在

這是vega原裝散熱器的導熱部分 對應核心位置(GPU+HBM視訊記憶體)以及供電的mos部分和電感部分 1。藍色部位為核心 2。紅色部位為電感 3。黃色部位為MOS貼片

(官方使用導熱墊厚度均為1mm)

關於解決vega顯示卡hotspot溫度異常的一些經驗

這是pcb拆解全圖以及原裝散熱器導熱墊對應的位置 藍色為mos貼片(低矮)紅色為電感部分(較高 高出核心高度)

關於解決vega顯示卡hotspot溫度異常的一些經驗

關於解決vega顯示卡hotspot溫度異常的一些經驗

這是我之前使用的導熱方案 灰色部分為1。5mm萊爾德 ,粉色部分為0。5mm雜牌導熱墊

關於解決vega顯示卡hotspot溫度異常的一些經驗

這樣的原裝導熱方案(原裝散熱器設計不同高度的凹凸部分以對應不同高低的原件 矽脂厚度均為1mm 我用1。5mm可壓縮矽脂搭配0。5mm實現全貼合) 上機依然存在hotspot高溫的問題,透過再次拆開發現 mos、電感處導熱墊 以及核心均接觸到BY的冷頭導熱板,但是核心位置上下貼合不均勻 沒有完全貼死核心與hbm位置

關於解決vega顯示卡hotspot溫度異常的一些經驗

這是BY客服提供的安裝方式,按圖片顯示只需要用附帶的1。2mm導熱墊貼在冷頭對應mos貼片的位置(因設計公差不同 不同散熱器無相互參考貼合厚度意義)

關於解決vega顯示卡hotspot溫度異常的一些經驗

關於解決vega顯示卡hotspot溫度異常的一些經驗

再次安裝時我僅保留了mos供電位置的導熱墊,我使用1。5mm的萊爾德760 這種導熱墊類似固體矽脂可以受力壓縮 間隙小於1。5mm 它也可以自己壓到合適的厚度 (1。5~1。0之間)可以更好的貼合 同時固定核心使用了原裝X背板

關於解決vega顯示卡hotspot溫度異常的一些經驗

關於解決vega顯示卡hotspot溫度異常的一些經驗

關於解決vega顯示卡hotspot溫度異常的一些經驗

注:我自己認為BY自帶的螺絲無法鎖緊核心位置,建議使用X背板固定核心位置,剩餘位置再使用by螺絲

關於解決vega顯示卡hotspot溫度異常的一些經驗

實測這樣hotspot溫度恢復正常

上圖為hotspot高溫症狀,下圖為正常狀態

關於解決vega顯示卡hotspot溫度異常的一些經驗

關於解決vega顯示卡hotspot溫度異常的一些經驗

透過這幾次拆解觀察與結合網路上的說法,我雖不確定hotspot到底是不是代表核心處縫隙溫度,但可以大致得出結論:大部分hotspot問題出現的原因應該在於核心位置貼合不緊導致。vega顯示卡的溫度感測專案中 gpu與hbm溫度檢測應該只是顯示錶面溫度 不是內部溫度,所以出現了顯示錶面溫度低但在滿載情況下hotspot專案卻迅速過熱的問題。

可能導致貼合不緊密的情況有:

1。背部螺絲沒有擰緊 2。使用了錯誤厚度的導熱墊 撐開pcb與散熱器距離 3。散熱器設計公差有問題 4。不應該安裝導熱墊

至於BY冷頭透過與客服諮詢,得知設計時僅為mos部分散熱,如果自行給電感部位加導熱墊 不管多薄都會影響冷頭貼合核心位置 導致貼合不緊密。原裝的散熱器以及EK、bp、北極狼散熱器 均給電感部分也散熱 並配備了多種不同厚度不同大小的導熱墊。by屬於降低定模成本的簡易設計,因此不推薦上by 冷頭 除非你犧牲電感以及pwm晶片的散熱。

附上北極狼水冷的散熱位置設計圖片供參考,這樣的設計照顧到了所有發熱原件 非常值得肯定

關於解決vega顯示卡hotspot溫度異常的一些經驗

另外有一項就是建議核心位置儘量安裝原裝X背板,不要使用冷頭自帶的螺絲,可以更好的貼合。

結論:vega顯示卡的核心溫度與HBM溫度的兩個感測器感應的是應該接近表面溫度 ,hotspot溫度則依然檢測的是核心部分,這個探測器位於GPU和hbm中間的槽裡 但是大部分vega顯示卡都使用樹脂填充了,但是這個位置填充不填充不影響硬體的執行,因為只有溫度感測器並沒有實際的硬體,但他更能顯示出接近核心部分元件的內部溫度,HS溫度到達100~120的時候才會不定時宕機並不是硬體有根據HS溫度自動保護的設定,而是HS高溫說明了GPU或者HBM內部高溫也達到了此溫度,從而觸發了顯示卡保護機制。

關於解決vega顯示卡hotspot溫度異常的一些經驗

解決方法就是排查 你的散熱器(or水冷頭)與pcb核心位置與各原件的貼合是否緊密、導熱貼厚度是否合適、散熱器(or水冷頭)的各部位設計公差是否合理。

標簽: 導熱  HotSpot  散熱器  溫度  貼合