當前位置: 華文頭條 > 推薦

RX 7900 XT這款5K價位的性價比遊戲卡,目前跑AI套用效能又如何呢?

2024-04-18推薦

測試硬件和配置

對於遊戲玩家來說,選擇AMD顯卡往往會更有性價比,那麽隨著目前AI滲透式爆發增長,AMD顯卡在這方面表現到底又如何呢?是不是也具備性價比?我們今天就來探討一下,值得一提的是,本篇內容會分為AIGC(AI生成內容)和LLM(大語言模型)這兩個最備受關註的AI領域進行測試。

測試之前,不得不提一下AMD ROCm(開放式軟件堆疊),它的概念類似於NVIDIA CUDA,廣泛套用於LLM(大語言模型)、自動駕駛、機器學習等領域,AMD ROCm在Ubuntu系統(Linux)中支持相當成熟,而在去年四月份AMD正式推出ROCm For Windows,如今已完整支持RX 6800以上的AMD消費級顯卡,硬核就用手上的RX 7900 XT搗鼓一番吧。

測試顯卡來自定位次旗艦的藍寶石RX 7900 XT超白金OC L,外觀采用銀灰色金屬導流罩+單側靈動島RGB燈條設計,擁有七根鍍鎳熱管、全銅底座、鋁鎂合金框架等豪華用料,是AMD高端非公版的代表之作。

配合AI測試的處理器是銳龍 7 7700X,使用微星MAG B650M MORTAR WIFI迫擊炮組成3A平台,主機板外觀采用低調風格的純黑主題打造,散熱馬甲上還有拉絲效果處理很精致,它還采用了12+2相供電,服務於CPU的MOS最大電流支持到80A,應付最高端的銳龍9都不成問題。

壓制銳龍7 7700X的CPU散熱器是微星MEG CORELIQUID S360戰神,定位旗艦360水冷,整體由采用純黑效能風扇+2.4英寸IPS顯示器組成,水泵方案來自老夥計Asetek七代,冷頭上還內建了一個60mm風扇,可以為主機板周邊散熱。

為了驅動銳龍7 7700X和RX 7900 XT的高端組合,配備了來自微星的MPG A1000G PCIE5電源,它最大的亮點就是相容PCIe 5.0和ATX 3.0標準,擁有原生12VHPWR 16pin供電介面,最高可輸出600W,加上本身擁有10年質保售後,可很好適配現今及未來的旗艦顯卡。

其他硬件和配置方面,銳龍7 7700X直接開啟PBO技術,使用EXPO超頻達成DDR5 6000C34 16G*4,總計64GB記憶體容量,本次測試安裝的是AMD Adrenalin 24.3.1最新版本顯卡驅動(中間有加入去年23.11.1版本的簡單測試環節),作業系統是Windows 11 23p版本,最後在BIOS中開啟Resizable BAR技術提升一些顯卡效能。

Stable Diffusion不同分辨率出圖效能

首先來測試一下目前最為火熱的AIGC套用——Stable Diffusion AI繪畫,目前對於AMD顯卡來說有好幾種部署形式,簡單來分析一下吧。

第一種是DirectML SDK,外掛程式支持不錯,效率是最低的,有整合包。

第二種是透過Microsoft Olive轉換成ONNX,效率挺高的,但外掛程式支持不完善,部署起來繁瑣。

第三種是Ubuntu系統+AMD ROCm,效率和相容是最好的,不過部署同樣繁瑣,也不是大部份普通使用者熟悉的Windows系統。

第四種就是最近比較流行的ZLUDA外掛程式,效率僅次於第三種,也有整合包更適合大部份普通使用者,本文就以這種形式進行測試的。

ZLUDA外掛程式部署很簡單,只要下載最新版本的繪世整合包,安裝前置的AMD HIP SDK(不需要安裝專業版顯卡驅動),就可以在整合包界面——生成引擎這裏看到ZLUDA已經部署完畢,下面來看看Stable Diffusion AI繪畫六種設定的測試結果。

AbyssOrangeMix2深淵橙模型

正向提示詞:1girl,long hair,pink hair,game game cg,full body,best quality,masterpiece,realistic,8K wallpaper,beautiful and aesthetic,detailed background

反向提示詞:nsfw,ugly,low quality,low res,bad bad proportions,EasyNegative,missing arms,extra legs,too many fingers,extra arms and legs,text,username

采樣方法:DPM++ 2M Karras

叠代步進:20

分辨率設定:512X512,總批次:1,單批數量:1,RX 7900 XT出圖用時2.6秒

分辨率設定:768X768,總批次:1,單批數量:1,RX 7900 XT出圖用時7.4秒

分辨率設定:1024X1024,總批次:1,單批數量:1,RX 7900 XT出圖用時18.5秒

分辨率設定:1920X1080,總批次:1,單批數量:1,RX 7900 XT出圖用時1分5秒

分辨率設定:1024X1024,總批次:3,單批數量:6,RX 7900 XT出圖用時5分16秒

RX 7900 XT在ZLUDA加持下,各分辨率出圖情況都還不錯,尤其是基礎的單張512X512,在體感上就是秒出,單張1024X1024設定以下能在20秒內完成,而且還可以支持到1920X1080這種分辨率。結論顯而易見,ZLUDA外掛程式是目前A卡在Windows系統下的最優解方案,它相容性和效率都不錯。

在1024X1024分辨率專案中,RX 7900 XT甚至可以實作一批次生成六張圖,分成三個批次進行也沒有任何問題,視訊記憶體只用到17GB,20GB大視訊記憶體當然是綽綽有余,可以實作多線操作,能跑起來才是王道嘛。

硬核還測試了去年12月份的AMD Adrenalin 23.11.1顯卡驅動,結果是和目前最新版本沒什麽大區別,唯一就是舊驅動在首次使用ZLUDA編譯會更慢一些,對於現階段AMD顯卡來說,完善Stable Diffusion的各種外掛程式生態才是首要重心了,尤其是在Windows環境下的AMD ROCm支持。

Topaz Video AI基準測試

第二個AIGC套用則是Topaz Video AI,硬核經常用它來修復一些低分辨率的「粵語殘片」,下面來簡單看看RX 7900 XT在輸入1080P分辨率的基準跑分。

RX 7900 XT輸入分辨率1080P,各項模型的跑分效能

在Topaz Video AI常用的四個模型——插幀方面的修復常用模型是Apollo和Chronos,而影像方面的修復常用模型是Proteus和Gaia,從測試結果來看,RX 7900 XT用來修復1080P分辨率影片效率相當不錯,跑起來就是入門級顯卡的好幾十倍了,20GB大視訊記憶體海量儲備足夠可以餵飽。

Mistral-7B和通義千問1.5-14B/32B/72B四種大模型效能測試

第三個測試專案是LM Studio,這是一款可搜尋並下載在本地執行LLM(大語言模型)的套用,並可相容OpenAI API的介面,它省去了Python復雜的配置過程,也是免費開源的,重點它是本地部署,可以更好保護個人私密。

LM Studio對於AMD硬件也是相當友好,現今擁有支持銳龍處理器NPU硬件加速(包含AMD OpenCL)和AMD ROCm顯卡加速的兩種軟件版本,對於RX 6800以上的AMD顯卡來說,強烈推薦後者版本,效率完全不是一個概念,下面來看看RX 7900 XT執行7B、14B、32B、72B四種不同參數量的大模型效能如何吧。

Mistral-7B,RX 7900 XT使用AMD ROCm加速,推薦GPU負載數值MAX,推理速度為83.39 tok/s

通義千問1.5-14B,RX 7900 XT使用AMD ROCm加速,推薦GPU負載數值MAX,推理速度為66.91 tok/s

通義千問1.5-32B,RX 7900 XT使用AMD ROCm加速,推薦GPU負載數值MAX,推理速度為31.48 tok/s

通義千問1.5-72B,RX 7900 XT使用AMD ROCm加速,推薦GPU負載數值40,推理速度為3.01 tok/s

首先,在上述答案中,可以看到模型的參數量越大,AI回答的令人滿意程度就越高,而在執行72B參數量時(至少是能跑起來),由於遠遠超出了RX 7900 XT的負載能力,偶爾AI回答有時候會抽風,正常的時候和32B參數量用起來沒什麽區別。而32B參數量回答問題的體感也是秒回,AI生成文字的速度稍微比7B慢一丟丟,完全是不影響爽快體驗的。

通義千問1.5-32B,RX 7900 XT使用AMD ROCm加速,GPU負載可以用到90%以上,視訊記憶體則是15GB,可以充分把顯卡效能榨幹了,再次證明20GB大容量視訊記憶體的優勢之處,硬核比較好奇的是,如果是16GB視訊記憶體的顯卡,效能表現又會如何呢?

通義千問1.5-72B,對於RX 7900 XT來說,GPU負載數值是不能超過40的,否則就會出現報錯警告,執行它時記憶體占用達到36GB,但是效率卻上不去,這種恐怖如斯的參數量,一般都是多張專業卡才能跑得爽了。

結語

目前AMD RX 7900 XT這款顯卡售價在5K價位,它在遊戲效能方面可以比肩RTX 4080 SUPER了,性價比是相當高的,而經過本文實測,RX 7900 XT在AIGC(AI生成內容)和LLM(大語言模型)領域的效能表現,完全是對得起它的售價,它擁有20GB GDDR6X超大視訊記憶體容量,可以執行一些數據量更大的專案,我們也看到了AMD ROCm在Windows系統中可以發揮強大的AI算力,期待AMD可以繼續加大最佳化的力度吧!總得來說,RX 7900 XT是挺適合追求性價比的遊戲玩家和AI專業使用者。