輝達帶來最強AI芯片，資本市場卻潑了點冷水

2024-03-21推薦

在股價上呈現追趕蘋果之勢的輝達，先在產品上學了蘋果一招。

台北時間3月19日對外釋出的 B200 GPU芯片上，輝達首度采用了芯片封裝設計，即在一個大芯片上整合了兩個相同制程工藝的小芯片。

如何在無法提升制程工藝的前提下，實作芯片效能的進一步突破？蘋果在2022年的MI Ultra芯片上率先給出了解題思路——將兩個M1 Max芯片組合在一起，構成了MI Ultra，在同樣制程工藝基礎上實作了效能的提升。

被黃仁勛視為地表最強AI芯片B200釋出後，包括微軟執行董事長兼執行長薩提亞·納德拉、Alphabet和谷歌執行長桑達爾·皮查伊、亞馬遜總裁兼執行長安迪·賈西等一眾雲服務廠商大佬紛紛月台支持。

特斯拉及xAI執行長埃隆·馬斯克也不吝溢美之詞：「當下的AI領域，輝達硬體無可比擬。」

在生成式AI這股火爆趨勢中充當「AI軍火商」的輝達，憑借此前釋出的A100、H100等GPU，股價自2023年迎來暴漲，總市值相繼邁過1萬億美元、2萬億美元，目前成為僅次於微軟和蘋果的美股第三大上市公司。

輝達的另一面，在AI領域投入較慢的公司，則正在承受掉隊的代價。在行動網際網路時代執牛耳的蘋果，一度是標普500指數中貢獻最大的一家公司。受困於在生成式AI布局方面的遲緩，蘋果股價年內累計下跌近10%，總市值從3萬億美元高點滑落至當前的26826億美元。

但面對年內不到一個季度，股價便累計暴漲近八成的輝達，資本市場也開始產生分歧， 部份機構從看漲變為套現離場，如方舟投資管理公司基金經理凱茜·伍德（人稱「木頭姐」）。

看著輝達股價幾乎每天都在創造新紀錄，近期，瑞穗證券分析師Jordan Klein在一份報告中提醒道，「感覺有點不健康，讓人想起1999年和2000年瘋狂的科技市場心態。」

隨著投資者「恐高」情緒的蔓延，Jordan Klein等分析師試圖給過熱的市場降溫。花旗更是在報告中指出，輝達面臨的回呼風險正在加劇。

在資本市場已經顯現出分化局面的情況下，盡管有B200芯片的全新加持， 輝達當天股價也經歷了一波大漲到微漲的變化，股價漲幅從盤中超4%，下落至收盤後的0.7%。

盤後，輝達股價下跌1.76%。

面對每一次技術浪潮帶來的市場變革，50 Park Investments創始人兼執行長亞當·薩蘭表示，「我們一次又一次地看到當投資者被當下的技術創新理念所吸引時，邏輯就會被拋到一邊。當感性占據上風，股價就有無限上漲空間。」

輝達，無疑正成為當下投資者理性與感性賽局的風暴中心。

繼兩年前推出Hopper架構後，輝達帶著全新一代的Blackwell再次震撼AI界，黃仁勛希望以此開啟AI的變革時刻。

基於Blackwell架構開發的B200芯片，在制程工藝上延續了H100的5nm， 不過為了盡最大可能提升算力，輝達在B200上首度采用了封裝工藝，B200由兩個基於台積電4NP工藝的Blackwell GPU組合而成，總晶體管數量達到2080億個，是H100（800億）的2倍多，且能夠提供高達20 petaflops的算力，是H100（4 petaflops）算力的5倍。

（左為B200，右為H100）

效能提升的同時，B200在成本和能耗上，相比H100，最高可以降低25倍。疊加B200搭配的8顆HBM3e記憶體，最大可支持10萬億參數模型的訓練。作為對比，OpenAI的GPT-3 模型參數為1750 億，據黃仁勛透露，GPT-4模型參數約為1.8萬億。

以訓練一個1.8 萬億參數模型的GPT-4為例，之前需要用8000個Hopper GPU幹的活兒，現在用2000個Blackwell GPU就能做到，且功耗還減少至原來的約1/4，即從15 百萬瓦降至4百萬瓦。

如果想要更強效能，使用者只需把兩個B200 GPU與一個Grace CPU相結合，就能搭建為GB200超級芯片，其可以為大語言模型的推理環節提升30倍的工作效率。

在具有1750 億個參數的 GPT-3 LLM 基準測試中，GB200的效能是H100的7倍，訓練速度則是H100的4倍。

值得一提的是，Blackwell並非某一款芯片的專屬名，而是指代輝達的新一代芯片平台。基於該平台，輝達提供有多種伺服器節點規格，效能從小到大依次為：HGX B100，HGX B200，以及GB200 NVL72。

HGX B100配備x86 CPU和8個B100 GPU。HGX B200使用8個B200 GPU 和1個x86 CPU。最強大的GB200 NVL72系統，則配備36顆Grace CPU和72塊Blackwell GPU，具有1440Peta FLOPSde FP4 AI 推理效能，和720 Peta FLOPS的FP8 AI訓練效能。

「一個GB200 NVL72機櫃可以訓練27萬億參數的模型。」黃仁勛介紹道。這意味著，一個GB200 NVL72機櫃，便可以撐起約15個GPT-4參數規模的大模型。

不過，輝達並未明確給出B200芯片的具體上市時間和價格， 只表示將於今年晚些時候發貨。屆時，亞馬遜、谷歌、微軟和甲骨文，將成為首批提供Blackwell芯片驅動的雲服務提供商。

除了制程工藝上的停滯，會讓外界擔憂輝達繼續保持AI芯片領先姿態的永續性外， 高漲的AI熱情可能帶來的庫存挑戰，也讓部份投資機構打起退堂鼓。

「以2017年為例，那時加密貨幣行業的興起導致對輝達GPU需求激增，一度導致市場對其需求過於旺盛，即市場參與者急於購買GPU，以至於出現了超出正常需求的多倍訂購，這最終導致了庫存積壓。每當我聽到為了應對短缺而進行雙倍訂購、三倍訂購、四倍訂購時，我都會遠離。」

現實層面，一眾大公司的確在爭相搶購輝達芯片：祖克柏宣布要建立一個「大規模計算基礎設施」，到2024年底將包括近60萬個GPU儲備，其中涵蓋35萬張輝達H100顯卡；亞馬遜也開始籌劃建設世界上最快GPU推動的AI超級電腦，計劃配置超過1.6萬張輝達GH200超級芯片。B200芯片釋出後，亞馬遜率先表態，稱AWS已計劃采購由2萬張GB200超級芯片組建的伺服器集群。

在越來越多大公司以高於實際需求而搶購輝達芯片之際，後者供貨的速度卻遠遠達不到預期。

在四季度財報會上，黃仁勛再次提醒道，來自供應鏈的短缺，正加劇芯片供應現狀。

無論是上一代H100，還是全新一代的B200，都需要用到HBM記憶體。生成式AI爆發之前，因為成本高昂，HBM模式並未得到大規模市場化，全球預備產能並不多。目前SK海麗仕獨占HBM近一半市場份額，即便加上新入局的三星和美光，其能否滿足輝達需求都成問題，更何況還要將原本就捉襟見肘的產能，分潤給輝達的競品，如谷歌、AMD等自研AI芯片。

HBM環節之外，一顆輝達AI芯片的最終誕生，還需要經過台積電的CoWoS封裝。在5nm工藝節點下，目前僅有台積電可以大規模量產CoWoS先進封裝。原本供應H100都不夠用的CoWoS封裝產能，如今還得給同樣采用5nm的B200讓路。

而不論是HBM還是CoWoS，想要進一步提升產能，都至少需要近一年的時間提前規劃。

因供不應求而無法滿足市場需求的輝達，也給後來者留下了競爭的生存空間， AMD、谷歌、微軟、亞馬遜、Meta等已有的友商之外，一些新的競爭對手仍在不斷趕來。

進入2024年，阿特曼開始喊出7萬億美元的芯片全產業鏈制造計劃，軟銀創始人孫正義被爆出正尋求高達1000億美元資金，計劃打造抗衡輝達的AI芯片巨頭。

隨著越來越多公司加入AI芯片產品研發佇列，不排除會進一步加劇未來市場上的AI庫存壓力。

相比芯片庫存所帶來的遠期泡沫，不少投資者在輝達不斷重新整理紀錄的股價面前，已經開始出現「恐高」情緒，越來越多的聲音試圖給過熱的市場降溫。花旗報告中指出，投資市場呈現出過度樂觀和「一邊倒」的趨勢，股市面臨的回呼風險加劇。

瑞穗證券分析師Jordan Klein表示，投資者似乎陷入了「純粹的追逐模式」，這種市場行為導致半導體股價格不斷走高，形成了一種「自我強化」的趨勢。 「投資者應該記住，輝達等AI芯片股‘不可能每天都上漲’， 就像最近看起來不自然的行情那樣。」

「木頭姐」率先付諸行動。 從2023年四季度開始，木頭姐拋售輝達的力度逐漸加大。對於拋售行為，木頭姐對外解釋：「2014年，多數投資者還把輝達視作一家PC遊戲芯片公司，我們就選擇以5美元的價格買入。如今，輝達的收益已經超過了150倍，我們選擇獲利了結。」

在3月份致股東的一封信中，木頭姐進一步對輝達敲響警鐘，警告其驚人的增長可能會放緩。「從長遠來看，與思科的歷史軌跡相異，輝達的競爭環境可能會更加嚴峻。這不僅僅是因為部份競爭對手正在逐步取得市場成功，更關鍵的是，輝達的主要客戶，包括雲服務提供商和特斯拉等公司正在積極設計自主的人工智慧芯片。」

自2000年互聯網泡沫破裂後，思科股價在隨後幾年內暴跌約90%，此後一直未能回到互聯網泡沫巔峰時期。 在木頭姐看來，今天的輝達，就是昨天的思科。 「正如當年思科交換機和路由器引發互聯網革命一樣，輝達是推動人工智慧革命發展的關鍵公司，所以它的股價也會經歷較大的起伏和波動，就像思科在股市上經歷的那樣。」

但相比思科當年高達100倍的市盈率，以及頻繁的大額投資和收並購行為，當前的輝達市盈率仍維持在不到30倍低水平，同時借助其不斷增長的營收和利潤，輝達資產負債表也要好於思科。

但正如Jordan Klein所言，沒有一家公司的股價會一直上漲。投資者誰也不敢保證自己會不會買在了高點。