史上最強芯片來了，黃仁勛夙願成真，輝達靠CUDA「酷酷噠」？

2024-03-20推薦

文 | 雷科技

「切勿錯過AI的決定性時刻！」

當黃仁勛在輝達GTC 2023上提出這個觀點時，可能很多和我一樣的普通人並沒有把它放在心上，畢竟當時的AI套用少之又少，懂得在家裏部署本地AI繪畫的只有極少數數碼愛好者，而相對大眾的大語言模型給人們帶來的也只有一時的新鮮感。

當然，現在看來，那個時間點可能確實是AI的決定性時刻。

今天淩晨，被譽為AI風向標的輝達GTC 2024在加州聖荷西SAP中心正式舉行，萬眾矚目的輝達創始人兼執行長黃仁勛登台發表主題演講【見證AI的變革時刻】。老黃誠不欺我，我們確實見證了一場AI的變革時刻。

在這場兩個小時的演講中，黃仁勛公布了該公司迄今為止最強的AI加速卡——Blackwell GB200超級芯片系統，預先配置好整套系統的完整版GB200伺服器，以及輝達在AI軟件（NIM微服務）、Omiverse雲（模擬地球）、具身智能（機器人）等技術方面的最新進展。

老黃帶來的這一波AI芯片基礎設施到底有多強大？將給AI大模型產業帶來什麽改變？一起來看。

Blackwell GB200：最強AI加速卡

在人工智能領域，計算速度是至關重要的。為了在最短的時間裏，完成大量同質化數據的並列運算，就需要給GPU投餵大量的數據，訓練出一個復雜的神經網絡模型，可以說 GPU就是AI大模型訓練平台的基石，甚至是決定性的算力底座。

因此，本次演講的主角自然是輝達的老本行 「Blackwell B200」 GPU 芯片。

（圖源：輝達，現場對比Blackwell架構和Grace Hopper架構的GPU）

作為NVIDIA Blackwell架構首款新產品， Blackwell B200 基於台積電的4nm工藝打造，采用了將兩個die連線成一個GPU的雙芯設計，因此每個GPU芯片上擁有2080億個晶體管。

比起上一代GH100 GPU上的800億個晶體管， Blackwell B200 GPU 算是一次相當大的突破，甚至還契合了摩爾定律，即 「集成電路上可容納的晶體管數目大約每隔18個月便會增加一倍」 。

（圖源：輝達）

黃仁勛表示，在這樣的架構升級下，Blackwell B200的AI效能可達20PFLOPS，而 H100僅為4PFLOPS，理論上可以為 LLM（大語言模型）的推理提升 30 倍的工作效率，額外的處理能力將使人工智能公司能夠訓練更大、更復雜的模型。

更離譜的是，在B200的基礎上，老黃還推出了完全體AI芯片組—— Blackwell GB200 ，由兩個Blackwell B200 GPU 和一個基於Arm的Grace CPU組成。

在參數為1750億的GPT-3 LLM基準測試中，輝達稱GB200的效能是H100的7倍，而訓練速度是H100的4倍。

這AI效能，已經形成代差水平了。

當然，如果GB200還不能滿足你的需求的話，輝達還準備了一系列由Blackwell GB200組成的伺服器陣列，最高可以實作由72片B200 GPU組成的GB200 NVL72 系統，FP8精度的訓練算力高達720PFlops，達到了可以和前代DGX SuperPod超級電腦集群的水平。

更重要的是，與H100相比，它可將成本和能耗降低到原來的 25 分之一。

在今年年初的時候，美國知名雜誌【紐約客】報道，ChatGPT每日耗電量或超過50萬千瓦時，相當於美國家庭平均用電量的1.7萬倍。正如馬斯克所說，在可以預見的未來，電能短缺將成為制約AI發展的主要因素。

（圖源：https://www.businessinsider.com/）

老黃明確表示，在此之前，訓練一個1.8萬億參數模型需要8000個H100 GPU和約15兆瓦的功率，如今2000個B200 GPU就可以做到這一點，而功耗僅為4兆瓦。

如此驚人的參數，讓老外直呼， 「摩爾定律已被覆寫！」

可以預見，為了繼續吸引國內市場的客人，黃仁勛很可能在未來推出采用新一代AI圖形處理器架構的特供版AI加速卡 Blackwell B20 GPU 。

只是在美國商務部明確 算力出口限制 的情況下，這顆中國特供版GPU能帶來多少產能上的提升，又能否和國產替代AI加速卡之間達成良性競爭，只能說目前一切都是未知之數。

從模擬地球，到人形機器人

從整個世界的狂熱程度來看，生成式AI浪潮的到來已凝聚了廣泛共識。 那麽我們到底能利用AIGC來做些什麽呢？老黃今天給出了一些標準答案。

不知道大家有沒有玩過一款叫做【模擬地球】的遊戲，開發商MAXIS在當時效能相對貧乏的電腦上創造了一個微縮地球，讓玩家扮演神明的角色，管理整個地球的地形、大氣、生物、文明等內容，建造一個生命繁榮的惑星。

現在，輝達利用大模型的能力，正試圖打造出地球的數碼孿生—— Earth-2 。

Earth-2是一個在輝達Omniverse中以百萬倍的速度執行Modulus建立的AI物理環境，旨在實作數據中心規模的全球模擬環境，最終利用雲端運算和人工智能技術來模擬和視覺化天氣情況。

（圖源：輝達）

利用傳統的天氣模型結合輝達的氣象模型，最高能夠實作探索數百公裏甚至數千公裏面積範圍的預報，提供諸如台風影響的侵襲範圍，從而最大程度降低財產的損失，未來這項技術預計也將向更多國家和地區開放。

沒有錯，當年PS3模擬地球的梗，如今似乎要成真了。

接下來，我們聊聊 人形機器人 。

近些年來，人形機器人成為了科學業界一個比較流行的研究趨勢，除了馬斯克那備受關註的Tesla Optimus，波士頓動力、Agility Robotics、優必選、小米、智元機器人、科大訊飛等中外企業也在這條道路上鉆研著。

隨著大模型不斷的叠代升級，智能泛化能力的飛速提升，業內有不少人看到了人形機器人的潛在前景，相較於用反復偵錯的各種數據去驅動機器人，不如試著用大模型用作大腦，機器人充當軀殼，讓大模型透過感知、運動和環境互動來獲取資訊、做出判斷並采取行動。

而這，便是人工智能的終極形態之一—— 具身智能 。

（圖源：輝達）

為此，輝達在今天推出了世界首款人形機器人通用基礎模型——Project GR00T，該模型驅動的機器人將能夠理解自然語言，並透過觀察人類行為來模仿動作，使用者可以在此基礎上教會其快速學習協調各種技能，以適應現實世界並與之互動。

老黃堅信，具身智能將引領下一波人工智能浪潮。

看到這裏小雷只想說，優必選們，趕緊去跟輝達合作吧，你們的機器人「身體」，必須在輝達的Project GR00T「大腦」加持下，才能成為真正的智能機器人。隨著Project GR00T的出現，真正的機器人時代可能要來了，這也是AI的最終極套用：讓人工智能具象成為「人」。

十年夙願終成真，輝達CUDA真「酷酷噠」

在 GTC 2024開幕演講上，老黃回顧了一下輝達的發展史。

2014年，黃仁勛首次強調 機器學習 的重要性，並且提出了CUDA（通用計算平台）的概念，在許多人還在把輝達當作「遊戲顯卡」的制造商時，它們已經走在了 AI 變革的最前沿。

然而當年，CUDA的套用場景主要是科學計算，就是類似於氣候模擬、物理模擬、生物資訊學等專業研究，套用場景很有價值，但卻狹窄。正因為此，輝達的CUDA一直沒有開啟市場，帶給輝達的回報無法與對應的巨量研發投入匹配。黃仁勛每年都需要向董事會解釋，為什麽輝達要堅持做CUDA？—— 可能當時老黃也不知道，輝達的CUDA會在未來幾年，先後迎來區塊鏈「挖礦」、AI大模型計算等計算場景，真實潑天富貴。

（圖源：輝達）

短短兩年時間，輝達透過H100、H200 芯片，締造了萬億AI帝國，市值已超越亞馬遜等傳統豪強，按照這樣的勢頭，在可見的未來，超越蘋果、微軟成為世界頭號巨頭也不是沒有可能。

現在，輝達的「卡」供不應求，不只是字節、百度等中國科技巨頭在搶著囤卡以應對極端情況，矽谷科技巨頭如微軟、Meta，也全都在找老黃買卡。

如今，盡管入局AI以及AI芯片的玩家越來越多，部份貿易政策的沖突也讓老黃變得有些束手束腳，但從整場大會演講來看，他依然對全新釋出的B200、GB200頗具信心，對於整個世界被AI賦能的願景更是堅定不移。

在被稱為AI套用元年的2024，輝達的CUDA（通用計算平台）正如其名，變得通用起來，從大語言模型、對話式AI、邊緣計算等底層技術，到智能座艙、自動駕駛、人形機器人等套用場景，再到AI手機、AI PC、AI家電、AI搜尋、AI繪畫等套用，以及未來的氣候預測、計算光刻與6G網絡，AI正無處不在，輝達的計算也無處不在，成為「通用計算」。

輝達的CUDA，真的很「酷噠」。