當前位置: 華文頭條 > 推薦

史上最強芯片來了,黃仁勛夙願成真,輝達靠CUDA「酷酷噠」?

2024-03-20推薦

文 | 雷科技

「切勿錯過AI的決定性時刻!」

當黃仁勛在輝達GTC 2023上提出這個觀點時,可能很多和我一樣的普通人並沒有把它放在心上,畢竟當時的AI套用少之又少,懂得在家裏部署本地AI繪畫的只有極少數數碼愛好者,而相對大眾的大語言模型給人們帶來的也只有一時的新鮮感。

當然,現在看來,那個時間點可能確實是AI的決定性時刻。

今天淩晨,被譽為AI風向標的輝達GTC 2024在加州聖荷西SAP中心正式舉行,萬眾矚目的輝達創始人兼執行長黃仁勛登台發表主題演講【見證AI的變革時刻】。老黃誠不欺我,我們確實見證了一場AI的變革時刻。

在這場兩個小時的演講中,黃仁勛公布了該公司迄今為止最強的AI加速卡——Blackwell GB200超級芯片系統,預先配置好整套系統的完整版GB200伺服器,以及輝達在AI軟件(NIM微服務)、Omiverse雲(模擬地球)、具身智能(機器人)等技術方面的最新進展。

老黃帶來的這一波AI芯片基礎設施到底有多強大?將給AI大模型產業帶來什麽改變?一起來看。

Blackwell GB200:最強AI加速卡

在人工智能領域,計算速度是至關重要的。為了在最短的時間裏,完成大量同質化數據的並列運算,就需要給GPU投餵大量的數據,訓練出一個復雜的神經網絡模型,可以說 GPU就是AI大模型訓練平台的基石,甚至是決定性的算力底座。

因此,本次演講的主角自然是輝達的老本行 「Blackwell B200」 GPU 芯片。

(圖源:輝達,現場對比Blackwell架構和Grace Hopper架構的GPU)

作為NVIDIA Blackwell架構首款新產品, Blackwell B200 基於台積電的4nm工藝打造,采用了將兩個die連線成一個GPU的雙芯設計,因此每個GPU芯片上擁有2080億個晶體管。

比起上一代GH100 GPU上的800億個晶體管, Blackwell B200 GPU 算是一次相當大的突破,甚至還契合了摩爾定律,即 「集成電路上可容納的晶體管數目大約每隔18個月便會增加一倍」

(圖源:輝達)

黃仁勛表示,在這樣的架構升級下,Blackwell B200的AI效能可達20PFLOPS,而 H100僅為4PFLOPS,理論上可以為 LLM(大語言模型)的推理提升 30 倍的工作效率,額外的處理能力將使人工智能公司能夠訓練更大、更復雜的模型。

更離譜的是,在B200的基礎上,老黃還推出了完全體AI芯片組—— Blackwell GB200 ,由兩個Blackwell B200 GPU 和一個基於Arm的Grace CPU組成。

在參數為1750億的GPT-3 LLM基準測試中,輝達稱GB200的效能是H100的7倍,而訓練速度是H100的4倍。

這AI效能,已經形成代差水平了。

當然,如果GB200還不能滿足你的需求的話,輝達還準備了一系列由Blackwell GB200組成的伺服器陣列,最高可以實作由72片B200 GPU組成的GB200 NVL72 系統,FP8精度的訓練算力高達720PFlops,達到了可以和前代DGX SuperPod超級電腦集群的水平。

更重要的是,與H100相比,它可將成本和能耗降低到原來的 25 分之一。

在今年年初的時候,美國知名雜誌【紐約客】報道,ChatGPT每日耗電量或超過50萬千瓦時,相當於美國家庭平均用電量的1.7萬倍。正如馬斯克所說,在可以預見的未來,電能短缺將成為制約AI發展的主要因素。

(圖源:https://www.businessinsider.com/)

老黃明確表示,在此之前,訓練一個1.8萬億參數模型需要8000個H100 GPU和約15兆瓦的功率,如今2000個B200 GPU就可以做到這一點,而功耗僅為4兆瓦。

如此驚人的參數,讓老外直呼, 「摩爾定律已被覆寫!」

可以預見,為了繼續吸引國內市場的客人,黃仁勛很可能在未來推出采用新一代AI圖形處理器架構的特供版AI加速卡 Blackwell B20 GPU

只是在美國商務部明確 算力出口限制 的情況下,這顆中國特供版GPU能帶來多少產能上的提升,又能否和國產替代AI加速卡之間達成良性競爭,只能說目前一切都是未知之數。

從模擬地球,到人形機器人

從整個世界的狂熱程度來看,生成式AI浪潮的到來已凝聚了廣泛共識。 那麽我們到底能利用AIGC來做些什麽呢?老黃今天給出了一些標準答案。

不知道大家有沒有玩過一款叫做【模擬地球】的遊戲,開發商MAXIS在當時效能相對貧乏的電腦上創造了一個微縮地球,讓玩家扮演神明的角色,管理整個地球的地形、大氣、生物、文明等內容,建造一個生命繁榮的惑星。

現在,輝達利用大模型的能力,正試圖打造出地球的數碼孿生—— Earth-2

Earth-2是一個在輝達Omniverse中以百萬倍的速度執行Modulus建立的AI物理環境,旨在實作數據中心規模的全球模擬環境,最終利用雲端運算和人工智能技術來模擬和視覺化天氣情況。

(圖源:輝達)

利用傳統的天氣模型結合輝達的氣象模型,最高能夠實作探索數百公裏甚至數千公裏面積範圍的預報,提供諸如台風影響的侵襲範圍,從而最大程度降低財產的損失,未來這項技術預計也將向更多國家和地區開放。

沒有錯,當年PS3模擬地球的梗,如今似乎要成真了。

接下來,我們聊聊 人形機器人

近些年來,人形機器人成為了科學業界一個比較流行的研究趨勢,除了馬斯克那備受關註的Tesla Optimus,波士頓動力、Agility Robotics、優必選、小米、智元機器人、科大訊飛等中外企業也在這條道路上鉆研著。

隨著大模型不斷的叠代升級,智能泛化能力的飛速提升,業內有不少人看到了人形機器人的潛在前景,相較於用反復偵錯的各種數據去驅動機器人,不如試著用大模型用作大腦,機器人充當軀殼,讓大模型透過感知、運動和環境互動來獲取資訊、做出判斷並采取行動。

而這,便是人工智能的終極形態之一—— 具身智能

(圖源:輝達)

為此,輝達在今天推出了世界首款人形機器人通用基礎模型——Project GR00T,該模型驅動的機器人將能夠理解自然語言,並透過觀察人類行為來模仿動作,使用者可以在此基礎上教會其快速學習協調各種技能,以適應現實世界並與之互動。

老黃堅信,具身智能將引領下一波人工智能浪潮。

看到這裏小雷只想說,優必選們,趕緊去跟輝達合作吧,你們的機器人「身體」,必須在輝達的Project GR00T「大腦」加持下,才能成為真正的智能機器人。隨著Project GR00T的出現,真正的機器人時代可能要來了,這也是AI的最終極套用:讓人工智能具象成為「人」。

十年夙願終成真,輝達CUDA真「酷酷噠」

GTC 2024開幕演講上,老黃回顧了一下輝達的發展史。

2014年,黃仁勛首次強調 機器學習 的重要性,並且提出了CUDA(通用計算平台)的概念,在許多人還在把輝達當作「遊戲顯卡」的制造商時,它們已經走在了 AI 變革的最前沿。

然而當年,CUDA的套用場景主要是科學計算,就是類似於氣候模擬、物理模擬、生物資訊學等專業研究,套用場景很有價值,但卻狹窄。正因為此,輝達的CUDA一直沒有開啟市場,帶給輝達的回報無法與對應的巨量研發投入匹配。黃仁勛每年都需要向董事會解釋,為什麽輝達要堅持做CUDA?—— 可能當時老黃也不知道,輝達的CUDA會在未來幾年,先後迎來區塊鏈「挖礦」、AI大模型計算等計算場景,真實潑天富貴。

(圖源:輝達)

短短兩年時間,輝達透過H100、H200 芯片,締造了萬億AI帝國,市值已超越亞馬遜等傳統豪強,按照這樣的勢頭,在可見的未來,超越蘋果、微軟成為世界頭號巨頭也不是沒有可能。

現在,輝達的「卡」供不應求,不只是字節、百度等中國科技巨頭在搶著囤卡以應對極端情況,矽谷科技巨頭如微軟、Meta,也全都在找老黃買卡。

如今,盡管入局AI以及AI芯片的玩家越來越多,部份貿易政策的沖突也讓老黃變得有些束手束腳,但從整場大會演講來看,他依然對全新釋出的B200、GB200頗具信心,對於整個世界被AI賦能的願景更是堅定不移。

在被稱為AI套用元年的2024,輝達的CUDA(通用計算平台)正如其名,變得通用起來,從大語言模型、對話式AI、邊緣計算等底層技術,到智能座艙、自動駕駛、人形機器人等套用場景,再到AI手機、AI PC、AI家電、AI搜尋、AI繪畫等套用,以及未來的氣候預測、計算光刻與6G網絡,AI正無處不在,輝達的計算也無處不在,成為「通用計算」。

輝達的CUDA,真的很「酷噠」。