李開復：AI大模型產業如何找到「算力」最優解

2024-06-19推薦

「隨著AI從1.0進入2.0大模型技術階段，我們迎來了有史以來最重要的科技革命和平台革命。」零一萬物CEO、創新工場董事長李開復日前在接受記者采訪時表示，算力作為AI 2.0發展的關鍵環節，需要采用更務實、更統籌最佳化的方法來應對當前的挑戰。未來，期待著人工智能尖端企業能夠更廣泛、深入參與到國家AI算力建設中來，各方優勢資源充分融合，更好賦能AI大模型產業發展。

「多地正在積極建設超算中心，打造國家級的算力底座，促進超算算力一體化營運，是非常好的探索和嘗試。」李開復認為，超算中心匯聚雲端運算、大數據和人工智能研發等多重功能及要素，聚集了豐富的AI發展資源和動能，未來可期。如何更好發揮各方優勢構建超強AI算力，或可從以下四個方面入手：

首先，遵循規模定律（Scaling Law），提升計算效率。大模型規模定律的重要性在這個時代得以凸顯——人類能夠用更多計算和數據不斷增加大模型的智慧，這條被多方驗證的路徑還在推進中，還遠沒有觸達天花板。

同時，大模型的智慧來自於接近無失真的壓縮，這點也非常重要。因為規模定律過程中不能盲目堆更多的GPU，所以需要有一個方法評估大模型企業有沒有越做越好或者哪個方法做得更好。遵循規模定律也成為當前諸多大模型企業規模化套用大模型時嘗試突破算力限制，將計算效率最佳化的有效途徑之一。

零一萬物內部有嚴謹的相關方法論，且用壓縮的理念去評估，讓以往漫無目的訓模過程變得更系統、更科學並有數學根據，較大提升了自身大模型的計算效率。

第二，加強「模基共建」，尋找算力最優解。目前，已開發國家AI領域GPU的數量和規模是中國的數倍左右，面對這樣的差距，我們需要采取更務實有效的舉措——自研AI Infra（AI Infrastructure人工智能基礎架構技術）。AI Infra主要涵蓋大模型訓練和部署提供各種底層技術設施。在國外一線大廠，最高效訓練模型的方式是演算法與Infra共建，不僅關註模型架構，而是從最佳化底層訓練方法出發。零一萬物自成立起便將自研AI Infra設立為重要方向，選擇跟國際一線梯隊齊平的「模基共建」戰略，模型團隊和AI Infra團隊高度共建，人數比為1：1。零一萬物在此基礎上自研了人工智能基礎架構技術，從底層最佳化訓練方法，較大節省成本，找到了當前條件下算力運用的優質路徑。從零一萬物國際領先的千億參數大模型「Yi-Large」訓練過程來看，經最佳化後，Yi-Large千億參數模型的訓練成本同比大幅下降。

第三，打造「模應一體」，探尋TC-PMF（Product-Market-Technology-Cost Fit，技術成本×產品市場契合度）。在大模型時代，模型訓練和推理成本構成了幾乎每個創業公司都必須要面對的增長陷阱。使用者增長需要優質的套用，而優質套用離不開強大的基座模型，強大基座模型的背後往往是高昂的訓練成本，接著還需要考慮隨使用者規模增長的推理成本。能夠率先察覺、並達到 TC-PMF這一普惠點的企業無疑會占盡先機。要做到這一點，模型、AI Infra、套用這「三位一體」的優異能力缺一不可。基於此，零一萬物將「模應一體」與「模基共建」一同列為公司的頂層核心戰略，在人才密度和協作方式上，也快速打磨出一整套能夠融合不同專業的優秀人才跨界共創的組織體系。基座模型、AI Infra、API、C端套用AI助手「萬知」，這些全棧式業務部署，使得零一萬物能夠以更全面的視野來看待大模型時代的增長陷阱，也為其在套用層的商業落地帶來了更大發揮空間。

第四，充分發揮尖端AI企業示範優勢。李開復認為，中國在發展AI算力等領域具有一定優勢。除了豐富的大數據資源外，中國的社會資源動員力、融合度較高，在科研、套用領域的研發效率、落地效果較好。同時，中國有非常多卓越的互聯網企業和現象級App套用，比如抖音、美團等等，這些企業在AI算力、演算法領域的探索有使用者支持作為基礎，企業更易研發出更具有前瞻性、套用性的套用，是AI大模型產業發展的重要推力。「未來，希望國家級超算中心、國內可靠尖端AI企業、多領域企業間能夠增強資源的整合利用，充分發揮各方優勢，更好融合發展，為AI更好賦能千行百業發展再添新動能。」（經濟參考報記者熊琳）