2024年的百度大模型，離「錢」越來越近

2024-03-23推薦

大模型談錢，不寒磣。

前些日子朱嘯虎和楊植麟的隔空對話，代表了技術派和市場派的兩種觀點。朱嘯虎不看好大模型創業，認為現階段大模型公司缺乏場景和數據，估值過高，且面臨開源模型的競爭，投資風險大。他更傾向於投資能快速商業化、變現的套用層專案。

楊植麟堅定看好大模型創業，認為這是未來十年唯一有意義的事，並將其視為一個結合科學、工程和商業的系統，需要長期投入和堅持，最終目標是實作AGl。

雖然兩者觀點看起來針鋒相對，但有一點並不沖突，不論是在通向AGI的過程中「沿途下蛋」，還是現在就投資能看到產出的大模型套用公司，今年大模型的商業化，一定是離錢越來越近。

若論國內對大模型商業化最熱衷的企業，百度一定是其中之一。據此前報道，2024年百度創始人李彥宏在百度智能雲方向的OKR就是，跑通以大模型為核心智能雲發展路徑，並且在收入和利潤方面都有要求。

百度智能雲是百度AI能力的輸出口，海外市場大模型與雲服務結合得比國內更緊密，這也是百度智能雲希望努力的方向。

3月21日，百度智能雲千帆大模型平台就一口氣釋出了5款新模型，包括3個輕量級大模型、2個垂直場景大模型，並且千帆ModelBuilder以千帆AppBuilder也同步升級。鈦媒體App了解到，百度後續還將釋出大模型套用產品，譬如銷售、客服、辦公等產品。

可以說，目前百度大模型商業化只有一條主線，讓盡可能多的一部份人先用大模型，由此改變自己的產品和面向客戶的服務。

大模型落地「值不值」

初期大模型的火熱，未必能轉化為實實在在的訂單，在大模型技術和產業的高速發展期，有些廠商已經被歷史的車輪碾過，但卻絲毫不起一絲波瀾。

「慘烈，我覺得是很慘烈，從去年到現在有很多基礎模型廠商參與到市場競爭，也有很多的企業資金鏈受到了一些挑戰，也反映出新技術發展過程中的一些矛盾。」百度智能雲AI與大數據平台總經理忻舟說道。

這其中一個很重要的因素，就是大模型供需之間的錯位，大量企業沒有掏出真金白銀，而是處在觀望階段。從企業使用大模型的角度，主要關註三個因素，一是效果好不好，二是成本是否足夠低，三是效率，因此多數企業並不關心大模型或者小模型，只會結合自己的預期評估大模型落地到自己的場景「值不值」。

百度也提出了自己「效價比」的理念，除了極少的大客戶對大模型有極致的效果追求，更多的企業和機構往往要綜合考量大模型的使用效果、效能以及成本，即「效價比」

面向大模型如何落地，業內想了各種各樣的技術方法，比如RAG、外掛程式、MoE、小型化、大小協同等等各種各樣的問題，輕量級模型就是公認的「效價比」突出的方案。

「業界也逐漸形成一個共識，模型不見得是參數規模越大越好。在很多實際的場景當中，用小尺寸的專家模型也能夠達到我們通用大模型的效果，小尺寸專家模型的推理成本會更低，更便宜。」百度副總裁謝廣軍表示。

他還提到，本次釋出的三款模型都是開發專家模型的基座模型，主要面向兩個場景：一是客戶、合作夥伴結合自己的數據，去做垂類場景模型。二是百度也會基於這些小的基座模型，去開發第一方的行業垂類場景模型，比如做教育行業的教輔答題和解題，可以用一個小尺寸的模型加上一些數據，精調出一個效果很好的解題助手模型。

「3+2」，5款新模型

一月初，OpenAI釋出了多款新模型，價格下降，效能提升，百度本次也是同樣的策略，百度智能雲千帆ModelBuilder釋出了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在內，參數量由大到小的三款輕量級大模型。千帆ModelBuilder的概念就是生產平台，提供整個模型訓練的工具鏈，讓模型開發變得更簡單。

對於輕量級模型，謝廣軍表示，基座模型本身的效率一定要好，百度基於文心大模型的技術領先優勢積累，再把尺寸做小，模型的效果就會做得很好，在很多場景它能夠達到大模型的效果。

同時，百度釋出的輕量級模型具備再生產能力，比如支持post-pretrain、sft、lora精調能力，基座模型加上精調數據來達到垂直場景下的效果，同時成本更低。

具體來看，ERNIE Speed在推理場景下擁有最高128k的上下文長度，在處理知識問答等任務時，能夠更好的處理上下文的依賴關系，同時，針對特定場景可以將ERNIE Speed作為基座模型進行精調，模型效果可以追平甚至超過旗艦級大參數規模大模型，效價比大幅提升。

ERNIE Lite的參數量則更小，更適合搭載在低算力的AI加速卡上處理推理任務，作為ERNIE-Bot-turbo模型的升級版，ERNIE Lite在情感分析、多工學習、自然推理等場景下的套用效果提升了20%，推理呼叫成本大幅下降了53%。

參數量最小的ERNIE Tiny則主打極致低成本、低延遲，可用於檢索、推薦、意圖辨識等高並行、低延時等套用場景中，在某對話推薦業務場景中，精調後的ERNIE Tiny在搜尋引擎推薦詞激發環節，相比ERNIE 3.5，對話輪次增長了3.5%，成本下降了32%。

此外，百度智能雲千帆ModelBuilder還推出了ERNIE Character和ERNIE Functions兩款垂直場景大模型，分別適配客戶在角色扮演類套用場景（如遊戲NPC、客服對話等）和工具呼叫場景（對話中使用外部工具、呼叫業務函數等）中的使用需求。

結合企業實際使用大模型的過程，有些企業起初就用最好的模型看最好的效果，再決定投入的資源程度。有些場景需要快速驗證，企業可以先上輕量級模型，輕量級模型總結一句話——「輕歸輕，可破冰」，在一些場景下完全可用，作為大模型落地的先鋒軍。

對於註重私有數據的企業和行業，私有數據跟大模型結合也可以先用輕量級模型，不管是知識資產還是數據分析，都可以跑出效果。

「把大模型套用，餵到企業嘴邊」

千帆大模型平台上的客戶需求主要分為三種，第一類是在AppBuilder開發套用；第二類，直接呼叫百度的基座模型的，比如直接呼叫文心4.0、 3.5版本；第三類是生產模型，客戶數據和百度基座模型結合做一個新的垂類模型。

AppBuilder去年年底推出，從套用的視角讓開發者能夠便捷地開發基於大模型的AI原生套用，百度第一方也做了非常多的AI原生套用，也是基於這套平台做的，本次AppBuilder也進一步升級，進一步降低套用開發門檻。

升級後的AppBuilder開放的工具元件多達55個，包括基於百度多年技術積累和自有業務沈澱的大模型元件、AI能力元件，也包括搜尋等百度特色的業務元件、和多場景的第三方API工具，另外還提供了 RAG（知識檢索問答）、GBI（生成式數據分析）等根據典型套用場景深入調優的高級能力元件。

在元件之上，千帆AppBuilder推出的Agent（智能體）套用框架，具備精準的任務自主規劃能力，對多種套用工具的自動編排準確率超過90%。AppBuilder還支持開發者接入自訂工具，實作更復雜場景套用的需求客製。

謝廣軍介紹，AppBuilder分兩個形態，一個是程式碼態，百度提供SDK，甚至提供底層的元件和能力，這種是大B端的場景下的典型客戶畫像。另一個是零程式碼態，以小企業、個人開發者為主，現在零程式碼態開發者的數量比較多，百度這兩條路都要走。

根據百度智能雲公布的數據，千帆大模型平台已經服務8萬企業使用者，累計幫助使用者精調1.3萬個大模型，幫助使用者開發出16萬個大模型套用，自2023年12月以來百度智能雲千帆大模型平台API日呼叫量環比增長97%

大模型未來一段時間還會不斷快速演進，百度AI團隊主抓基礎模型，智能雲團隊主抓商業落地，構成了百度自己的大模型商業落地模式。