當前位置: 華文頭條 > 推薦

智譜AI給中國大模型公司的商業化打了樣

2024-03-15推薦

「人工智慧本就是一個綜合性學科,如果研究的成果不能很快被套用,它的價值很可能被遺忘。所以在KEG,我們會把研究和工程放在相對平等的位置上。這個風格也延續到我們出來做公司。」

去年10月,智譜AI CEO張鵬在ChatGLM3釋出前後的一次媒體采訪中說。這家由清華大學知識工程實驗室(KEG)孵化的人工智慧公司在同月釋出的這款基座模型,效能上開始追平GPT-3,甚至看向GPT-4。在整個2023年,智譜AI累計獲得超25億元融資,也成為國內估值最高的大模型公司之一。

2023年3月14日,智譜AI釋出了ChatGLM系列的第一款基座模型。回頭來看,這個日子或許是生成式AI的重要一天。這一天內,OpenAI釋出了GPT-4,同根同源的競爭者Anthropic釋出了Claude,谷歌推出了對抗OpenAI和微軟組合的PaLM API服務,而新銳的Midjourney釋出了V5。

一年時間足夠讓生成式AI從一場技術奇觀轉入一個商業化的初期階段。

ChatGP和Claude首先迅速轉入訂閱制,同時放出了API呼叫的定價模式。微軟Azure雲服務中目前53000左右的客戶數量中,有1/3來自最近12個月,而這幾乎完全歸功於OpenAI。

相比於OpenAI,缺少微軟這個天然使用者池的Anthropic更堅決地走向了企業客戶。科技公司Gitlab、Notion、Quora和Salesforce;金融巨頭橋水公司(Bridgewater)和企業集團SAP,以及商業研究入口網站LexisNexis、電信公司SK Telecom等行業的響亮名字都出現在Anthropic的客戶名單上。「Anthropic更像是一家企業公司,而不是一家消費者公司。」Anthropic聯合創始人達裏奧·阿莫迪和丹妮拉·阿莫迪兄妹在Claude 3釋出時強調了這一點。

在國內的大模型初創公司中,智譜AI或許是最早開始商業化的。它在產品和生態的布局上有幾分像OpenAI,而在落地的思路上又多了些Anthropic的影子。

距離2023年3月14日已經一年,智譜AI背後商業化生態的圖景已經展開。

逐漸成型的生態

Sora出現的時候,張鵬並不驚訝。在他看來,Sora只是OpenAI技術領先的又一次驗證,只不過他用一種更直觀的方式把這個差距具像化了。就像2022年末的ChatGPT一樣。

張鵬曾談到對智譜AI產生重要影響的時刻,其中的一個時刻是ChatGPT的釋出。

其實在ChatGPT之前,InstructGPT和WebGPT等技術我們一直有,也預感到基於GPT-3這樣一個優秀千億基座的智慧套用會迎來爆發。但ChatGPT的上線給我們一個明顯訊號:預訓練模型已經到了完全可使用且好用的階段,是產品化的很好範例。

OpenAI在基礎模型的效能層面不斷演進,以ChatGPT驚艷亮相在大眾視線之後,逐漸變成了一家非常緊湊的產品公司。而對標OpenAI的智譜AI,有意在產品化上跟住OpenAI的節奏。

圖源:智譜AI

從基礎模型GLM和API能力的開放,到對話模型ChatGLM和程式碼模型CodeGeeX,以及多模態方面從2021年開始布局的文生視訊模型CogVideo。以張鵬的話來說,智譜AI在產品線上與OpenAI做了「全線的對標」。但這種對標並不是不加思考地跟隨,而是在AGI的一致目標下有著相似的技術積累階段。

在OpenAI釋出GPTs的那場開發者大會上,CEO山姆·阿特曼公布了一組數據。圍繞著OpenAI豐富的產品能力,已經有大約200萬開發人員在其API上構建各種各樣的套用,超過92%的全球500強企業正在使用其產品,ChatGPT的周活躍使用者則達到大約1億。

而隨著GLM-4的釋出,智譜AI背後的多重生態也開始成型。

2024年初,智譜AI在首屆AI技術開放日DevDay上釋出了最新的基座大模型GLM-4。第一批體驗到GLM-4模型的人是大量熱忱的開發者,隨著GLM-4在效能上開始接近GPT-4,構建AI套用生態的那個爆發點看起來也呼之欲出。對標OpenAI的GPTs,智譜AI在DevDay上釋出了GLMs。

GLMs是智譜AI在基礎模型進入一個成熟階段後對於開發者生態的一次加碼。但在GLMs之前,智譜AI很早開始布局的開源路線到現在已經聚攏起一大批開發者。

在對於大模型的共識還沒有形成之前,開源是智譜AI介紹自己的方式。「為了讓大家知道智譜在做什麽。也是為了讓更多的人參與進大模型,用社群的方式、匯集大家的熱情一起來推動大模型發展。」張鵬說。

早在2022年8月,智譜AI就開源了1300億參數規模的雙語預訓練模型GLM-130B,並且收到了70余個國家1000余個研究機構的使用需求。今年3月與基座模型ChatGLM同步,智譜AI開源了單卡版模型ChatGLM-6B。截至今天,ChatGLM-6B到目前為止累計的全球下載量已經超過1300萬,在github上新數已經達到5萬,在量級上已經超過Meta的知名的LlaMA兩個版本的總和。

智譜AI也在去年獲得了HuggingFace全球最受歡迎開源機構排名的第五名,高於OpenAI和谷歌,也是唯一上榜的中國機構和組織。

隨著GLM-4的釋出,智譜AI同時發起了一項大模型開源基金。智譜AI將為大模型開源社群提供一千張卡,助力開源開發;提供1000萬元的現金用來支持與大模型相關的開源計畫;為優秀的開源開發者提供1000億免費API tokens。智譜AI CEO張鵬表示,大模型開源基金的目的在於推動大模型研發的大進展,促進大模型整個開源生態的大繁榮。

值得一提的是,在智譜AI眾多開源模型中,ChatGLM-6B 和 ChatGLM2-6B 權重對學術研究完全開放,並且在完成企業登記獲得授權後允許免費商業使用。智譜AI對學術生態的重視可見一斑。

豐富的產品生態,開源道路的努力,開始逐漸成為智譜AI通往商業化的橋梁。

從生態通往商業

去年3月,微軟宣布了Office365 Copilot,Adobe則在幾乎同時推出了AI工具Firefly。一切都預示著大模型的落地會成為生產力工具的一次再造。包括WPS在內主要產品月活裝置接近6億的金山來說,這是一場必須趕上的變革。

去年7月,金山辦公的WPS AI逐步開放全新AI功能測試體驗,背後智譜AI的GLM大模型支撐著WPS在Word、PPT等產品線的智慧化升級。

透過整合智譜AI的GLM大模型,WPS AI不僅能夠根據使用者的簡要輸入快速生成規範的文件內容,如紅表頭檔、會議紀要等,還能在政府辦公領域提供輔助寫作服務,支持多種公文體裁,極大地提升了文件處理的效率和專業性。

圖源:WPS

WPS AI在PPT演示文件的制作上也展現了其強大的功能,使用者只需提供主題,AI便能自動完成從大綱到內容的創作,甚至包括演講稿的撰寫,以及PPT的排版工作,極大地簡化了使用者的操作流程。這一創新舉措不僅節省了寶貴的時間,也使得使用者能夠更加專註於內容的創意和表達。

金山辦公透過開放平台API呼叫GLM大模型,並結合自身豐富的場景需求描述及樣版,構建了一套高效的測試集。智譜AI的GLM大模型在核心辦公場景中展現出卓越的效能,為金山辦公的產品線註入了新的活力。根據使用者反饋,WPS AI的使用者滿意度已超過95%。

不止工作流層面的變革,智譜AI的商業化生態已經開始積累出不同層次。

德勤中國,作為一家為本地及跨國企業提供綜合性服務的機構,面臨著將大量文件資料轉化為可操作資訊的挑戰。傳統的工作流程中,顧問們需要手動篩選關鍵數據,撰寫報告草稿,這一過程不僅耗時,而且對顧問的專業水平要求較高,容易出現遺漏和錯誤。

為了提高效率和準確性,德勤中國引入了基於智譜AI的GLM大模型的報告生成智慧助手。該助手透過雲私有部署的方式,允許使用者上傳多種格式的文件資料,然後智慧地進行文件解析、數據切分和資訊提取。在報告撰寫環節,智慧助手能夠根據預設的規範格式,自動生成報告草稿,顯著減少了人工撰寫的時間和勞動強度。

此外,智慧助手還整合了快捷轉譯功能,解決了報告撰寫過程中的語言障礙問題,提高了轉譯的效率和品質。這一改進不僅加快了報告的生成速度,也降低了轉譯和覆核的成本,同時提高了資訊的準確性和報告的專業度。從德勤中國的使用反饋來看,GLM大模型在中文環境下表現出了超出同類模型的能力,整體員工效率提升了10%左右。

而在C端,智譜AI幫助馬蜂窩打造了AI小螞套用,這個有著海量使用者和旅行內容數據的旅行社交平台,亟需這樣一位能為使用者提供出行資訊服務的「導遊」。

圖源:智譜AI

在大模型的加持下,AI小螞能夠理解使用者的個人化、多樣化的意圖,並提供精準的問題回答和個人化的內容服務。此外,它還能夠結合歷史對話資訊和指代資訊進行語意補全,使對話內容更具連續性。甚至從歷史對話中抽取關鍵資訊,如POI(興趣點)、天氣資訊等,建立使用者行程資訊庫,用於後續的對話回憶、問題引導和精準回答。

透過智譜AI的技術賦能,馬蜂窩的AI小螞套用不僅提高了使用者獲取旅行資訊的效率,還增強了平台的互動性和個人化服務能力。

在此之前,全球知名的旅行Booking.com在去年年中推出了AI對話功能AI Trip Planner,背後提供技術支持的是OpenAI的ChatGPT API。測試版AI Trip Planner從當地時間6月28日開始向美國Booking.com的Genius忠誠會員推出。最初只能在該OTA的App中存取,但該公司計劃將來將其擴充套件到PC端軟體中。

一條自己的道路

大模型在真實商業世界中的落地並不會是一場對舊世界完全的顛覆,更多是從AI小螞、AI Trip Planner這樣滲透式的變化開始。而對於智譜AI來說,要在國內作為一家「企業公司」站穩腳跟,需要找到一個與國際同行不同的商業化路徑。

「到目前為止,我們現在有三種方式來實作這樣一個商業化落地。」張鵬表示。

第一種是最輕量級的,也就是完全標準化的API調取。「我們把我們的模型封裝成開放平台,提供API的方式給我們的開發者、企業去進行呼叫,按照呼叫量進行付費,這種商業模式非常簡單、成熟,就看使用量。」

不過雖然生成式AI會推動國內SaaS市場的進一步成熟,但目前私有化方案仍然是最有效的商業模式。

第二種是當標準化的版本還不能滿足需求的時候,比如客戶需要獨立的數據保障,但同時又不希望自己去維護算力等基礎設施。智譜會提供基於雲端算力的雲端私有化的方案,利用我們自己雲端的算力幫使用者開辟專門的模型的專區,它在使用整個服務過程當中保持數據與其他客戶的相對隔離。

除此之外,中國還有著大量完全私有化的企業需求。國有企業或者是一些非常關註數據安全和保密的行業要求自己的數據、自己的系統不能出自己的物理邊境,「第三種方式就是針對這種情況,以完全私有化落地的方案進入到企業當中,在企業提供的硬體和算力基礎平台上,為大家提供大模型的基座能力,去開發相應的套用和業務的需求滿足。」

在2023年3月14日,這個大模型的重要時間節點一年之後,張鵬再次出現在外界面前。目前智譜AI已經與2000多家生態合作夥伴建立了合作關系,實作了1000多個大模型規模化套用,並與200多家企業進行了深度共創。

圖源:智譜AI

對於這一年內商業化上的進展,張鵬表示這歸功於智譜AI對自己邊界的認識。

「我們非常清楚我們的長項、優勢和目前為止還不太擅長的事情。所以我們的選擇是開放共贏。總有在行業當中摸爬滾打很多年的一些企業、夥伴,他們積累了對這個行業的知識,積累了豐富的實踐經驗,他們非常迫切地想要引入全新的AI能力,但他們苦於技術的發展非常快速,也沒有很好的消化時間和周期,不知道如何讓大模型的能力在行業當中進行落地。」

「反過來,我們對大模型的本質以及如何套用誘發它的能力是更清楚的。」張鵬表示。

值得一提的是,從今年1月智譜AI釋出GLMs以及「智慧體中心」市集,至今使用者已經貢獻了超過20萬個創新的智慧體套用。這20萬個智慧體的背後是效能強悍的GLM-4。隨著效能的提升,大模型開始從一個新奇的玩具,開始轉向去解決一些工作和生活中的「真問題」。

如果說2024年之前,關於大模型的思考仍然是極客式的,關於技術路線和極致的能力。進入2024年後,如何找到客戶、如何落地將是每一個大模型公司所面對的「真問題」。但這很大程度上並不是一個「如何找到客戶」的問題,而是關於「如何被客戶選中」。圍繞GLMs聚攏起來的開發者、迅速生長起來的客戶生態,就是一場直接的用腳投票。模型效能的高低,最終會成為大模型公司在商業化競爭中的勝負手。

這又回歸到了出身學界的智譜AI屢次提到的,樸素的發展道路——在基礎模型的效能上做到領先。

張鵬提到了團隊曾經訓練中的一個細節。在2021年左右對大模型的共識遠未像現在這樣廣泛被接受的時候,研發團隊曾經維持了很長一段時間24/7的強度。如果淩晨3點時候的訓練中有一張卡掉了,研發人員會是最先發現的,並且能夠在10分鐘內告知遠端的運維人員。這樣承受巨大壓力的高強度研發了近一年後,智譜AI拿出了GLM-130B。後者是2022年11月釋出的史丹佛大模型中心測評榜單中亞洲唯一入選的大模型。這個千億參數的稠密模型確立了智譜AI的位置,也第一次把智譜AI大範圍引到全球的客戶面前。

或許在大模型商業化這件事上,技術理想主義是最大的實用主義。