當前位置: 華文頭條 > 推薦

MiniMax公布第一個AI高畫質視訊生成模型,閆俊傑:做技術其實是一件很「奢侈」的事|鈦媒體AGI

2024-09-02推薦

MiniMax公司創始人、CEO閆俊傑

繼Sora、Runway之後,國內又一款AI視訊生成模型來了!

鈦媒體App獲悉,8月31日舉行的首屆MiniMax Link夥伴日上,MiniMax創始人、CEO閆俊傑釋出MiniMax首款 AI 高畫質視訊生成模型技術:abab-video-1。

據悉,使用者目前可以在海螺 AI 官網免費體驗生成包含文字的視訊,最高支持原生1280*720的25fps,擁有電影感鏡頭移動,被稱為是AI視訊界Ideogram。目前AI視訊時長最高6秒,未來或支持10秒,整個視訊效果不亞於Sora、Runway等。

鈦媒體AGI做了相關測試。比如下面這段視訊,體現的是一座山上的一塊石頭破碎,從裏面蹦出一個「馬斯克」。

再比如下面生成對比Sora演示場景,一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市標識。她穿著黑色皮夾克、紅色長裙和黑色靴子,手拿黑色手提包。她戴著太陽鏡,塗著紅色口紅。她自信而隨意地走著。街道潮濕而反光,五顏六色的燈光營造出鏡面效果。許多行人走來走去。

雖然背景和顏色有所區別,但相比Sora,MiniMax AI 視訊生成的效果也非常真實和生動。

閆俊傑在演講中透露,截至目前,MiniMax每天可以給全球使用者提供超30億次互動,每天處理超3萬億Token(行業內最高)——等價於一天看完7000本書、或2000萬張圖片、或7萬小時的語音。同時,當前MiniMax單日總互動時長與ChatGPT的百分比為53%,差距在不斷減小。

會後,針對與大廠之間的競爭, 閆俊傑對鈦媒體App等表示,這本質上是一件好事,比如電動車、手機、行動網際網路都經過了長期激烈的競爭,最終使得中國產品需求特別強,它既可以產生很大的社會價值,而且確實應該有很多競爭,這是一個客觀規律。MiniMax需要做好亮點,第一點的話技術如何提升,第二是如何跟使用者做更好的共創。

「我們作為一家小的創業公司來說,其實就是說如果比如說我們在競爭中打不贏,我們就應該被淘汰,其實我們也沒有其他的選擇。」閆俊傑表示,現在公司規模還很小,還需要足夠長的時間發展,希望外界能夠給予更多耐心。

閆俊傑強調,技術研發其實是一件很「奢侈」的事情,這件事甚至只有創業的時候才會理解。因為技術可能會失敗,技術具有不可預測性,而且技術研發投入很大。然而,AGI本身很難走「捷徑」,而且一旦技術被突破之後,就能非常顯著感受到使用者、客戶對你的認可。因此,企業的正向發展依然需要持續技術投入和進步。

實際上,在閆俊傑看來,演算法一樣的情況下,擁有更多的數據訓練就意味著更好的模型效果。因此,在兩個效能類似的模型中,更快的模型一定是更容易受益到數據的增長,從而能夠有一個更好的模型能力。這就是在同樣的能力範圍下, 「快就是好」。

閆俊傑在與鈦媒體App等對話中進一步解釋稱, 不管是做MoE還是其他有價值的技術探索,本質上,公司技術研發還是希望讓同樣的效果模型變得更快。快就是好,意味著同樣的算力可以變得更好,這個是其做底層研發的思路。

未來,如何讓企業持續發展是公司的重要核心之一。閆俊傑指出,行業需要持續解決AI模型三個挑戰: 錯誤率持續降低、無限長輸和輸出、多模態。

閆俊傑認為,MiniMax產品並非僅技術新品,它的底層設計也不是陪伴使用者聊天。實際上,MiniMax希望構建的是一個「內容社群」,裏面可以補充一些角色。

「包括現在我們提供了更多樣的工具中可以在裏面建立故事、創作世界觀,來進行互動,它其實類似於小說、帳戶體驗,它的核心其實是一個內容社群,而不是說它的核心是說每個人來聊天,這是不一樣的。」閆俊傑對鈦媒體App表示。

談及最新視訊生成的技術優勢和落地, 閆俊傑坦言,相比可靈,MiniMax視訊技術推出的確實要晚一、兩個月,核心在於團隊在解決「如何能夠原生演算法訓練成本比較高的東西「這個技術問題,因為視訊Token越長,復雜度越高,而MiniMax希望透過研發新的演算法把復雜度降低,壓縮率變高,將最終演算法效果提升數倍。

「今天只是我們第一個版本,我們應該還會更新,策略是可能會先在每一兩周出現新的東西、更加滿意狀態後,再考慮一些商業化,包括開放平台、廣告變現等方式。但目前這個階段,最重要的可能還不是產業化,而是真正實作對技術能夠達到廣泛可用的程度。」閆俊傑表示,後續會在數據、演算法本身進行更新叠代,比如現在只提供了文生視訊,未來或將提供圖生視訊、文+圖生成視訊、可編輯、可控性增強等。

關於To B領域,閆俊傑在演講中透露,截至目前,MiniMax開放平台已經擁有超過3萬名開發者,且仍在持續、快速增⻓。

談及大模型「價格」競爭, 閆俊傑指出,當國內大模型「價格戰」發生後,大部份公司本認為大模型很貴,之後很多人認為大模型很便宜,可以放心地使用。最終非常驚人地發現,有許多傳統企業非常願意使用大模型,他們覺得反正成本低,出錯了之後也不要緊,多呼叫一次就好了。客觀地來說,這極大提高了模型呼叫量,從而推動模型做的更好,至少目前在非英語語種上,國內大模型水平已與GPT不相上下。因此,樂觀角度看,國內大模型的使用量確實在顯著地增長,並且中國 AI 大模型在海外確實越來越具有競爭力。

「競爭不可避免,既然不能避免,就要努力做到最好。」閆俊傑稱。「在同等計算GPU條件下,盡可能訓練更多的輪次、更大數據,做一些科研上的比較有挑戰的事,做別人沒有做過的事情。經過幾次科研的突破,其實能以比較有限的資源,做出一個在國際上第一梯隊多模態的表現,這個我們目前還是比較驕傲的。」

閆俊傑強調,「(行業)真正需要的是,一家至少像我們這樣的創業公司,真正應該花錢做的研發,是那種能夠帶來幾倍變化的技術。這種東西很多時候如果我們自己不做,外面也沒有,使用者需求多、技術還非常重要,我認為這才是比較核心的。不管是現在,還是再往後看,我們在什麽樣的技術方向上最願意花錢,核心的判斷是,我們認為這個方向做出來能不能帶來幾倍的變化,如果能的話,不管多難都要做出來。如果不滿足這個標準,不管多簡單我們都不應該做。」

關於國內外 AI 商業化的異同話題, MiniMax國際業務總經理盛靜遠對鈦媒體App表示,不同行業有其底層規律,To B行業需要有規模的商業化。在國內,To B 業務多成計畫制,大模型純技術輸出客製的商業模式難以持續實作ROI,因此需要思考把偏工具類AI產品形成有使用者黏性並且增強技術能力與產品特色。海外市場則有所不同,MiniMax產品能力處於國際第一梯隊,所以只需將其產品不斷打磨,透過API、訂閱等模式在海外使用者付費習慣好的情況下進行推廣,海外市場打法相對直接,變現也更快。而MiniMax現在技術已處於領先,更多是公司經歷、資源和變現問題。

「ROI是會有轉起來的一天,但不是今天的商業形態。」盛靜遠稱,MiniMax還是希望在有限的資源內,做到核心技術不斷突破,從而讓產品最終實作商業化,來反哺後續技術投入——這才是公司發展成功、實作正向迴圈的標誌。

談及與大公司(投資方)在市場競爭中的關系, 閆俊傑指出,投資者是一個組織,一個組織意味著大部份時候沒有一個統一的觀點。目前,MiniMax還是一家很小規模的公司,相比大互聯網公司非常成熟的業務來說,占比都是非常小的,甚至可以說不值一提。

閆俊傑強調,對於MiniMax來說,核心還是把自身技術能力做到更好。

「MiniMax作為一家有理想主義且腳踏實地的公司,今天的核心產品和技術進展還是遠遠不夠的,我們仍然在努⼒前⾏。但我們很幸運的是,有在座的合作夥伴以及全球各地⽇益增⻓的⽤戶們的支持,未來和MiniMax⼀起攜⼿努⼒,把⼈類的智慧邊界再向外推動⼀點,真正實作 Intelligence with Everyone(與每個人共創智慧)。」閆俊傑在演講結尾表示。

(本文先發於鈦媒體App,作者|林誌佳,編輯|胡潤峰)