當前位置: 華文頭條 > 推薦

「AI復活」,安慰還是生意?

2024-03-22推薦

來源|定焦(dingjiaoone)

作者 | 蘇琦

編輯 | 金玙璠

有人靠技術,有人靠套路。

「起死回生」這件事,過去只在科幻電影裏見過,但今年,被「復活」的案例越來越多。

2月底,知名音樂人包曉柏用AI「復活」女兒,女兒在媽媽生日時還為她唱了一首生日歌;3月初,商湯年會上,剛去世不久的商湯科技創始人湯曉鷗以數位人的形式被「復活」,還來了一場「湯式風格」的演講;近日,還有有網友用AI技術「復活」李玟、喬任梁等已逝明星,備受爭議。

和逝去的親人「再見面」,這門此前隱秘小眾的生意,開始頻繁地出現在大眾眼前。但因為用到的技術不同,價格不同,效果也不同。

花10元,能讓去世親人的照片「眨眼」,背後是簡單的影像處理技術;花千元,能和沒來及道別就離開的親人視訊通話,用到的是AI換臉變聲技術;花萬元,則可以和電子螢幕裏親人的複制數位人聊天,數位人能說會動有表情,真實感更強。

「AI復活」是一門有強烈需求的生意,醞釀著億級市場,盯上這塊蛋糕的商家卻魚龍混雜。有的下載軟體就能制作「會說話的照片」進行售賣;有的本身是數位人服務商,在向B端售賣直播、會展、主持人等數位人之外,開發面向C端的數位人客製APP;還有一批商家,看準了使用者復活親人、複制明星的需求,用自研+接入第三方技術介面的方式,為使用者提供客製化服務。

「AI復活」或許在將來會成為一個像拍照一樣常見的服務,但其中也存在數據私密、法律倫理等問題。有業內人士表示,AI換臉變聲技術的成熟,還會讓一些人借著使用者對親人的想念和信任實施詐騙,「回憶雖好,謹防被‘割’」,他提醒道。

「復活」親人,需要多少錢?

目前市面上的「AI復活」產品,根據成本高低、技術難易,可以分為三個等級,也對應著使用者在AI「復活」某人之後,與親人「再次相見」的三種方式。

其中 最低一檔是照片驅動,俗稱talking photo (能動的照片),前幾年就有類似的APP火過一陣。

利用深度學習、影像處理等技術,就能讓照片裏人物的嘴巴和眼睛動起來;如果讓照片裏的人開口說話或唱歌,則要用到對口型(唇語匹配)和語音生成。「這些技術都已經成熟且開源,量產之後,單次成本可以壓縮到10元以內。」有10年AI創業經驗的極鏈科技創始人&總裁董慧智介紹。

第二檔是 表情捕捉驅動的偽直播,給真人模特換上逝者的形象和聲音, 進行語音電話或視訊電話等互動,或生成祝福短視訊等。

這裏面用到了語音複制、AI換臉、動捕(表情捕捉)、深度偽造(deepfake)等技術來變人變聲。董慧智稱,這是一種特別討巧的方式,技術不新鮮,部份AI詐騙用到的是類似的技術。動捕器材及人力成本稍高一些,需要數千元。

這類「AI復活」的視訊片段在短視訊平台播放量很高,一般是小輩為家裏的老人下訂單,找人用逝者的臉和聲音與老人通話,對老人謊稱逝者在外工作,將「善意的謊言」繼續,老人一般也看不出異樣,只是頻頻抹淚。

圖|孫先生用AI換臉「復活」父親

第三檔是近期比較火的用數位人技術「復活」親人, 因為交付的產品不一樣,成本也有所不同。

一般來說,透過收集人物生前的照片、聲音等數據來複制數位人的形象和聲音,然後底層搭載大語言模型模擬逝者的思想,可與之進行即時的文字或語音交流。

51數位人有這項業務,創始人陳鴻告訴「定焦」,一般產品交付的是一個帶有數位人的螢幕,大屏有電視那麽大,小屏可以是iPad那麽大。使用者登入帳號之後,就能看到逝去親人的數位人形象,使用者可以透過語音或文字與數位人互動,產品還可以提供語音電話叫醒服務。

「客製類的‘復活親人’業務,一般要5萬元以上。」陳鴻稱,因為客戶都是長期付費,後續還會不斷在細節上調優,也有一些客戶是一個家族湊錢一起做,要求更高。

「AI復活」對於數據品質的要求非常高,被複制者生前的照片、視訊或語音樣本越多、越清晰,數位人的相似度就越高。再輸入一些個人特征數據,比興趣愛好,才能模擬其性格。 「素材不夠全,成本還會再增加。」 陳鴻表示。

因此, 精度越高、數據越客製化,效果也就越接近真人,價格也更貴。 所謂的精度,主要體現在以下幾個方面:人物口型準確度、分辨率解析度、動作復雜程度、服飾發型和表情豐富度、語音(音色、語氣)相似度、是否有電音、是否有抑揚頓挫(多情感)、是否帶互動、互動是否更貼合本人性格等。

放到數位人領域,需要完美複制某個人的技術難度可謂「上不封頂」。商湯科技「復活」的創始人湯曉鷗,就是一個案例。

「數位人」湯曉鷗在年會上的演講 圖源 | 視訊截圖

商湯科技數位空間事業群數位文娛事業部總經理欒青告訴「定焦」,為了還原湯老師的音容笑貌,用到了不同技術。整個制作過程中,商湯運用了自研的TTS語音生成大模型,截取了湯老師四、五段不同說話風格的聲音作為prompt(提示),總聲音素材不過十幾秒,還原了湯老師的東北口音、音色、常用的語氣詞和語調以及冷幽默的風格。

此外,商湯如影數位人技術團隊采用了湯老師之前清晰有效的視訊,用商湯自研的視訊生成技術進行動作生成和場景過渡,還原走動、喝水等動作,以及微笑的表情。

受限於素材不多,以及算力、成本的考量,目前很多數位人的視訊和產品看起來還是很「假」。「這些都不算是完整地‘復活’數位人, 技術和服務的最高交付上限,也無法滿足人們的最低需求下限」 ,陳鴻稱。

形象不夠像,就得用情緒價值來補,在數位人的設計上加入一些互動細節。他舉例,比如一個客戶的爺爺最喜歡老四,聊天時爺爺突然會說下個月是老四的生日了,家人要多聚、兄弟要和睦,客戶就會一下子被打動。

總得來說,前兩檔用到的都是相對簡單的影像處理、換臉和聲音複制技術,能看到人臉、模仿聲音,但因為成本低,效果粗糙,市面上看到的還原度比較高且能動起來、能對話的都屬於第三檔數位人,越像越貴。

誰在靠複制人賺錢?

從過往「復活親人」的案例可以看到,大部份不像真人且讓人出戲甚至尷尬。而隨著生成式AI技術的發展,欒青觀察到,「AI復活」在技術上的可行性和真實度上都變得更高,能讓人投入、想哭,使得這類需求被進一步激發出來。

由此,一條產業鏈應運而生。在這條產業鏈上,一部份是跟風商家,一部份是數位人服務商,一部份是AI從業者,還有一部份是專門做客製AI復活(復活或複制親人、明星、企業家等)的玩家。

電商平台上, 有不少店鋪提供「AI復活」服務,讓照片說話的標價多為10元、50元。 短視訊平台上,也有不少人以「AI造夢」「AI療愈」的名義提供類似服務。「收費便宜、效果粗糙,但這是一個長期存在的長尾市場。」董慧智稱。

圖|淘寶上售賣的「讓照片說話」服務

這類生意也存在灰色空間,有短視訊博主釋出「復活」李玟、張國榮、喬任梁等已逝名人的視訊,讓他們開口唱歌和說話,雖然稱「旨在致敬和紀念,無商業目的」,但此類視訊獲得的流量頗高,還有部份會借此引流做「親人復活」生意。同時,一些提供「AI復活」服務的店鋪也註明「只做懷念,人臉辨識請繞道」。

目前,技術成熟的數位人服務商和AI從業者, 更多是將商業模式放在B端,比如AI客服、數位人直播、AI老師、A主持人、AI醫療等, 有部份推出了面向C端的類似工具,但並未大規模宣傳。

有網友曾用大模型初創公司MiniMax的語音大模型,將一段90秒的音訊素材進行語音複制,並用MiniMax旗下的海螺問問APP生成智慧體,與之進行語音對話。矽基智慧也有「生命複制和數位永生」業務,其旗下的炎帝大模型基於使用者提供的數據複制出數位人,使用者則可以透過DUIX APP與數位人即時互動。

圖|矽基智慧DUIX APP客製數位生命

陳鴻和團隊主要做的是高精度客製市場, 平均一單5萬元起,圍繞大客戶開發場景, 比如數位墓地,去墓地緬懷先人時,先人從電子屏裏走出來跟大家聊天;比如紀念館智慧工程,包括建築空間搭建等;比如名人「復活」,用初期古畫「復活」了朱熹等。

圖|51數位人制作的朱熹

「提供客製服務的公司,不僅考驗底層技術能力, 更考驗的是渠道深度以及服務的落地程度, 這決定了能否讓使用者真正把數位人用起來。」陳鴻認為。

從技術提供方的角度來看,欒青認為,商湯如影的定位就是透過數位人技術賦能各個行業,誰更了解行業,誰更能下場服務好使用者,誰有更深度的解決方案,誰就能吃到更多蛋糕,「復活親人不是一個純粹從技術角度就可以做的生意。」

「AI復活這門生意更適合中型團隊去做」,董慧智分析,大公司的營運和研發成本很高,同樣一套技術,他們會優先去做標準化、批次化、適用更多場景的B端生意。陳鴻也表示,大廠不願意做,小團隊沒有實力做,這個市場年收入500萬到1億,是中型團隊的機會」。

目前看來, 「AI復活」看似門檻不高,但真正做好還要面對很多難題。

當前,「AI復活」還存在技術受限、素材儲備缺乏、家中有人反對等局限,普及仍有難度。

大部份數位人需要攻克的技術難點是,能否做到人機難辨。 欒青提到,數位人在說話、動作、場景銜接等方面已經向前進了一步,但在較長時間的互動過程當中,仍然未能達到真正的人機難辨,在情感傳達、理解力、意識等方面還有待完善。

而真的想讓一個人「復活」,細節體現在方方面面。陳鴻以一個互動場景舉例說,在與數位人爺爺對話時,如果使用者問到了數位人資料庫裏沒有的資訊,比如「誰是尼采」,數位人就會跳轉到大模型,根據公開的答案回答,雖然可以持續進行多輪對話,但就會很假,使用者的沈浸感就會被打斷。

「AI復活」,仍需敬畏

「AI復活」的需求旺盛,但不是所有人都持支持態度,背後隱藏的私密安全和倫理問題也不可忽視。

支持派認可的是其提供的情緒價值, 認為「復活」親人,是對生者的慰藉和對遺憾的滿足,是技術向善的例子。

質疑派則認為人永遠不可能「復活」,也無法進行「授權」。即便「AI復活」得到了親屬的授權和認可,但逝者本人的意願無從得知。

「數位永生沒有那麽容易,即使使用大模型, 最終復刻出來的只是一個長著相同面孔的GPT, 當他以相似的記憶和遠勝於本人能力和智商跟你對話時,你的感受一定會好嗎?」董慧智反問。

3月16日,針對兒子肖像被短視訊創作者侵權使用一事,喬任梁父親表示不能接受,感到不舒適,希望對方盡快下架,「他們未征求我們同意,是我侄女刷到視訊發給我的,這是在揭傷疤。」

如果複制數位人出現問題,對生者可能將帶來二次傷害。太多影視劇作品探討過其中的倫理困境和人性幽微。

2013年播出的【黑鏡】,其中一集講的便是女主「復活」了在車禍中去世的丈夫,雖然復制了丈夫的記憶和軀體,卻無法復制情感和選擇,這位AI丈夫無需睡覺、不會受傷,只會呆板地按照命令列事。女主意識到「你不是你,你只是漣漪」,最終將機器人鎖在閣樓上,卻怨恨自己離不開這虛假的真實。

【黑鏡】截圖 圖源 |豆瓣使用者Hiro

隨著「AI復活」產業鏈的成熟,「復活親人」「複制明星」的需求和案例增多,其中涉及的私密數據泄露、AI詐騙等諸多法律風險,也受到關註。

現實生活中, 透過AI換臉實施詐騙的案例時有發生。 今年315晚會就曝光了多起利用AI技術換臉變聲成親人,實施詐騙的案例。此外,假冒名人也是騙局中的重災區。今年3月,劉德華經紀公司映藝娛樂透過微博釋出聲明,稱劉德華聲音被複制偽造,提醒各方人士警惕騙局。

復刻親人時,為了更高的還原度,使用者只能對技術提供方保有更大的開放度,這就決定了使用者很難保護自己,一旦遇到騙子,很難界定到底是服務還是詐騙。

對此,陳鴻建議,想要「AI復活親人」的使用者,在下單前應該簽署合約,規定數位人的各項權利屬於個人,以及提供的個人資訊不被泄露。

「AI的發展是超速的,而安全問題不管是從法律層面、文化層面、公民意識層面還是技術層面的,都處於滯後狀態。」董慧智稱, 最終產業的發展還是要靠從業者自律和監管條例的規範。

欒青稱,行業的規範和安全是業務發展的大前提。在中國信通院牽頭下,商湯聯合多家AI公司共同制定了「可信數位人」的標準。

不可懷疑的是,人和AI的關系會在今後變得更加緊密和多元,「AI復活」這件事,以後有可能會成為一個標準服務,就跟打印一張照片一樣簡單。

隨著技術進步,「AI復活」的概念還在繼續升級,比起一段視訊、一個聊天機器人產品,有人提出了數位永生、數位陪伴、隨身親人等概念,「有富翁在自己還活著的時候,就開始著手復制自己,搭建自己的這種數位永生庫」,董慧智稱。

2015年,俄羅斯億萬富翁德米泰瑞·伊茨科夫發出倡議,宣稱到2045年將為所有人打造一副機器人身體來實作永生,這項計劃面臨一定爭議。2022年,伊隆·馬斯克在推特上提到已經將自己的大腦上傳到雲端,並與自己的虛擬版本交談過,但有人認為這是馬斯克在宣傳自己的腦機介面公司Neuralink。

隨著「AI復活」褪去神秘感,行業或許也會開始進入價格內卷的時代,如果不想出現「劣幣驅逐良幣」的情況,行業還需保持敬畏之心。(編輯|楊倩)