當前位置: 華文頭條 > 推薦

音影片AI神器「通義聽悟」重磅升級:超長影片自由問,還會做思維導圖

2024-03-19推薦

3月19日,阿裏大模型產品「通義聽悟」釋出多項新功能。音影片問答助手「小悟」上線,在業界首次實作單記錄、跨記錄、多語言自由問,支持對單個最長6小時、一次性上百條音影片的內容理解問答,使用者可對超長音影片隨心提問,讓AI 總結任意知識點。此外,針對學習科研場景對AI工具的強烈需求,通義聽悟推出「高校公益計劃」,向所有中國大陸高校師生直接贈送價值數千元的500小時音影片轉寫時長。

超長音影片自由提問,AI秒速總結知識點、潤色口語、做腦圖

音影片承載了密集的資訊內容,但因涉及多模態理解、自然語言處理、搜尋等多項復雜技術,長期以來內容尋找難、回顧難、提煉難。阿裏通義聽悟產品負責人楊帆介紹,通義聽悟為這一需求而生。「作為一款工作學習AI助手,通義聽悟希望讓高知識附加值的音影片被輕松閱讀、整理和分享。」

通義聽悟接入通義千問大模型,融合了十多項AI功能,包括轉寫、轉譯、角色分離、全文摘要、章節速覽、發言總結、PPT提取等,並支持標重點、記筆記,被許多使用者稱為「寶藏AI工具」。

楊帆介紹通義聽悟歷程

通義聽悟本次升級上新了六大功能點。最重磅的是音影片問答助手「小悟」,關鍵資訊直接「問」出來。小悟透過多語言Query處理、長篇章文本理解、指令演化框架最佳化及檢索增強生成演算法,在業內首次實作對超長音影片的單記錄、跨記錄、多語言自由問答,支持內容問答的音影片時長和檔數均突破業界上限。

使用者不僅可在單一記錄頁呼喚小悟,對最高6小時、6G大小的音影片提問任何相關話題,或直接小悟要求整理金句、梳理結論、寫會議紀要;更可在首頁針對使用者所有記錄提問,支持一次性掃描理解上百條音影片內容;也可花式對英文影片用中文提問,小悟將直接給出中文回答,省去轉譯。作為一個「懂你」的AI,小悟還會智能推薦問題。

隨時喚起「小悟」課代表

針對使用者需求,通義聽悟還上線了一鍵AI覆寫、思維導圖生成等新能力。例如,一鍵AI覆寫,將口語轉為書面表達,尤其適合整理采訪;思維導圖自動生成,最多支持五級xmind腦圖,適合播客摘要。

通義聽悟思維導圖範例

產品細節體驗也進一步升級,包括筆記支持一鍵插入影片時間戳及截圖、音影片檔語種自動辨識等。

教育福利上線,郵箱認證即可得500小時免費時長

學生和科研群體對AI新工具有普遍需求,但目前音影片AI轉寫工具普遍收費,或僅提供如每月1小時的少量免費時長。

通義聽悟推出「高校公益計劃」,推動AI算力普惠。所有中國大陸高校師生透過字尾edu.cn的教育郵箱進行認證後,均可直接獲贈500小時轉寫時長,儲存空間從20G拓展至200G。按目前市面上語音廠商9.9元每小時的折扣價,這一教育福利價值數千元。

通義聽悟能聽、能看、能讀,還能實作速覽加精聽,正成為學霸們的全新學習方式。楊帆介紹,調研中發現約一半使用者是學生,他們活躍度相當高,後台每天收到大量私信「求時長」。

有的同學上課、開組會「無時無刻不聽悟」;有的用通義聽悟兩倍速上網課備考;有的每天在「發現」欄目中閱讀數十檔播客節目,「獲取最前沿新鮮的觀點內容」。

成都一位管理學博士生蔡同學在社交媒體上寫道,「通義聽悟絕對是最強科研神器」,她向身邊幾乎所有親朋好友推薦了這款產品。通義聽悟釋出才9個月,她的使用時長已近7000小時,平均每天轉寫20小時以上,包括分析網絡影片進行學術研究,以及日常學習工作隨時使用,這款軟件已成為她沈澱知識和科研成果的重要平台。

作為國內首個開放公測的大模型產品,去年6月釋出以來,通義聽悟累計已有上百萬使用者,包括學生、老師、白領、記者、律師、金融分析師等群體,活躍使用者日均轉寫音影片3次以上,平台每天處理字元數約20億字。