“通義聽悟”上新 阿里雲想破圈
“肯定是有這個big dream的”,在回答通義千問有沒有破圈想法時,阿里雲相關人士向北京商報記者直言,“敬請期待”。3月19日,阿里大模型產品“通義聽悟”上線多項新功能,包括音視頻問答助手“小悟”、支持一鍵AI改寫等。從阿里內部使用到全網發佈,通義聽悟相比通義家族的其他應用,上線更早,也更高調。目前,通義聽悟暫無toC收費的計劃,未來通義聽悟會嵌入通義千問App。對於這一系列計劃,坊間見仁見智,有人說阿里擅長toB,這符合整個集團的風格,有人說這是技術能力不足的體現。不論原因,破圈都是大模型應用PK的關鍵。
不對用戶收費
關鍵信息直接“問”出來,一鍵將口語轉爲書面表達……3月19日,通義聽悟上線了6種新功能。以音視頻問答助手“小悟”爲例,通過多語言Query處理、長篇章文本理解、指令演化框架優化及檢索增強生成算法,可實現對超長音視頻的單記錄、跨記錄、多語言自由問答,支持內容問答的音視頻時長和文件數均突破業界上限。
北京商報記者登錄通義聽悟網站發現,首頁右上方已出現“小悟”的動態圖標,用戶點擊該圖標即可與“小悟”互動,當記者提出概括當日錄音的要求,“小悟”將錄音進行了總結,並附上了引用的錄音名稱以及引用的時間點。
整體上看,通義聽悟則保持了原有的產品設置,首頁突出三個功能:開啓實時記錄、上傳音視頻、播客鏈接轉寫。這和2023年6月通義聽悟啓動公測時的定位一致,“瞄準具有高知識附加值的音視頻內容場景,比如開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等”,阿里雲CTO周婧雲當時介紹。
上線以來,toC(用戶)不收費的特點也被保留下來。對此,通義聽悟產品負責人楊帆分享了這樣一個故事,“商業模式的問題,每天用戶都在跟我反饋,有的用戶甚至問‘我能不能付費’,看到這些反饋我內心很感動。不過目前我們沒有任何對C端收費的計劃,C端的應用承載的使命,更多是向所有用戶展現阿里技術的研究方向。通過API(應用程序編程接口)的方式在B(企業)端實現商業化,是我們的產品策略”。
第三方觀察者對toC不收費有着自己的看法。“如果一款應用的技術水平較免費的產品或競品沒有質的提升,就不足以向用戶收費,只能向B端收費。因爲B端有打包捆綁銷售、長期合作等模式。有市場地位就能強買強賣,這實際上是技術能力不足的情況下的一種銷售方式”,文淵智庫創始人王超告訴北京商報記者。
集成到“通義千問”App
一般來說,語音轉寫類產品採用會員制的付費模式。如用戶使用通義聽悟,可以通過登錄、分享等方式獲取轉寫時長。
3月19日,面對細分用戶的計劃浮出水面。當日通義聽悟正式推出“高校公益計劃”,所有中國內地高校師生通過後綴edu.cn的教育郵箱進行認證後,均可直接獲贈500小時轉寫時長,存儲空間從20G拓展至200G。
根據通義聽悟用戶分享的案例,用戶大多通過PC使用通義聽悟。官網信息顯示,通義聽悟支持Chrome、Edge瀏覽器插件、釘釘、微信小程序。
在回答會否上線App版本時,通義聽悟工程研發負責人邢君告訴北京商報記者,“聽悟App是我們想做的,當前也有這個計劃,第一期會在通義千問的App裡面集成聽悟的功能,很快會看到”。
通過一個時間軸可以更好地瞭解通義家族的發展歷程。2023年4月,阿里雲上線大模型產品通義千問,並邀請用戶內測。6月聚焦音視頻內容的通義聽悟上線,7月AI繪畫創作大模型通義萬相開啓定向邀測。
基於通義千問和通義萬相,通義家族目前的8個行業模型包括:智能編碼助手通義靈碼、AI閱讀助手通義智文、工作學習AI助手通義聽悟、個性化角色創作平臺通義星塵、智能投研助手通義點金、智能客服通義曉蜜、個人專屬健康助手通義仁心、AI法律顧問通義法睿。2023年9月,通義千問通過備案正式向公衆開放,次月通義千問蘋果版App上線。
有破圈夢想
2023年ChatGPT大火時上線,又經歷了百模大戰,在PK大模型應用的當下,通義家族以及通義千問有無破圈的責任?阿里雲智能公衆與客戶溝通部總監朱迅垚向北京商報記者表示,“通義千問肯定是有這個big dream的。在視覺領域、開源大模型領域,通義千問已經有比較破圈的事件。聽悟是我們非常重要的拳頭產品,破圈最好,但主要還是服務好專業人羣和學生人羣”。
回到通義聽悟,楊帆向北京商報記者透露了最新數據,目前通義聽悟用戶註冊數約500萬,活躍用戶日均轉寫音視頻3次以上,平臺每天處理字符數約20億字。對於通義聽悟團隊而言,“我們內部更關心真實用戶的使用”,楊帆解釋,“目前大部分AI產品還是工具型,聽悟是典型的低頻剛需產品,不可能像微信一樣,是每天用戶使用頻率非常高的App,我們更關注它的使用量”。
集成到通義千問,用通義千問來破圈,這在王超看來,“獨立了就要獨立賺錢,吃大鍋飯更適合當下的阿里雲。阿里雲目前還是國內第一大雲計算廠商,它的某個產品集成通義千問後,如果toB價格不變,那企業的感知是成本攤薄了。但在阿里雲內部結算時,通義家族是有收入的”。
在和北京商報記者交流時,深度科技研究院院長張孝榮表示,“阿里雲大模型應用既toC又toB,我認爲它更適合toB”。
北京商報記者 魏蔚