智譜AI狂奔!視頻通話功能“首秀”,國產大模型解鎖新能力|聚焦服貿會

本報(chinatimes.net.cn)記者石飛月 北京報道

“你知道什麼是互餘角嗎?”“不知道。”“互餘角是指兩個角的和爲90度。”9月13日,記者來到2024年中國國際服務貿易交易會(下稱“服貿會”)現場,在智譜AI展區看到一個孩子與智譜清言(智譜AI旗下大模型)進行視頻通話的這一幕。

作爲國內“大模型五虎” 之一,智譜AI今年動作頻頻,7月其AI生成視頻模型清影(Ying)正式上線,近日又推出升級版基座大模型GLM-4-Plus,類GPT-4o的視頻通話功能面向所有用戶全面放開。

如此快節奏地行進,與智譜AI的強融資能力相輔相成。近日,該公司以“投前200億元估值”完成新一輪融資,成爲大模型創業潮中估值最高的企業之一。而在不久前,也就是今年6月和7月,智譜AI也曾被曝出融資傳聞。

首次開放視頻通話功能

今年參加服貿會的人工智能企業不多,而智譜AI又帶着最新的產品和功能出現,自然受到不少關注。智譜AI展示了多款最新產品,包括旗下智譜清言App近期推出的“視頻通話”功能、清影AI生成視頻功能,以及大模型開放平臺bigmodel.cn等。

智譜AI的 “視頻通話”功能,是國內大模型首次開放視頻通話功能,也是全球首個面向大衆用戶開放的視頻通話功能,限時免費。

智譜清言視頻通話功能跨越文本、音頻和視頻三大模態,具備實時推理能力。用戶可以打開攝像頭,通過視頻通話窗口與其交流,智譜清言不僅能“看”到用戶畫面,還能聽懂指令並準確執行,即使用戶頻繁打斷,智譜清言也能迅速反應。

記者在現場看到,在智譜AI的演示視頻中,一個小孩打開智譜清言視頻通話後,將攝像頭對準自己正在做的數學題,大模型便開始講解這道題,中間小孩多次提問,該產品也能應答。

除了滿足解題需要,據官方介紹,智譜清言視頻通話功能還能即時翻譯中英文,根據用戶所處的環境信息進行英語對話,並且協助糾正用戶的語音和語法錯誤;成爲旅遊時隨時講解景點故事的導遊;爲視障人士提供識別環境的幫助;提供面試指導、會議中完成紀要和總結、分析複雜的數據圖表、實時解讀電腦屏幕的代碼。

“智譜清言視頻通話可實現的功能與GPT-4o差不多,但GPT-4o這個能力是閉源的,沒有開源任何代碼,我們是除OpenAI外頭一個研發出來這個功能的廠商,走的是國產、自研、可控的路。”在現場,一位智譜AI的工作人員告訴《華夏時報》記者。

目前,智譜清言視頻通話可以實現的場景和可以解決的問題,並不算特別難和深入。這位工作人員表示,如果要解決比較複雜和深入的問題,還需要一定的週期。

深度科技研究院院長張孝榮對《華夏時報》記者表示,大模型視頻通話在教育、遠程協助、娛樂等多個領域都有潛在的應用價值。“當然,該技術的識別準確度和知識深廣度有待進一步提升,能否在商業化落地方面取得成功,還要看實際應用效果。”

國內其他AI公司暫時還未推出類似功能,不過在上個月,字節跳動旗下雲服務平臺火山引擎宣佈,豆包大模型已支持實時語音通話功能。

服貿會期間,智譜AI還展示了視頻生成模型CogVideoX以及在智譜清言App上線的“清影”功能。

獲新一輪融資估值達200億元

在幾家大模型獨角獸中,智譜AI可以算是動作最頻繁、技術上新最快的一家企業,這一方面與該公司自己的研發能力有關,另一方面,也得益於其強大的融資能力。

近日,據中關村科學城公司發佈的消息,該公司以投前200億元的估值,領投智譜華章新一輪融資,用於支持智譜華章國產基座大模型的技術創新與生態發展。

今年以來,智譜AI已經公佈或被曝出多次融資消息。3月,智譜AI方面向記者確認,該公司於今年年初完成新一輪融資,北京市人工智能產業投資基金參與融資;6月,該公司被曝獲4億美元融資,投資方爲中東石油巨頭沙特阿美旗下風險投資部門管理的基金Prosperity7;7月,華策影視發佈公告稱,全資子公司華策投資擬以自有資金出資1億元,與海南智橋私募基金管理合夥企業(有限合夥)共同設立鹽城智華創業投資基金合夥企業(有限合夥),鹽城智華將直接或間接投資於智譜AI股權。

頻繁的融資,也讓智譜AI估值屢創新高。目前,在國內這一波大模型獨角獸中,智譜AI和月之暗面的估值是最高的,百川智能也蓄勢待發。8月,月之暗面被曝完成了超3億美元的新一輪融資,這輪融資將這家公司的估值推到了33億美元的高位。此外,百川智能方面曾在7月向記者透露,該公司已經完成了A輪融資,總融資金額達50億元,並且將以200億元估值開啓B輪融資。

“這是一個正向反饋的過程。”在文淵智庫創始人王超看來,智譜AI在中國這幾家獨角獸裡面做的是比較好的,用更多的錢買更多的芯片,僱更多的人,拿更多的數據,做出更好的AI產品,用戶的體驗感也會提升,如果融資不到位,在硬件上就不佔優勢,更不可能在數據和人力上佔優勢。

當然,無論是融資還是技術的更新,最終還是要實現商業化落地。《華夏時報》記者就今年的商業化落地情況採訪了智譜AI方面,截至發稿未收到回覆。

今年3月,智譜AI曾公佈一份ChatGLM發佈一週年之際的商業化成績單:收穫超2000家生態合作伙伴,實現超1000個大模型規模化應用,與超200家企業進行深度共創,多個領域的頭部公司,涵蓋了傳媒、諮詢、消費、金融、新能源、互聯網、智能辦公等多個細分場景,均已成爲智譜AI的代表客戶。

而智譜AI上線的文生視頻模型,或將應用於影視行業。今年7月,華策影視曾發公告稱,該公司與智譜AI簽約戰略合作,聯合開發影視內容生成智能體以及影視內容審查垂直模型,聯合打造國內影視領域AI領軍研究平臺,共同推動雙方聯合推出的文生視頻標準成爲行業應用的標準。

值得一提的是,除了智譜AI,在服貿會現場,記者看到,參會的人工智能公司並不多,還有一家是科大訊飛,而科大訊飛今年的側重點在教育領域。來自其它行業的企業,倒是或多或少沾上了人工智能的概念。

人工智能落地的另一個場景—具身智能,也在今年的服貿會上有所體現,北京具身智能機器人創新中心、優必選、宇樹科技等企業也帶着旗下的機器人來到了這次展會。

北京具身智能機器人創新中心的工作人員現場爲記者演示了“天工1.0 LITE”,這款人形機器人舉着右手向人羣打招呼,可原地轉圈,也可繞大圈走路,還會擺動手臂跳舞。“天工1.0 LITE” 是全國首個通用機器人母平臺,實現了全球首例純電驅全尺寸人形機器人的擬人奔跑。

責任編輯:黃興利 主編:寒豐