階躍星辰押注智能終端Agent
作者 | 劉寶丹
編輯 | 黃昱
DeepSeek憑一己之力帶火中國AI資產的同時,也加重了國內AI創業公司們的危機感。作爲“AI六小強”之一的階躍星辰一貫低調,如今也開始秀肌肉了。
近日,階躍星辰創始人、CEO 姜大昕在首屆Step UP生態開放日上表示,公司朝着實現AGI的目標穩步前進,目前已進入Agent(智能體)的發展階段。公司宣佈,將智能終端Agent視爲大模型技術落地的核心突破點,並重點佈局汽車、手機、具身智能、IoT等關鍵應用場景。
“可能每個人都希望有一個Jarvis,這一願望在不久的將來就能實現了,我們判斷未來每一臺終端設備都會有一個Agent,這個Agent會用多模態的方式和我們交互,幫助我們完成複雜任務。”姜大昕在會上表達了對Agent前景的樂觀期待。
從月之暗面的“長文本”到DeepSeek掀起的算力革命,AI大模型每一次關鍵技術迭代都意味着行業的巨大進步,這也是AI獨角獸證明自己價值的方式。如今,階躍星辰直接把重點放在了Agent落地應用上。
可以說,這既是檢驗階躍星辰模型能力的關鍵指標,也是衡量階躍星辰商業化落地潛力的重要參照。
階躍星辰於2023年4月在上海市成立,由微軟前全球副總裁姜大昕創辦,公司研發人員佔比80%以上。去年底,階躍星辰完成B輪融資,總融資金額達數億美元,核心投資方包括上海國有資本投資有限公司及其旗下基金、騰訊投資等。
根據Open AI公開的AGI發展藍圖,通用人工智能的實現劃分爲五個遞進階段,分別是對話式AI、推理者、智能體、創新者、組織者。根據該節奏,階躍星辰進行到了第三個階段,也就是智能體。
在姜大昕看來,Agent最重要的特點是能夠自主地幫助人類完成複雜任務,一方面,Agent執行任務的時候儘可能自動完成,減少或無需人類干預;另一方面,Agent能根據用戶context主動發起任務而不僅是被動接受任務。
目前,階躍星辰正與合作伙伴共同開發多樣化的智能終端Agent,推動大模型技術在場景中的深度應用與創新。
會上,階躍星辰宣佈與吉利汽車集團、千里科技深化技術合作,共同推動“AI+車”的深度融合。姜大昕表示,汽車是終端Agent最關鍵的落地場景。憑藉在基礎大模型領域全面的技術積累,公司期待與吉利、千里等合作伙伴加速推動汽車智能化的創新。
手機終端方面,階躍星辰與手機廠商深度共建,將 Agent 技術深度集成到手機中,共同打造更好的交互體驗,比如,基於階躍Step系列多模態模型,OPPO 打造了“一鍵問屏”和“一鍵全能搜”兩大創新性AI 手機功能。
階躍星辰宣佈與智元機器人戰略合作,共同探索 AI+具身機器人應用場景。面向IoT 終端,階躍星辰通過生態開放的方式,與包括TCL在內的一系列IoT平臺和設備廠商合力推動設備間的智能化升級和體驗的無縫連接。
此外,階躍星辰還與金融財經、內容創作、新零售、數字人等產業的合作伙伴達成了深度合作,共同打造垂直場景下的創新C端應用體驗,挖掘消費場景。
可以說,階躍星辰用了不到兩年時間,就具備了推動Agent落地的能力,而這主要得益於公司過往深厚的技術積累。
姜大昕指出,智能體的發展依賴於兩大關鍵要素:一是多模態能力,讓智能體充分地感知和理解世界;二是推理能力,使智能體能夠進行長思維鏈的慢思考,主動規劃、嘗試、反思,通過不斷糾錯提供準確的答案。
截至目前,階躍 Step 系列模型矩陣已經發布了 11 款多模態大模型,覆蓋語音識別、語音生成、多模態理解、圖像及視頻生成的全面能力。今年1月,階躍星辰發佈了 Step R-mini,成爲Step系列的首款推理模型,進一步拓展了大模型的能力邊界。
階躍還積極打造開源生態,與全球開源社區的開發者們共享技術成果。近期,階躍星辰聯合吉利汽車開源了視頻生成模型Step-Video-T2V,以及行業內首款產品級開源語音交互大模型Step-Audio。目前,兩款開源模型均可在躍問 App 上體驗。
進入Agent階段只是一個開始,根據姜大昕推演,智能終端Agent的發展會經歷以下5個階段:
Level 1是能夠完成簡單任務,往往一個app就能完成的任務,例如打開支付寶,在螞蟻森林裡收集一下能量;Level 2是能夠完成組合任務,可能需要跨越多個app。
Level 3是完成複雜任務,需要深度思考;Level 4在執行任務時,從被動完成任務變成可以主動提示或者完成任務;Level 5從智商上升到了情商,智能終端Agent能真正做到感同身受,從而提供情緒價值和情感陪伴。
然而,要想實現Level 5,階躍星辰還需要持續進行技術突破,尤其是底座大模型多模態能力和推理能力持續增強,並在全球衆多AI創業公司中持續提升技術競爭力。
AI大模型是一場幾十年難得一見的機遇,也是一場資本豪賭,階躍星辰要想在這場全球競賽中佔有一席之地,還需要持續證明自己。