2024雲棲大會集聚硬科技 AI產品迭出、應用場景萌發

9月19日,2024雲棲大會在杭州開幕,這是彙集AI硬科技最多的一屆雲棲大會,也展示了AI從科技前沿到提升生產效率、打造美好生活的應用前景。雲棲大會最早可追溯至2009年,目前成爲體現中國計算產業的萌發與革新的重要展會之一。

今年的大會以“雲啓智躍,產業蝶變”爲主題,吸引大模型、自動駕駛、機器人等領域的400多家國內外企業來到現場。圍繞通用人工智能(AGI)、自動駕駛、人形機器人這三個決定性場景,AI爲產業和生活帶來的巨大想象空間徐徐展開。

21世紀經濟報道記者觀察發現,不少機器人、製造業企業參展商是第一次參展,這意味着今年以來,AI與智能製造及延伸領域、具身智能場景領域結合得更加緊密,而生成式AI和雲計算成本下降也帶動了應用創新門檻的降低,但大規模商業化應用仍未鋪開。

大模型推理成本指數級下降

阿里巴巴集團CEO、阿里雲智能集團董事長兼CEO吳泳銘在主題演講中表示,過去22個月,AI發展的速度超過任何歷史時期,但現在依然還處於AGI變革的早期階段。大模型技術快速迭代,技術可用性大幅提升。同時,模型推理成本指數級下降,已經遠遠超過摩爾定律。

例如,大模型已經具備了文本、語音、視覺的多模態能力,能夠開始完成複雜指令。

多模態大模型在各應用場景加速落地。在視覺方面,AI技術生成視頻已經是多家企業落地的產品。此外,分子動力模擬、3D/4D模型生成、智能編碼等也在改變人們的工作和生活方式。

阿里控股達摩院基礎智能中心商務負責人薛騰飛在接受21世紀經濟報道記者採訪時表示,達摩院開發的一站式AI視頻創作平臺尋光視頻在今年7月的上海世界人工智能大會正式亮相,主要提供視頻製作輔助工具,可以實現劇本創作、分鏡圖設計、視頻素材編輯等需求,目前已開放內測。

不過,AI生成視頻在物理世界模擬方面仍需要繼續提升。“生成4秒、8秒視頻和10秒以上視頻的難度不同,視頻時長越長,保證畫面物理狀態準確度的技術難度越高。”薛騰飛說。

生數科技展示了Vidu視頻大模型,支持文字和圖片輸入,可以生成4秒和8秒時長的視頻。21世紀經濟報道記者體驗發現,輸入“杭州西湖跳水”這一個短句後,4秒的視頻畫面很快就自動生成,內容爲西湖邊3位正在跳水的人,人像是遠景,不過面部並不清晰,有一個瞬間人像變爲水花再變回人像,出現了與物理世界錯位的圖像。

生數科技相關負責人告訴21世紀經濟報道記者,AI生成視頻有時會出現畫面和物理世界狀態不符的問題,這也是產品後續需要持續克服的問題。企業已研發出長視頻的生成工具,已有影視行業等B端合作用戶,用於影視分鏡製作等用途。

另一個多模態大模型的特色案例是阿里通義實驗室Mobile-Agent,Mobile-Agent項目開發人員告訴21世紀經濟報道記者,Mobile-Agent基於最強多模態大模型GPT-4V實現,首先接收用戶的指令,然後根據當前屏幕截圖、操作歷史和系統提示生成下一步操作。例如,可以在指令中輸入“在‘小紅書’中搜索一篇上海美食指南”,Agent可以迅速調動感知工具,調動相應app進行相應操作。

月之暗面Kimi創始人楊植麟在大會主論壇上表示,AI產品在形態上也會發生一些變化,現在AI的產品形態類似於即時聊天的這種產品形態,以後AI產品可能不僅是這種形態,還有可能是思考或者去調用各種工具,然後執行分鐘級別、小時級別甚至每天級別的任務。

“所以AI產品形態上它可能會更接近一個人的生活助理的概念,新的想象空間是蠻大的。”楊植麟說。

模型推理成本指數級下降,是當前大模型應用百花齊放的基礎。吳泳銘表示,一年來,通義千問API在阿里雲百鍊上的調用價格下降了97%,百萬Tokens調用花費最低已經降到了5毛錢。

今年5月,AI大模型打響了價格戰,BAT、科大訊飛、字節等多家企業集體降價,百萬Tokens低至1元,開啓了大模型“釐時代”。進入7月後,大模型價格戰仍然在繼續。這意味着,對企業和開發者而言,大模型像基礎設施一樣,相關成本降低後,服務創新應用也會持續增長。

自動駕駛、機器人迎來鉅變

前沿應用,是AI最終改變人們生產和生活的落地之處。21世紀經濟報道記者在本屆大會上觀察到,大模型正在扎進越來越多的垂直場景,逐步實現商業化落地。

吳泳銘表示,生成式AI讓世界有了一個統一的語言——Token。它可以是任何文字、代碼、圖像、視頻、聲音,或者是人類千百年來的思考。AI模型可以通過對物理世界數據的Token化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具,繪畫、作曲、寫作、表達、教學、編程的技巧,甚至是開公司創業。理解之後,AI就可以模仿人類去執行物理世界的任務,這將帶來新的產業革命。

以汽車行業爲例,“端到端”的大模型技術訓練將感知、決策、執行三個功能模塊整合在一起,傳感器端收集信息,直接到另一個端,執行端立刻執行。本屆大會上,“自動駕駛”是最熱門的話題之一。

在“生成式AI重塑自動駕駛”主題討論中,小鵬汽車董事長、CEO何小鵬表示,有了大模型的加持,自動駕駛試驗車轉向、切線,甚至比人們自己開車還要流暢。目前,只是自動駕駛競爭的初級階段,未來,一定會有更多的突破出現。

英偉達全球副總裁、汽車事業部負責人吳新宙則表示,有了大模型,智能駕駛沒有上限。

21世紀經濟報道記者觀察到,特斯拉的展位上實時播放“端到端”的視頻介紹,今年1月,特斯拉FSD升級到了基於“端到端”的V12版本,今年3月,特斯拉FSDV12版本正式在北美推送。

不過,“端到端”自動駕駛將功能模塊神經網絡化,背後需要巨大的算力支撐和成本支出。目前,特斯拉FSD累計學習的人類駕駛視頻片段超過2000萬個,僅採集成本就需要50億元至80億元。截至2024年Q2季度,特斯拉自建超算中心AI算力已經超過4萬張英偉達H100等效算力。

在吳泳銘看來,機器人將是下一個迎來鉅變的行業。未來,所有能移動的物體都會變成智能機器人。它可以是工廠裡的機械臂、工地裡的起重機、倉庫裡的搬運工、救火現場的消防員,包括家庭裡的寵物狗、保姆、助理。

人形機器人同樣是AI應用的重要領域。杭州聰寶科技有限公司總裁顧高生在接受21世紀經濟報道記者採訪時表示,企業參與了復旦大學工程與應用技術研究院智能機器人研究院研發的“光華一號”人形機器人,該產品目標定位爲老年人的“保健醫生”,將中醫藥診療的大模型與機器人結合起來,可以提供中醫調養按摩、中醫諮詢、情感陪護等。

“以往機器人採用固定的機械臂,按照固定程序進行機械動作,但現在智能機器人有很多傳感器、雷達、攝像頭,可以進行圖像識別和更多智能化的動作。大模型也大大提升了機器人的決策能力,未來機器人會變得更加聰明。”顧高生說。

目前,機器人的大模型成本已經明顯下降,但傳感器等零部件成本依然比較高。

不少機器人企業告訴21世紀經濟報道記者,人形機器人的競爭目前還在產品性能,AI和機器人硬件的成本都不低,雖然目前大模型的成本在下降,但人形機器人企業需要投入自身的研發成本進行強化學習、模仿學習等,目前還未有清晰的商業化應用場景。

不過,一些機器人企業已經找到細分的落地方向,逐步實現量產,杭州宇樹科技有限公司是其中的代表。目前,企業的兩款人形機器人Unitree G1、H1和兩款四足機器狗已實現量產。H1是全球首款實現原地後空翻的電驅人形機器人,已在汽車工廠成功部署,可進行搬運等工作。