對話獵豹移動傅盛:大模型不是通往AGI的唯一路徑

8月21日,2024世界機器人大會期間,作爲獵豹移動董事長兼CEO、獵戶星空董事長,傅盛就AGI(通用人工智能)、具身智能、大模型機器人等話題進行了演講。

傅盛表示,自己在AI 1.0時代便看到了機器人將從傳統的工業場景走到服務業場景,乃至千家萬戶的機會,因此於七年前投資創辦了獵戶星空。

而在進階程度更高的AI 2.0時代,他用“人類科技史上的奇蹟年”來形容人工智能的這波崛起,認爲可與牛頓的“萬有引力”或是愛因斯坦“相對論”的出現相提並論。在他看來,大語言模型帶來的端到端創新範式的影響,對全行業、全社會都會產生巨大改變。

受益於ChatGPT在語義理解方面實現的能力突破,機器人也迎來更多發展機會,因爲“語言實際上是人類真正獨立於其它物種的核心智能”。

“智能涌現”的整個過程可謂“神奇”。用AI教母李飛飛的話來說,“大模型是個灰盒”。伴隨着各種不確定性,OpenAI率先走出一條與衆不同的道路,且實現了創新。

但傅盛指出,大語言模型並不一定是通往AGI的唯一道路。他贊同Meta首席科學家楊立昆的觀點:大語言模型的天然結構使得它很難實現AGI。

其中有兩方面考量因素,一是更小參數的大模型是否同樣可以實現智能;另一方面,不是所有工作都需要AGI這樣的“愛因斯坦”,整個社會是一個金字塔形的多元結構,基層需要更多平民化的大模型出現。

當前,OpenAI、蘋果、微軟等科技巨頭都在以實際行動驗證“小模型”趨勢,這可能讓大模型直接成爲端的一部分,而不只是在雲上。

今年1月,獵戶星空也曾發佈小參數模型Orion-14B。除了考慮大參數模型的成本昂貴之外,這家公司認爲,機器人一定要在端上跑自己的模型,纔可能既解決數據隱私問題,又做到實時快速響應。

傅盛表示,端模一體帶來的產品和科技變革的意義將更大,會直接引發交互革命和生產力革命,而大模型機器人是獵戶星空所押注的賽道。目前,該公司將其分爲勞動協作機器人、接待營銷機器人和遞送配貨機器人三類。

就大模型私有化部署而言,傅盛稱自己不僅要負責產品,也對銷售投入了大量精力。他發現,ToB(企業端)的銷售本身就是一個產品化過程。

在他看來,這項業務的收入表現不會是一條很陡峭的曲線,甚至過去幾年經歷過近乎水平的進程。但由於大模型的介入,明年產業規模可能會有明顯變化。

演講結束後,傅盛接受了界面新聞等媒體採訪,對AGI實現路徑、小模型趨勢、端模一體、雙足機器人的未來等熱門話題,給出了自己的看法。

以下爲採訪實錄,略作編輯:

問:你說大語言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構不行?

傅盛:對於Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說,現在大語言模型遇到了瓶頸,標誌性事件就是GPT-5發不出來。OpenAI作爲一家科技創業公司,18個月沒有發自己的旗艦產品,而是忙着做Search GPT,或者GPT-4o,說明要麼是卡着上不去,要麼是訓練出的效果不太好,沒有質的提升。

硅谷都在盯着GPT-5到底何時出來,出來後是不是有大的提升。如果沒有提升,可能會有點類似出現互聯網泡沫的感覺。

我也不知道到底是Scaling law不行,還是Transformer架構不行。做大語言模型就是一個嘗試的過程。OpenAI有技術信仰,他們堅信這事,靠一個ChatGPT活過來了。但今天到底爲什麼這樣,以後它的Scaling law能走到什麼地方,沒有原理去證明。此外,新的數據從哪裡來也是個問題。

問:從GPT-4o mini和Apple intelligence來看,小模型可能是趨勢。你認爲端模一體最考驗企業的是什麼?這個能力現在中美有明顯差距嗎?

傅盛:小模型已經不斷被驗證了。技術發展到這一步,一個幾十億參數的模型能力已經不錯了,蘋果做的所有工作都是在它的小模型上。現在看起來端上的需求是很大的,無論是手機、電腦,未來一定是這樣的邏輯。

中美應該沒有太大差距。訓練小模型對算力要求低,需要結合真正的應用場景,這方面中國有自己的優勢,迭代快。包括私有化大模型出海,如果不是美國的大公司在做,那些創業公司和中國的效率還是有差距的。

問:1月份時,你曾說過超越OpenAI的機會一定來自大模型的應用。大半年過去了,現在看到哪些應用的機會?

傅盛:那個時候,對於是否做好一個特別牛的模型就能解決所有問題,大家有很多爭議。今天看起來答案非常明顯,即做好一個模型也不能解決大多數問題。學界也在討論,大語言模型到底能不能實現AGI?去年大家都信心滿滿,現在很多人覺得不太可能,它只是一個更好用的工具而已。

我們可能真的不會遇到一種“萬能”技術,所有的技術最後都要跟不同的場景結合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡單的就是燒柴火,而不是建一個熱力站,不同場景中大家的需求不一樣。

今天可見之處都是應用的機會,只是有些可能不屬於創業者。比如蘋果發佈了iOS 18,股價最高上漲10%。你把手機改造一下可能有機會,但只要手機廠商自己幹,你就沒機會。

機器人也是一個很大的應用。雖然我對雙足機器人商業化不看好,但對機器人這個行業的發展充滿了信心。

大語言模型出來之前,讓機器人拿杯子是個世界級難題,當時大家都是絕望的,認爲不可能做成。但今天有了大語言模型,它自己具備了規劃、判斷和模糊的體驗,能讓機器人成爲很重要的產品載體。

問:爲什麼不看好雙足機器人商業化?

傅盛:技術過於複雜。雙足機器人必須依賴於機械結構,但結構不是摩爾定律支撐的,每年能改一點點就不錯了。就像汽車剎車系統、底盤,一百年過去了,改了多少?

雙足機器人進展比較慢,今天是電機問題,明天也是,最多電機大一點。爲了雙足犧牲了太多,包括產品的能耗和穩定性。雙足機器人要解決摔倒的問題,而人的穩定性相當高。

再者是成本,用幾個電機和輪子相比,它成本一定高,還要保證在99%以上的場景不能出錯。

作爲一個研究方向是可以的,但說現在雙足機器人要大行其道,我不看好。每個人的夢想都值得鼓勵,但還得看能不能真正量產,以及量產以後市場的接受程度。

問:雙足機器人做科研的這幾年,主要是解決哪些問題?

傅盛:結構的靈活性問題以及算法問題。膝蓋是非常複雜的,有各種肌肉、小關節,還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機器人是鋼鐵的東西,沒有這些,只能靠算法。由於端到端,算法的確進步很大,像波士頓動力以前所有的積累可能都廢了,但難度還是挺大的。

問:如果三五年之後,它們真的能落到產線上,會改變你的看法嗎?

傅盛:不會,因爲你能落在產業上,我一個輪子的結構也能落,而且永遠比你便宜100倍以上。今天你花20萬買輛汽車,一下能開出去100公里。有一天來了一匹機械馬,需要100多萬,你買車還是買馬?車就是這麼打敗馬的。

機器人用輪子很有優勢,等到有一天產品真正穩定的時候,其實幹活是用上半肢。

問:有一些雙足或者人形機器人的研報,會說現在處在人形機器人的“前夜”,你是否認同這樣的觀點?

傅盛:去年(特斯拉)“擎天柱”出來的時候,很多投資人都很受震動。當時特斯拉放話,再過一兩年,能達到幾萬臺或者10萬臺的規模。當時我說不可能,今天話就放在這。

之前特斯拉說明年會有1000臺“擎天柱”進入工廠,但我認爲它們做不到很好地工作。以特斯拉的實力,放1000臺去測試是可以的。

一些企業講人形機器人產線搬運,這完全是作秀,搬運爲什麼不用叉車?用加機械臂的叉車不行嗎?一個輪子能拉100公斤,人形機器人搬運兩公斤就不禁摔,更別說造價多少。

現在離“前夜”很遠很遠。2017年,我的團隊就拿機器人點蠟燭,好多機械臂廠商也說要改變行業,後來發現這個行業真的很難改變,因爲機械結構是一點點磨出來的。不能因爲埃隆·馬斯克做了這個事就覺得一定行。人都有驕傲的時候,他也不例外,沒有神嘛。

問:大模型機器人是怎樣一個概念?

傅盛:有點“具身智能”的概念。大模型通過語言的學習構建了對這個世界的基本邏輯和認知。大語言模型可以做出規劃,反饋給人,這比以前(做機器人)的技術難度要低很多,要知道以前所有的移動都得寫控制代碼,寫起來很費勁。

大模型是實現具身智能的推動力,是一個基礎條件。在沒有大模型之前,(機器)理解世界是不可想象的。

問:這個概念爲什麼這兩年才火起來,它和之前的那些智能化的機器人傳感器等有什麼不同?

傅盛:之前的很多智能化可以理解成一種程序化的過程,比如先幫你預設好,看了一個什麼東西去點一下,這已經算很高級了。最早的都不需要交互,自動化完全匹配,這是第一階段。

第二階段有一定判別的技能,我們叫做“規則”。規則很難容納太多的東西,比如突然出現一杯水,但(代碼)沒寫就傻了。有了大語言模型,它可以理解世界,知道這是水,只要有足夠多的數據,就不用再寫規則代碼,而是通過各種方式去獲得更多的數據進行訓練。這也是爲什麼“具身智能”一下火起來了。

問:獵戶星空服務機器人在海外市場主要的應用場景是哪些?中國的機器人產品出海要進一步克服哪些困難?

傅盛:目前獵戶星空機器人主要還是遞送類,在餐廳送餐、回盤,也有一些交互類的,去做講解、引導等工作。

海外需求相對旺盛,因爲發達國家勞動力比較貴,而且稀缺。要進一步打開市場,就得用大模型把它智能化。

我們在海外遇到了一些問題,也在慢慢克服。早期部署成本很高,不僅機器人過去,也要讓商家會用。我們未來的目標是實現“開箱即用”,機器人做到這個並不容易,它得認識環境。以前需要人去給它建圖,現在有了大語言模型,這件事的難度會大幅度降低,甚至可以實現自動化。

另一個問題是交互能力。我們在海外一直沒有做交互,因爲每個國家語言不同,還得做定製,非常複雜。而大語言模型天然就是翻譯機,像獵戶星空大模型(Orion-14B)的日語能力在開源模型裡是比較好的,因爲我們認真訓練了一下日語。最神奇的是,你都不用管它,只要把日語輸出給它,它自然就會了,而且會翻譯。這放以前也是一種顛覆,是它的天然能力。機器人未來要把智能化再提高,拓展它的應用場景。

我雖然不看好人形機器人,但覺得機械臂去做一些動作是可以的。我們下半年會有機械臂方面的產品推出,因爲它在某些場景下能夠實現一定的任務。

問:SaaS在中國差不多被驗證是失敗的,獵豹現在做私有化大模型,會不會也會面臨企業付費意願低的問題?畢竟現在AI應用還沒有產生多少收入,包括國外也是。

傅盛:是的。我們現在在和頭部的企業合作,一期已經在交付,二期正在做,我們認爲是有可能標準化的。

中國的市場我可能改變不了,但只要做好,讓企業都能滿意,我們就把它標準化,下一步再出海去做。出海本就是我們的基因,很多海外客戶也願意接受(私有化大模型)。海外市場足夠大,願意付費。經過中國市場驗證的產品模式,現在到全球都是有競爭力的。

問:你覺得窗口期大概有多久?

傅盛:最多就到年底,一步一步來,我用更長的時間來看這件事情時,思路就會不太一樣,現在就是盯效果,真要說多拿幾單進來也不是不能。

問:在獵戶星空這邊,你的精力主要放在產品這塊嗎?

傅盛:現在是,銷售上我也得花精力。我後來意識到,ToB和ToC最大的不同,就是ToB銷售本身就是一個產品化的過程。

比如說私有化大模型跟做ToC不一樣,做ToC我自己覺得這個產品不錯,不需要ToB。但是ToB必須要了解客戶,這對我們以前做ToC的團隊來講是個挑戰,這兩年慢慢積累了一些經驗,學了不少。

問:這種業務收入規模的提升,大概是一條什麼樣的曲線?有所謂爆發節點嗎?

傅盛:ToB的肯定不會那麼快,前幾年其實還在水平線上,今年開始產品化,能再做好一些。大語言模型是讓整個機器人場景發生了很大的拓展。我今天展示的講解、直播機器人,以前是很難實現的,現在能做到接近於人的水平,明年它的增長可能會比較大。