傅盛:短期,我不看好雙足機器人的商業化
今天有兩個超級端:一個是Phone,一個是PC。下一個超級端是汽車,下下一個就是機器人。
7月27日,由《中國企業家》雜誌社主辦的2024(第二十四屆)中國企業未來之星年會在上海舉行,本屆年會的主題是“向新求質,生成未來”。獵豹移動董事長兼CEO、獵戶星空董事長傅盛現身【洞見:AIGC特別分享】環節,並發表主題爲《端模合一:大模型賦能機器人的創新實踐》的演講。
以下爲演講的核心要點:
1.如果再過幾十年回頭看這一波AI浪潮,可能和現在看牛頓和愛因斯坦一樣。
2.現在創業就關注兩件事:第一,真正追求快速閉環;第二,做一些穿越週期的事。
3.今天在企業用大模型的時候,它回答得都很對,但沒有什麼用,都是常識性的回答,很難和私有的知識連接起來。如果真的要企業應用,私有數據是關鍵。
4.大模型和雲最大的不同,雲更像倉庫,是不拆包的,只要租用我的倉庫,我不關心你存了什麼。大模型不一樣,存的數據它都要看一遍,才能寫報告和整理,這些數據都經過它了。所以企業就應該有自己的私有化大模型。
5.今天人形機器人很火,但是我對雙足機器人在商業化上的成功不是很看好,作爲科研是可以,如果落地到產線上工作,沒有三五年就不可能。
6.爲什麼做機器人還要做大模型?大模型就是機器人的大腦,你做機器人,自己不做大腦去買別人的大腦,你的競爭力就有限了,體驗也不會好。我們就是要做端模一體化,根據場景應用找一款好的模型,做自己的大模型機器人。
以下爲傅盛演講實錄(有刪改):
要做穿越週期的事
我從2010年開始創業,創立了獵豹移動,經歷了三個時段:第一個時段,把金山毒霸這款工業時代的軟件變成了互聯網時代的軟件,現在還有營收,同一期的其他軟件都沒有了; 第二個時段,我們開始去做全球出海的業務,全球6億月活用戶,4億來自海外,Musical.ly也是我們投的天使投資,後來賣給了字節跳動,也就是現在大家熟知的TikTok;第三個時段,2016年,我們看到了AI,並提出All in AI,當時我們認爲AI可以快速改變人類。
但有時候技術不是一直高歌猛進,有高潮期,也有低谷期,現在終於等來了ChatGPT。我們當時就認爲AI是底層的技術變革,要做機器人就要以AI爲核心,做好端模一體,才能把一款產品真正做出革命性的體驗。我們的Slogan是在AGI時代成爲全球領先的新質生產力工具提供商。
很多人問我賣掉Musical.ly會不會後悔,沒什麼後悔的,因爲我們沒有這個基因,字節就是做得好。如果我們自己做,肯定不如今天TikTok做得好。況且我們也收穫了很高的投資回報。每個人、每個團隊都有自己的能力圈,做工具就是因爲我們的基因,能把工具做好就非常了不起了。
如果再過幾十年回頭看這一波AI浪潮,可能和現在看牛頓和愛因斯坦一樣。前段時間我去拜訪羅振宇,聊現在如何創業,我們一起探討就兩件事:第一,真正追求快速閉環,我是個擺攤的,哪怕出現很大的變化,也有自己的小循環;第二,做一些穿越週期的事,就像愛因斯坦1905年的四篇論文,“相對論”奠定了現在的信息技術基礎。
ChatGPT不是技術的勝利,而是技術信仰的勝利
2022年底ChatGPT的出現,改變了人類社會的方方面面。最近,阿里巴巴的王堅說AI也會改變科研,爲什麼這次AI和2016年那一波不一樣呢?因爲那時候看到AI很激動,覺得計算機可以識圖、認人臉,就覺得它可以做一切。今天知道識別並不是人類獨有的技能,語言纔是人獨有的技能,尤其是邏輯推理的語言。今天看起來能夠突破語義理解,是人工智能的重大突破。
OpenAI之所以牛,是因爲它改變了學習路線,之前的大部分路線是讓計算機學規則,但是OpenAI相信只要給它足夠多的語言數據,OpenAI就會像小孩一樣突然有一天開口說話。在此之前,大家都沒有那麼相信,所以其實在GPT3.0出現之前,OpenAI在硅谷都不被看好。所以,ChatGPT不是技術的勝利,而是技術信仰的勝利。
因爲人工智能就像大樹下的根基都是一點點長出來的,一直長到Transformer,OpenAI相信只要做好下一次預測就能產生智能。這條路線非常艱難,艱難在於並不知道它的核心原理,但必須堅信,不斷地試。它最難的是每次試都要花幾千萬美元,再去試,試完之後再調整。這也解釋了,今天的“百模大戰”不是技術的難度,而是技術信仰的難度,真的敢於相信、敢於投錢,才能真的把“ChatGPT”做出來。
今天有很多文章說它產生意識,說它替代人類,都不用相信,ChatGPT就是預測下一個詞的計算器,不斷預測下一次概念的時候就產生了智能。爲什麼能出現這樣的智能,它的原理還屬於黑盒,就是沒有數學公式推導能證明會出現這樣的智能。我們這個行業有一個俗語,每次訓練大模型就像煉丹,開始煉的時候不知道效果怎麼樣,一定要最後結果出來才持續。
爲什麼OpenAI很厲害呢?2016年我們開始做語音識別、視覺識別的時候,隨着數據量的增加,以前系統的智能水平很快就上來了,但是它只能上到一定的水平,這次給了大量的數據,它一直不怎麼樣,突然某一個時刻,水平一下子就起來了,到了原來系統到不了的智能化水平。
正是因爲技術信仰,今天我們也認爲OpenAI的道路也未必是唯一正確的。因爲技術有意思就在於它會不斷地分支,不斷產生新的可能性,當OpenAI在大參數模型上一騎絕塵的時候,越來越多的小參數模型開源社區開始出現。今天也有一幫人沒有那麼有錢,技術沒有那麼強,能不能做一個平民化的模型,只要解決專門的問題就行了,今天開源陣營就是在做這件事,用更便宜的算力成本、更小的參數量在某一個領域實現更好的效果,我們都堅定走在開源陣營的道路上。
模型還是應用?
去年我和朱嘯虎有一次“吵架”,做AI到底是應用重要還是模型重要?當時由於大模型出來,太震驚了,很多人都說大模型會佔據99%的產業鏈價值,但當時我就說應用是核心。今年世界人工智能大會(WIAC),幾乎每個大佬都在談應用,大家終於意識到給一個聊天窗口,給一個用戶,就可以解決他生活中的所有問題,這件事情不可能,只有結合實際的需求,足夠多的應用,才能讓大模型爲更多用戶所用。
前兩天蘋果發佈會演示iOS 18後,股價漲了近10%,漲出了一個茅臺和騰訊,這是蘋果歷史上第一次沒有發佈任何的硬件產品,而是發佈一個概念,就是因爲把Siri的概念重新升級,它就變成了你的助理,它用GPT技術做了交互。未來Siri就是我們和手機最重要的交互窗口,蘋果的展示裡就有Siri說:明天你媽媽要來機場了,記得去接她。這是主動提供助理的方式,以前是很難想象的。
雖然以前我們有很多智能系統,但每個智能系統都要做開發、做適配,所以它並不能實現邊際成本趨近於零,這次是可以實現的。
推薦大家用一下秘塔搜索,搜一下就是一份報告,把需要一個晚上時間整理的報告變成了2分鐘,搜索一定是重要的革命。這兩天ChatGPT推出了自己的Search GPT,搜索就是一個強應用。
還有就是微軟的Copilot PC,它沒有用英特爾的芯片,而是高通的芯片,高通的芯片是有45TOPS的NPU(神經處理單元),它可以獨立處理AI的各種運算,有可能你對電腦說今天晚上把哪些文章搜一遍,整理出哪些東西,它就幫你搞定了。以前計算機也是一個生產力工具,但必須人伴隨它,以後就是把計算機一放,它就把該做的做了。
大模型落地要和企業深度打磨
現在看起來AI非常熱,但好的案例幾乎沒有,除了大模型公司自己講,真正在客戶端,沒有落實好的案例。而且今天很多人都在說,我們都在期待一個好的to C應用,好像都沒有出現。
尤其是我們在做企業應用,在做機器人,它有三大阻礙:第一,我們的訓練數據來自互聯網,但互聯網實際上是人類知識系統冰山顯露出的一部分,書本是批量教育的產物,真正好的知識是深入的詢問。很多知識來自日常的探討,來自會議,來自各種討論,但是今天大模型得不到這些數據。所以,造成的問題是今天在企業用大模型的時候,它回答得都很對,但沒有什麼用,都是常識性的回答,很難和私有的知識連接起來。如果真的要企業應用,私有數據是關鍵。
這次蘋果發佈iOS 18那麼成功,因爲它把手機裡的各種數據打通了,郵件等等都讓大模型處理。其實都不是大參數模型,它是在端上處理的2.7億參數的模型,但數據打通之後,爆發出來的能量驚人。所以我們提供的解決方案是一定要結合企業的私有知識。
第二,數據的安全性。大模型和雲最大的不同,雲更像倉庫,是不拆包的,只要租用我的倉庫,我不關心你存了什麼。大模型不一樣,存的數據它都要看一遍,才能寫報告和整理,這些數據都經過它了。
即便美國OpenAI這樣的公司都經常被爆出竊取私有數據等問題,所以企業就應該有自己的私有化大模型。個人以後要用好大模型,也應該有自己的大模型。蘋果iOS 18就是個人端的Copilot。
第三,生成式的模型,大模型的幻覺和一本正經的胡說八道,它不可避免,但它不知道自己不知道。人說錯話,馬上就知道,但大語言模型不是,它一本正經地講林黛玉拿繡花針打虎的故事,它沒有反思能力。今天我們發現和大模型打通以後,客服需要95%以上的能力,但大模型只能做到70%,這是大模型目前落地時天然的缺陷。
今天業界提出了Agent的方式,通過一套規則或者自我反思、規劃等等,和大語言模型在一起,去完成對一個具體場景的落地。很多大模型公司覺得“找人用一下”就可以把大模型做好,不是的,我們應該基於客戶的訴求,做深度評估,才能做落地部署。我認爲真正要把標杆,把很多東西抽象出來,形成標準化。
ChatGPT到今天發佈纔不到兩年,產業鏈上還有很多不成熟,它沒有很好的供應商,很多苦活只能自己幹。就跟特斯拉做第一輛車,整個電路都要自己幹一遍,才能做自己的產品,大模型處於很早的時代,真的要做企業案例就要和企業深度打磨。
如何做好機器人,通過私有化部署的方案,不需要特別強的模型,但是做好Agent應用,再加上私有知識庫在很多場景可以做到95%左右準確率,滿足客戶的需求。
我們提出一個企業應用大模型有三個段位:青銅段位是企業發動大家結合公有數據應用;黃金段位是把私有數據做好,做出數字員工;真正的王者是企業如何運營,大模型可以給出判斷。美國就有這樣的公司,專門通過大模型分析,給企業提供決策經營建議。
今天大家都問應用什麼時候會崛起?至少要到明年,會在C端看到一些應用開始出現,比如高通的那款芯片一出來,很多大廠都會在CPU上加上一個AI模塊,本地應用機會崛起。這次蘋果發佈iOS 18,專門說會給手機配上開發圖形的API,只有這樣才能出現好的AI應用,或者深度化的AI應用。最後是物理的AI,今天最火的是具身智能,就是自動駕駛、智能座艙都是這個範疇。
今年我們訓練了一個14B的模型(Orion-14B),我們訓練這個模型的核心就是讓團隊先學習。第二我們就是瞄準小參數,因爲以後我們的機器人上,要跑本地化的模型,並與雲端相結合。
機器人是下一個大模型終端
2018年我就提出機器人公式,AI、軟件、硬件和服務,爲什麼這些年一直不溫不火呢?因爲以前AI的體驗做不上去。我女兒經常諷刺我說:老爸,你做了一個人工智障機器人?我告訴她,不是老爸不行,是當時的技術不行,那時候雪不夠厚、坡度不夠長,今天大語言模型會把這個體驗一下子提升很多。美國基金說可能會出現一個新物種,GPU+大語言模型+數據+電力,我覺得機器人就是這樣的新物種。
爲什麼我們做機器人還要做大模型?大模型就是機器人的大腦,你做機器人,自己不做大腦去買別人的大腦,你的競爭力就有限了,體驗也不會好。我們就是要做端模一體化,根據場景應用找一款好的模型,做自己的大模型機器人。現在我們在1.0階段,但至少要做到3.0、4.0纔有體驗上革命般的進步。
大家都看到過餐廳的遞送、講解機器人等等,但加入了大模型就不一樣。其實,Robot來源捷克語,這個詞本沒有那麼強的人的概念,是“勞動力、奴役”的意思,在外國人眼裡自動的就是Robot,只是我們翻譯爲“機器人”。事實上在大模型出現之前,機器人絕大部分都是自動化機器,產線上的機械臂看上去那麼精密,都是寫好的規則,事實上它是沒有智能的。機器人有了大模型之後才能真正理解和決策,這是很大的改變。以前大部分都是基於規則,現在是端到端。
它會像人一樣理解世界,並作出決策,這個決策不需要人管中間的過程,這是機器人的極大提升。我們投資的一家公司做走播機器人,在直播間說話的聲音像一個小姐姐一樣,都是AI生成的,評論區說帶我去生蠔區看看,她就去生蠔區,告訴你:“我們的生蠔又大又新鮮,趕快來吧。”
之前請小姐姐直播一個月大概賣幾千塊優惠券,但用走播機器人一天賣3000塊錢,用小姐姐播3個小時就太累了,但是機器人一天可以12小時,如果你願意甚至可以24小時。
今天人形機器人很火,但是我對雙足機器人能成功商業化不是很看好,作爲科研項目是可以,如果落地到產線上工作,沒有三五年就不可能。儘管馬斯克認爲可以,但還是很難。而雙臂這件事還是有機會的,用臂做一些以前不好做的工作,所以我們在具身智能發展的是雙臂。
今天我們發現海外也是一個巨大的市場,今年上半年我跑了幾次日本,日本真的勞動力極其稀缺,所以他們對機器人的需求非常大,我們機器人能夠爲服務員省時、省力,他們非常願意買單。
今天有兩個超級端:一個是Phone,一個是PC。下一個超級端是汽車,下下一個就是機器人,我相信讓機器人插上AI翅膀就會完全不一樣。最後希望所有企業家、創業者都一起全力用好AI,插上AI的翅膀。