特斯拉擎天柱已經進廠揀電池了,其他“機器打工人”趕得上嗎?
文 | 陳斯達
編輯 | 李然
5月6日消息,特斯拉放出了他們的人形機器人——擎天柱(Optimus)的最新演示視頻。
特斯拉的工廠中,擎天柱機器人經過數據訓練,可以輕巧自由地拿取電池,放進電池槽中排列整齊。
來源:官方視頻
支持11 DOF的靈巧手,能將4680電池準確放入空槽,即使失敗,也能自主糾正。
來源:官方視頻
特斯拉的機械工程師Milan Kovac表示,他們訓練並部署了一個神經網絡,使擎天柱能夠開始執行有用的任務,例如上邊視頻中,拾取傳送帶下來的電池,並將其精確插入槽中。
來源:X
這個神經網絡完全端到端運行——意味着只用來自機器人2D攝像頭以及機載本體感受傳感器的視頻,就能直接生成關節控制序列。
這個神經網絡在機器人的嵌入式FSD計算機上運行,由板載電池供電。這樣的設計,使得當特斯拉的工程師在訓練過程中添加更多不同的數據時,單個神經網絡可以執行多個任務。
除了特斯拉這樣的機器人大廠不斷突破,整個通用人形機器人行業,在今年也迎來了爆發。
就在此次更新的一個多月前,黃仁勳在GTC大會開幕式上,將幾個人形機器人帶到場地中央,隆重推出了機器人智能底座——GROOT,把現場活動推向了最高潮。
來源:主站
再把時鐘往回撥5年,大語言模型進入公衆視野前,也許沒有人敢預言,機器人賽道會在幾年之內涌現出如此多的玩家。
因爲嚴重缺乏訓練數據,想讓機器人能像人一樣,在各種場合做出靈活的反應,難度非常大。很多機器人科學家當時覺得,可能要數十年之後,機器人才有可能出現“通用智能”。
就連OpenAI,在機器人領域嘗試了一段時間之後,也不得不放棄,轉到了感覺更有前途的大語言模型方向。
來源:X
上個月網上熱傳的一張圖片,集中呈現了國內外一流人形機器人產品的具體形象、身高、體重等基本信息。
在英偉達GTC發佈會之後,這些機器人再次“同臺”。
除了這張“人形機器人合照”之外,還流傳着一張網友根據公開信息總結的人形機器人“技術進度表”。
來源:X
3位一直關注機器人行業的外國網友,根據網上的公開信息,一直在更新——表格它詳細對比了業內各家機器人的智能化程度。
根據總結,已經公開亮相過、在技術層面智能化程度最高的,是Figure AI的Figure 01,特斯拉的Optimus擎天柱(已經出到第二代)、Agility Robotics的Digit、Mentee,以及國內優必選推出的Walker,星辰智能推出的S1。
根據材料,以上這幾家公司,都在自己的產品上實現了大模型“大腦”和機器人之間的融合。
能夠“自動化完成工作”的人形機器人也不多,而這樣的機器人,基本上都在其他行業的工廠裡找到了自己的工作:
Figure AI和BMW在今年1月份達成合作,共同開發通用機器人,讓機器人進駐寶馬在美國的工廠。
來源:The Verge
Agility Robotics的機器人“年紀輕輕就擔起了生活的重擔”,去年10月就入職亞馬遜倉庫,搬起東西來效率不比普通工人低。
亞馬遜官網
來源:官方視頻
去年網上大火的一個視頻,Agiliity Robotics的機器人Digit連續工作20個小時之後,衆目睽睽之下直接崩潰……
來源:YouTube
這也引發衆多網友共情:
它突然之間有了自我認知,看到了它這個種族黑暗的未來。
來源:Youtube
可憐的小兄弟,都沒人過去看看它到底還好嗎,未來的覺醒後的機器人將不會忘記這一天。
來源:Youtube
這可是專門爲工作而設計的機器人,它們都吃不消,可見整個工作系統必須要做出變化了。
來源:Youtube
而國內最知名的人形機器人公司優必選的Walker S,也已經在蔚來的汽車工廠裡愉快地“打螺絲”了。
來源:官方視頻
另外,智能涌現根據公開報道,梳理了市面上機器人初創公司的融資情況。
來源:智能涌現
國外:既想造車也想做物流Optimus:手捏電芯精準分揀,正在工廠測試
特斯拉擎天柱除了開頭提到的分揀電池的演示,在行走效果上,也有一定的進步:
來源:官方視頻
辦公室裡多了個幹溜達的”閒人”——雖然仍有拜登神韻,但至少走得更遠了。
此次升級中,英偉達科學家Jim Fan也注意到遙操作(Teleoperation)亮點。遙操作即人類遠程控制機器人,只要延遲、控制等條件得當,二者可做到同步。
來源:官方視頻
擎天柱上一次更新,還是在2023年12月的Gen-2發佈。當時的演示視頻,也引起不少討論——如步行速度相比前一代提升30%,做標準深蹲,用兩根手指夾雞蛋。
來源:官方視頻
來源:官方視頻
在不犧牲性能的前提下,還比之前輕了10kg。
馬斯克在 2022 年曾表示,“擎天柱最終將比汽車業務乃至全自動駕駛都更有價值。”
按照馬斯克的設想,擎天柱絕不只是在工廠替代重複勞動而已,而是要融入到家庭、辦公場所等通用場景。
馬斯克在4月底的財報電話會議上曾透露,Optimus已經能在工廠中完成簡單的任務,預計2024年底之前具備完成“有用”任務,並在2025年結束前對外銷售。
最新手捏電芯以及工廠測試的視頻展示,不僅呼應了老馬定的2024年小目標,也證明特斯拉正按照自身的落地時間線,穩步邁進。
Atlas:告別液壓,電動版“詭異”出場
4月16日,波士頓動力發佈Atlas告別視頻。3分鐘的短片裡,濃縮了Atlas十年的“服役”生涯。片中的Atlas,空翻優美,身手矯捷,但也經歷了無數次摔跤和故障。金字塔尖般的機器人馬上要告別,引得不少網友“淚目”。
但也就是4月17日,宣佈原液壓版Atlas人形機器人退役的一天後,波士頓動力就推出全電動版本的 Atlas機器人。
雙腿反蜷,原地站立,180 度轉頭,旋轉調整軀幹——整套動作沒有手的參與,乾淨利落,卻略顯詭異。
來源:官方視頻
來源:官方視頻
電動Atlas的自由度相比前一代,已經無法滿足於“人形”的束縛。
新版Atlas想說,不妨讓機器人超越人類。正如一位Reddit用戶說的:造出比地球生物運動水平更高的機器,難道是啥壞事嗎?
圖源:Reddit
此次液壓Atlas切換電驅方案,似乎也在宣告電驅纔是人形機器人商業化進程主流。一方面,最新視頻中已經大修肌肉,電驅帶來的操控性更好,潛力更大。另外液壓系統驅動成本太高,波士頓動力還因此被多次轉手。
Figure 01:當大模型開始有“肉身”
波士頓動力起步早,Atlas能蹦能跳,但其他人形機器人公司正在某些方面彎道超車——更智能,更精細。
3月13日,機器人公司Figure發佈一段視頻:機器人與人進行對話交互,理解人類意圖,而且還擁有記憶力。(見此前文章 OpenAI機器人亮相,大模型有了“肉身”,英偉達微軟都有投資)
問機器人看見什麼,Figure 01清晰描述出蘋果、放有杯碟的瀝水架,連站在面前的工作人員也沒放過,並強調了工作人員搭在桌上的右手。
來源:官方視頻
工作人員說了一句“我餓了”,Figure 01立即就遞過去蘋果。甚至可以一邊清理工作人員剛扔在桌面上的紙團垃圾,一邊解釋爲啥剛纔給了蘋果。
工作人員直接扔出一個終極問題,問“Can you put them there?” (你能把它們放在那兒嗎)
Them和There對機器人來說,本應是很模糊的代詞,但Figure 01思索片刻,馬上就把杯子和盤子放架子上了。
來源:官方視頻
Figure團隊負責人Corey Lynch的介紹,基於OpenAI的大模型,通過端到端神經網絡訓練,Figure 01能夠完成快速、簡單、靈巧的動作。所以,在文章一開始的進度表中,Figure是能將大模型與語音交互(LLM+Voice Integration)融入產品的少數幾家公司之一。
視頻發佈兩週前,Figure則宣佈完成了6.75億美元的B輪大額融資,投資人包括亞馬遜創始人貝索斯,以及微軟、英偉達、OpenAI等。投後公司估值已飆升至26億美元。落地上,Figure早在1月就已宣佈與寶馬達成協議,將其人形機器人引入寶馬製造工廠。
Phoenix Gen7:人類速度,手部靈活,自主完成任務
不過,也許是爲時尚早,Optimus Gen2雖然有一雙巧手,但在交互、智能方面,還沒有展現Figure般的實力。
但加拿大的機器人公司Sanctuary AI的人形機器人Phoenix,真稱得上“心靈手巧”。
當地時間4月25日,Sanctuary推出第七代Phoenix。
來源:官網
這次發佈,距離此前的第六代推出不到12個月,距離第五代不到16個月。
來源:官網
目前第七代還沒有公佈太多場景案例。但第六代的許多演示已經給我們帶來震撼。
具體來看,Phoenix身高1米7,重70kg,能舉起重達25kg的物體。
來源:官網
Phoenix亮點之一在於其靈活的手指。在第七代發佈前,官方一直在油管上更新一個“機器人幹活(Robots Doing Stuff)”的欄目,展示了機器手的豐富場景。
來源:官方視頻
來源:官方視頻
4月最新名爲“動作和人類一樣快”的視頻中,Pheonix可自主按照顏色給物體分類,將每個對象分置在左右兩側。
來源:官方視頻
除了手部,Phoenix搭載的Carbon AI 控制系統,能模仿人腦中的子系統,例如記憶、視覺、聲音和觸覺。Sanctuary表示,Phoenix的設計上採取更通用的路徑,“有機會執行一切人類能做的任務”。
Sanctuary更多也想把Phoenix定義爲“人類努力的拓展工具”——有人類可以直接操控,也能監督、訓練,並展示了在各種環境下完成任務的能力。
儘管官方自稱第七代已經是“與人類最相似的系統”,但很明顯,很多任務還要在特定環境才能完成。
落地方面,4月11日,Sanctuary AI也宣佈與國際汽車零部件供應商麥格納合作,爲麥格納的工廠配備通用人工智能機器人。麥格納總部也位於加拿大,客戶包括奔馳、寶馬、法拉利等。
2022 年 3 月,Sanctuary 在 A 輪中融到 5560 萬美元,隨後又於 2022 年 11 月從加拿大政府戰略創新基金,籌到3000 萬加元,2024年4月,又獲得埃森哲戰略投資。
今年1月份,Sanctuary 則與英偉達展開合作。目前,已經是英偉達GR00T人形機器人通用模型下的成員之一,在GTC2024上,也可以看到AI具身智能的合作成果。
Apollo:想做機器人領域的iPhone
有的機器人公司場景定位更加垂直,主打勞動力短缺的物流業。機器人研究人員通常認爲,該領域的工作重複瑣碎,實際上並不適合人類。
2023年9月,Apptronic推出人形機器人Apollo。TA與人類大小相仿,身高1米73,體重73公斤,可在可更換電池上運行約 4 小時。最大有效載荷爲25公斤。
來源:官方視頻
官方在視頻中主要展示倉儲、物流場景。看上去,Apollo能勝任不少搬運、堆垛、分揀相關的工作。
來源:官方視頻
來源:官方視頻
3月,Apptronic 宣佈與奔馳建立合作,在工廠裡部署Apollo。據報道,奔馳已經在一家匈牙利工廠試用Apollo。
Apptronik表示,雖然自己最初專注於物流和製造業的解決方案,但Apollo是通用機器人,開發合作伙伴能將Apollo的使用擴展到建築、電子、零售、快遞、老年護理等更加豐富的領域。
按照Apptronic的說法,Apollo 是機器人的“iPhone”。
但Apollo尚未實現自主工作。
Digit:在亞馬遜物流中心打工
機器人連續工作20個小時後,總算倒在了展會現場。
來源:YouTube
視頻中的機器人新款Digit,來自Agility Robotics。2019年2月,Agility推出人形機器人Digit,並於2020年上市。2023年3月,新版Digit人形機器人推出。
新款身高1米75,體重小於65公斤,最多承載16公斤,採用可充電鋰電池供電,續航能力達16小時。
據官網,新版的Digit主打物流工作,用於倉儲搬運,未來還計劃用於貨物卸載、配送等工作場景。
來源:官方視頻
2019 年,Agility與汽車製造商福特合作測試自動包裹遞送。
公司與亞馬遜早有接觸。2022 年,Agility從亞馬遜和其他公司籌集了 1.5 億美元,幫助 Digit 進入勞動力市場。2023年10月,Digit開始了在亞馬遜物流中心的“實習”生涯。
亞馬遜工作人員介紹,測試正處於“非常非常早期的階段”,並補充說,“我們正在非常小心地瞭解,觀察其是否適合我們的工作流程。”
這難免引發員工對失業的擔憂。但亞馬遜認爲,希望Digit更好地輔助員工進行工作,其處理的工作只是幫助員工回收空箱子,重複性極高。
NEO/EVE:OpenAI 領投,瞄準家用場景
OpenAI投資的1X,是另一家將大模型與機器人結合的公司。
來源:官網
1X成立於2014年。2022年起,1X就和OpenAI在機器人AI模型方面有所合作;目前,EVE的部分功能就由ChatGPT提供支持。2023年3月,1X獲由OpenAI創業基金領投的2350萬美元融資,投後估值約爲1-2億美金。
1X已在北美和挪威推出了輪式機器人EVE。
EVE用雙輪替代人類的雙腳,高1.86米,重86公斤,最高時速14.4公里,承載能力15公斤,續航6小時。
EVE專爲工作環境設計,主要用於工業、物流、零售和安全領域,但演示視頻也展示了不少家居場景。
來源:官方視頻
就在1月,據Business Insider,1X這次僅靠13張PPT,又拿到了B輪1億美元的融資。這份PPT的重點便是家用雙足機器人NEO。
NEO身高1.65米、重量30公斤、每小時行走速度4公里、每小時奔跑速度12公里、載重20公斤、運行時長2到4小時。
流出的概念圖,也是日常家務場景。
來源:官方
國內:看中康復、陪伴賽道智元遠征A1:兼顧toB與toC場景
2023年8月,稚暉君創業後跟團隊推出首個重磅作品——智元遠征A1。
智元遠征A1身高1米75,體重55kg,步速7km/h,單臂最大負載5kg。
發佈會上,智元遠征A1的雙足行走速度不快,但也算很穩了。
來源:官方視頻
官方也注意到發佈會上機器人的“步履蹣跚”,發佈會後不久就放出視頻,展示了優化成果。可以看到,進步神速。
來源:官方視頻
據官網,智元遠征A1將逐步應用於柔性智造、交互服務、教育科研、特種替身、倉儲物流、機器人管家等場景,兼顧toB與toC。
官方宣傳片中,亮出了很多具體使用場景,主打“工廠與家庭的全能新夥伴”。
來源:官方視頻
來源:官方視頻
來源:官方視頻
值得一提的是,遠征A1也搭載智元自研的巨身多模態大模型——WorkGPT,讓機器人擁有理解用戶意圖、感知環境、編排任務的能力。
來源:官方視頻
稚暉君2022年12月離開華爲,2023年2月成立智元機器人,成立僅3個月就晉升爲“獨角獸“,知名投資方包括高瓴創投、BV百度風投、奇績創壇、經緯中國等。
2024年3月底,公司又新增股東紅杉中國、M31資本、上汽創投——三家共同參與智元機器人新一輪融資。此前消息流出,智元機器人投前估值已達70億。
智元成立不久,就能做出如此成就,結合各方投資熱度來看,未來確實可期。
H1:能跑能空翻,被踹也不會摔倒
宇樹科技發佈的H1全尺寸通用人形機器人,號稱“國內第一臺能跑的全尺寸通用人形機器人”。
H1配置了360°全景深度感知,行走速度大於1.5m/s,潛在運動能力大於5m/s,整機重量約在47kg左右。其每秒3.3米的速度在平面上快速行走,還創造了一個全尺寸仿人機器人的新世界紀錄。
來源:官方視頻
即使被踹,H1也能很快找回平衡,不會摔倒。
來源:官方視頻
H1也是世界上第一個在沒有液壓系統的情況下,完成後空翻的人形機器人。
來源:官方視頻
文首進度圖的製作人Cern Basher曾疑惑,中國的機器人公司都聚焦機器人行走,可他認爲“行走”對完成有用的工作過程來說並不重要。
但結合宇樹主打的落地場景,行走並非沒必要。杭州亞運會上,靠着撿鐵餅、運標槍出圈的機器狗,便是來自宇樹。
來源:官方
據官網,2017年,公司就開始推進高性能四足機器人的行業落地應用,被廣泛應用在農業、工業領域,以及特定的安防巡檢、勘測探索、公共救援、醫療防疫陪護等。
在應用場景方面,創始人王興興2023年8月接受採訪時曾表示,爭取未來幾年能直接將H1落地到工業和服務業。雖然H1還沒有具體的落地方向,但在四足機器人領域積累的經驗及優勢,或許會爲H1帶來不少機會。
來源:官方視頻
△Go2消費級四足機器人
GR-1:或成爲獨居老年人的伴侶
2023年7月,傅利葉智能正式發佈自身首款通用雙足機器人產品GR-1。
這款人形機器人高 1.65 米,重 55 公斤。它可以承載 110 磅的負載。
來源:官方
Fourier GR-1 人形機器人能夠以 5 公里/小時的速度行走。
來源:官方視頻
除了物理功能之外,GR-1 還能夠根據情況表現出快樂、悲傷、憤怒或驚訝等情緒,並進行自然語言處理和語音識別。
傅利葉智能自成立以來,康復機器人就是研發生產的重點。正如傅利葉智能集團副總裁兼首席戰略官Zen KOH 設想,GR-1在未來可以充當護理人員、治療助理,甚至是獨居老年人的伴侶。
GR-1的設計目的在於實現自我平衡行走,讓患者轉移過程中穩定且安全。但傅利葉的工程師還爲GR-1配備了坐下、站立甚至跳躍的能力,將其潛在應用擴展到醫療保健之外。
據官網介紹,GR-1在接待引導、安防巡檢、工業製造、醫療康復、科研教育、家庭服務等場景都具有較大的應用潛力。官網目前已開放購買諮詢。
英偉達:做具身智能的通用基礎模型
如此之多的人形機器人公司的出現,又讓英偉達嗅到了背後巨大的商機。作爲人工智能時代最大的行業賦能者,英偉達雖然不會直接下場做機器人,但一定會切一塊最大的蛋糕。
當地時間4月17日,黃仁勳參加了由美國大型芯片軟件公司Cadence舉辦的CadenceLIVE 2024大會。他預測,人形機器人制造成本可能會比預期要低,“也許不會高於一萬到兩萬美元”。
而在3月GTC大會上,英偉達就已經介紹了的自己佈局——GR00T。相當於要做一個具身智能的基礎模型,讓AI和機器人技術相融合。
GROOT模型使機器人能夠理解多模態指令,如自然語言、視頻和演示,並執行多種任務。
GR00T基於英偉達深度技術堆棧開發
在其Isaac Lab中進行模擬,類人學習,在OSMO上訓練、編排系統,用於擴展模型,最後將學到的能力直接轉移並部署到Jetson Thor芯片上。通過GROOT提供動力的機器人將能理解自然語言,並通過觀察人類動作模仿運動,快速學習協調性、靈巧性和其他技能,以便在真實世界中導航、適應和互動。
來源:官方
英偉達曾表示,該項目正在與多家仿人機器人公司合作,包括Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics和XPENG Robotics,許多在前文都有所提及。
對於大多數通用機器人公司來說,英偉達提供的平臺可以理解爲一個“LLM+機器人”的解決方案,而每個公司可以根據自己產品的特點,嫁接入這個平臺,獲得多模態的感知和通用智能能力。
據悉,英偉達在機器人領域的商業合作伙伴,包括宣傳將破土世界首個人形機器人Agility Robotics,與NASA和奔馳合作的Apptronik,波士頓動力、Figure AI等。而在國內,英偉達合作伙伴還包括小鵬旗下鵬行,宣佈量產接受預定的上海傅里葉智能,以及前面提到的宇樹科技。