與 Koji 的 2025 開年對談:AI 關鍵之年,Agent 開啓元年|此話當真 EP35
用聲音,聽見真格。
「此話當真」是一檔泛商業類播客,我們希望搭建這樣一個分享和交流的平臺,讓每一個對商業、科技、創投充滿好奇的人都能在這裡有所收穫。每期播客將會由不同的真格投資人擔任主持,和各領域的領軍人物一起帶大家深入瞭解科技趨勢,以及創新技術的影響力。交流科技熱點,我們只想給你最專業的解讀。
當然,我們希望這不僅僅是一個播客,更是一次創業的探索。真格,你的創業第一站!我們期待與你相遇,一同發現新的可能。
2025 年第一期,是「此話當真」與「十字路口」的串臺節目。站在新年年初的時間點,雨森和 Koji 最近都很興奮,因爲感到正在親歷科技史上一個重要時刻。這種感覺源自兩個重大事件的發生:一是 Devin 的公開,二是 OpenAI o3 模型的發佈。
Devin 爲何如此令人興奮?就在半年前,雨森在做客「十字路口」時曾打過一個比方,「大模型還是小學生,彆着急讓它去打工。」而就在親自體驗過後,雨森認爲,Devin 作爲第一個真正能用的 Agent 產品,讓人們看到了工作的 Scaling Law。從「你問我答」到「你問我做」,在 AI 能夠異步自主完成計劃與執行後,擺在每個「人類」面前的新問題已經變成:如何學會當 AI 的老闆。
本期內容,在深度探討 Devin 的使用感受與技術飛躍以外,我們回顧了過去一年 AI 行業的快速發展,並想象着 2025 年屬於 AI 創業的大機會將是什麼。
新年宜暢想。AI 技術的發展波濤洶涌,然而只要深入其中就能看到,令人驚歎的進步總髮生在一次次具體而微的努力中。新的一年,就讓我們繼續滿懷期待,且看這滔天巨浪,將帶人們駛向何方。
01
2024 回顧:AI 技術爆發,模型進步超預期,應用增長顯著
Koji:我們先來問雨森的第一個問題:2024 年這一年下來,你的整體感受是什麼?
雨森:非常高興能夠跟 Koji 再次合作,分享我們對 AI 發展和投資的感受,和大家有機會交流。
2024 年這一年下來,整體感覺我覺得是一個字,「快」。因爲我們看到 AI 的模型以及產品的迭代速度都很快。
我記得在 24 年年初時,最先進的模型是 GPT-4。那個時候有個新的基準測試(Benchmark)叫 SWE-bench,是把 GitHub 上常見的任務類型拿下來讓 AI 去嘗試完成。當時最先進的模型 GPT-4 在這上面的得分是 2.8 分,滿分是 100 分。到 24 年年底時,大家可以用到的 Sonnet 3.5 能夠得到 50 分,也就是能解決一半的任務。而剛剛發佈的 o3 在初步評測裡已經得了 71.7 分。
樂觀來講,以這個速度在一年的時間內,也就是 25 年,我們就可以看到人類絕大部分 GitHub 上的任務都能被 AI 解決了。這也意味着現有程序員的單個任務,雖然不是整體工作,但確實有很多都可以被解決。24 年年初時,ChatGPT 還不太會做四則運算,那時候大家經常考它三位數乘三位數,它可能也會算錯。但現在解答 IMO 級別的題目已經得心應手,甚至在對數學家來說都很難的 Frontier Math 測試集上,o3 也得到了 25 分的成績。這是陶哲軒背書的,他認爲這些題目簡單的是 IMO 級別,難的是前沿研究級別,現在 AI 也能做得不錯。
Koji:這對應用帶來了哪些影響?
雨森:比如我們投資的 Kimi,他們的產品是 23 年 10 月 9 號,差不多在 24 年開始前一點時間上線的。到 24 年年底已經有 4000 萬月活用戶。考慮到它是一個一年左右時間的新應用,這個用戶增長速度非常快。
我還記得在 24 年 2 月份春節假期時,看到 Sora 的發佈宣傳片覺得非常震撼。當時想着產品要過多久、以什麼樣的成本才能用到這樣的視頻生成模型。但在 24 年底時,大家已經可以用上了。像可靈、混元等一系列產品,包括 Google 也出了 Veo 2,都是比當時的 Sora 可能更好的視頻生成模型,而且是免費的,讓大家覺得不過如此。所以大家對於 AI 產品的標準提高很快,一年前讓人驚歎的東西,現在可能就覺得平常。但我們始終覺得還有更多可以做的事情,還有很多東西沒落地,實際上進展是非常快的。
同時我覺得也有很多觀點和看法被打臉。我記得在 24 年開始時,如果你去問中國的投資人、創業者,很多人都要做中國的 Character AI,當時大家都覺得這好像是一個 To C 應用,又有很多人用,還說要「百 C 大戰」。
Koji:年初很多人預測 2024 年一定會發生的一個趨勢是 「百 C 大戰」。
雨森:反正我沒有那麼預測,但有很多人這麼預測。在 24 年 8 月份,Character AI 就宣佈被 Google 收購,大家發現要破圈也不是那麼容易。3 月份,Cognition 這家公司,也就是 Devin 的開發者,他們發了一個 demo 視頻。那時候大家都不相信,覺得這個公司是忽悠人,甚至有人說是騙子,還有打假的視頻。結果 12 月 Devin 這個產品出來,大家大爲震驚,發現居然是真的,可以做到很多 AI 的功能。
我還記得在 23 年年底 OpenAI 的宮鬥事件,那個時候整個 OpenAI 的員工都集體在 Twitter 上發聲支持 Sam Altman,說「OpenAI is nothing without its people」,是刷屏的內容。但到 24 年底,走了不知道多少人。最後連元老 Alec Radford,OpenAI 的核心研究員也走了。那中間基本上大部分早期員工都走了。包括在年初時,大家覺得 GPT-5 很快要出來,但一直到年底 GPT-4.5 也沒有出來。等來的是另外一條路線,就是 o1、o3 這條在推理(Inference)的路線。
一年下來有很多變化,不管是快速的變化,還是很多讓人想不到或沒有預計到的變化。這可能就是一個行業早期變化的常態。
Koji:半年前在十字路口那期播客裡,雨森有一個核心觀點是說「大模型還是小學生,不要急着讓它去打工賺錢,給它多一些耐心。」
說這句話的時候,背後暗示着認爲技術的進步雖然很快,但離商業化還很遠,離 To C 的大規模應用還很遠。在今天你還是這麼認爲嗎?還是你覺得進化的速度比你當時理解的要快?
雨森:首先當時說這句話其實有一個上下文,就是大家在問「訓練模型花了這麼多錢,什麼時候才能賺回來?」在討論訓練模型投資回報週期時,我覺得這符合每次技術革命的相似模式:先投入資金進行基礎建設和科研,然後產品逐漸找到落地場景,最終產生商業化收入。
那麼一年下來,在一些具體模型能力比較擅長的具體領域,比如編程領域,大模型的能力確實已經超過了可以「打工」的閾值。就像我之前提到的,在 SWE-bench 測試上,年初只能解決 2% 的問題,顯然還無法勝任工作,但現在已經能解決 50% 的問題。尤其是在 ChatGPT 3.5 出現後,我們看到像 Cursor、Windsurf 以及 Devin 這樣的產品開始涌現,它們能夠真正幫助程序員解決很多問題,爲生產力帶來實質性提升。
從收入角度看,一些 AI Native 應用在找到產品市場契合點(PMF)後增長迅速。比如 Cursor 現在的年度經常性收入(ARR)已接近 1 億美元。另一家針對技術小白用戶的 AI 編程公司 bolt.new,在四個星期達到 400 萬美元的 ARR、兩個月內達到了 2000 萬美元的 ARR,這是企業服務應用有史以來最快的增長。還有斯德哥爾摩的一家公司 Lovable 在四周內就達到 400 萬美元的年化收入。
包括我們投資的 AI 應用 HeyGen,在 23 年年中拿到 1M ARR,在 18 個月內增長了幾十倍,24 年年底達到近 50M ARR。我們投資的 Monica 也已超過千萬美元的 ARR,這些都是在短短十幾個月內實現的。無論是海外創業公司還是我們投資的項目,在用戶增長方面都取得了顯著進展。比如前面提到的 Kimi 已經擁有 4000 萬用戶。
我認爲,在某些領域 AI 已經具備了「打工」能力,但整體收入仍遠低於成本。我們需要保持耐心,畢竟 ChatGPT 問世也才兩年。我們仍處在一個模型能力不斷提升、解鎖新應用場景的階段。只有在應用場景產生足夠多的價值之後,才能逐步開展商業化。
Koji:其實我覺得這一波技術擴散的速度非常快。剛纔提到的 Cursor、bolt.new,包括 HeyGen 和 Monica,除了 Monica 因爲肖弘送了我 VIP 會員,另外三個我都是付費用戶。這些技術擴散起來,我覺得比上一波更快。即便它們並沒有網絡效應,但今天有一幫非常熱情的技術前沿探索者,大家在不斷嘗試新事物,並且熱情洋溢地去傳播。其實十字路口也是這樣的一員,我和雨森每次用到什麼興奮的東西,也都會第一時間分享。
我有一個強烈的感受,也是我們錄這一期的原因,就是希望讓大家不要隔岸觀火,不要覺得看到的只是各種版本號的新發布,好像對自己沒什麼影響。我特別希望大家能夠跳到浪潮裡面去,下載這些應用體驗一下,早一點感受,早一點用起來。
雨森:我覺得有一句話說得特別好,是科幻作家 Gibson 說的:「未來已經到來了,只是沒有均勻分佈而已。」如果日常只是用一個簡單的 Chatbot,甚至還有很多人都沒怎麼用上 AI 產品,那可能就覺得這都是一些新聞頭條而已。但在某些特定領域,比如對程序員或者數字藝術創作者而言,我相信很多時候 AI 工具已經成爲他們生產中不可或缺的一部分。我一直覺得,花一點時間或者花一點小錢去體驗最新的 AI 產品,是非常值得的。因爲這是一個很好的方式,可以直觀感受到我們在某些領域的進步,也是看見未來的一個好辦法。
02
AI 技術擴散:如何讓人人都能創造,而不只是使用
Koji:剛纔提到不管是數字藝術創作者還是程序員這兩個羣體應用的大規模進步,我認爲它們的意義並不僅僅是在幫助這兩個羣體。更重要的是在幫助普通人也能夠去做原來只有程序員和藝術創作者才能做的創造,這纔是更大的意義。
我們再說回來,雨森你去年在真格大概聊了多少個 AI 應用的創業項目?有什麼整體感受?你覺得 AI 應用落地的速度在加速嗎?
雨森:我們團隊加起來應該聊了上千個 AI 應用的創業項目,我自己大概接近 200 個創業者。我們確實覺得隨着技術的進展,AI 應用的落地速度在加快。
具體來說,我覺得三個進展很重要:
第一個是模型的推理能力。像 GPT-4o、o1 這類的發佈讓模型的推理能力變強後,它的幻覺會減少,所以可以去規劃和完成更加複雜的任務。
第二個是模型的編程能力提高。因爲在數字世界,大量任務可以通過編寫程序來完成。我們開始也提到,編程能力的增長速度非常快。當這些常見任務能夠被編程解決的時候,至少在編程這個領域,以及可以被泛化爲編程的其他領域,執行任務能力會強很多。
第三是 Anthropic 首先提出的工具計算機使用(Computer Use)。AI 能夠使用我們已有的軟件,從瀏覽器開始到其他軟件。人類社會造的這些軟件都可以被 AI 用來解決任務。所以這幾個加起來,我覺得對於 AI 完成任務的能力提高很多。
我覺得在 2025 年,Devin 的發佈很重要,因爲它是第一個把 Agent 從大家的想象、從原型變成現實落地的產品。我們會很快看到各個領域的 Agent 嘗試都會出來。當然很多還是在比較初級的階段,但我覺得會有很多很有意思的思考得以落地。
Koji:所以我們待會兒會花很大的篇幅來和大家聊 Devin,以及聊我們對以 Agent 爲代表的 AI 在明年發展的一些預期。
雨森:我們看到在美國和中國,AI 應用的創業方向是挺不一樣的。在國內由於企業服務落地還是有些難度,導致很多創業者想做的還是 To C 的應用。而 To C 應用裡面,很多都傾向於做殺時間的應用,比如各種情感陪伴、AI 聊天這樣的變體。在美國我們看到的是各個細分領域,大家都在想去替代部分人類的工作,讓工作變得更加降本增效。這是中國和美國創業方向的很大反差。
當然國內還有一個大方向就是機器人,整個具身智能領域有非常多的新公司出來,拿了很多融資,甚至我們覺得有點過熱。但整體來講,我覺得大家還是非常興奮的。尤其是對年輕創業者來說,因爲之前大家可能覺得互聯網時代已經快結束了,我們 80 後都是互聯網時代的紅利獲得者,但是 00 後可以幹什麼呢?AI 沒興起之前,他們覺得在互聯網領域確實沒什麼可乾的。但現在 AI 讓大家看到了很多新機會,也是屬於他們這一代年輕創業者的機會。所以我們作爲一個始終關注年輕人的基金,還是覺得有很多有意思的創業者在出來,有意思的項目也在出來。
Koji:說到這一波的創業者,你覺得他們身上有哪些典型的共同點嗎?除了對年輕更友好之外?
雨森:年輕是隨着不同時代進展必然具有的特點。
他們普遍更加具有國際化視野。信息傳播現在越來越快了。在互聯網時代,海外一個應用火了,中國可能要過個三到六個月纔有對標的產品出來。而現在基本上海外出現什麼新事物,當天就會有新聞報道,很多還是通過 AI 去總結翻譯的。所以大家對模型海外應用的進展普遍都很瞭解。
同樣,因爲做的產品往往都是國際化的,出海也成了很大的主題。本來模型就具備很強的多語言能力,所以不少一開始做產品就是全球化的。這個在互聯網時代比較難以看到,那時大家往往都是說「我就做一個針對中國市場的產品」。而現在大家一開始就是兩條路一起走,既有國內的也有國外的。我看到很多創業者和團隊也更加 AI Native,不少人都有做 AI Research 或者工程實踐的經驗,這也是他們能夠更早看到機會並把機會落地實施的原因。
但同時,我覺得對於年輕的創業者來說,因爲他們可能沒有經歷過互聯網很多業務的流程,所以在推廣、做商業化這些領域有些課需要補。在這個時候,一些老司機,比如像我們投資的 Monica 這樣的團隊,他們之前經歷過很多互聯網領域的增長,所以這方面的經驗確實有一些優勢。但我覺得這些都是可以學習的,並且也可以通過招人、通過團隊的補充來提高,所以我們在這方面還是長期很有信心。我們相信新一代 AI Native 的創業者能夠做出很有意思的產品,並且在該補的課上也能補回來。
Koji:我們接下來聊一聊從去年到今年,整個 AI 的技術突破、行業變化和創業機會在這些方面認知上的變遷。首先想問的是,有哪些觀點是一年前你還蠻認可,但一年之後你自己已經不再認可的?
雨森:我覺得太多了,所以後來我都不太想錄播客了,因爲每次講了就容易被打臉。但要做早期投資,尤其是看早期技術,打臉是常態,只有不怕打臉才能夠繼續學習成長。
一年多以前,大家強調的都是 Pre-training,大家講的都是說你需要有多少顯卡、要有多大集羣,這也是 NVIDIA 股價暴漲的原因。因爲大家簡單地把它理解爲:你有更多的顯卡、更多的算力,丟更多的數據進去,很好的模型就會出來。
到 2024 年底 2025 年初來看,在 Pre-training 上確實從 OpenAI 以及各個行業領先團隊來看,已經到了一個相對的瓶頸。
如果我們說 Pre-training 是對智能的壓縮,那現在以文本等這些形式容易被壓縮的智能已經壓得差不多了。Ilya 在發言時說,「互聯網的這些文本就像化石燃料,是人類這麼多年積累下來的文本,現在已經被我們都訓練到模型裡去了。接下來就需要新知識,不管是在我們腦子裡面還沒被提取出來的知識,或者是通過 AI 去產生的新知識,這樣的知識增長速度其實沒那麼快。」所以我覺得 Pre-training 大力出奇跡,這是今年大家都意識到要發生改變的一個過程。
一年前我確實也聊到一些 Agent 的內容。當時我覺得在大模型普遍存在很多幻覺的情況下,這種自主智能體(Autonomous Agent)或者說 L4 級別的 Agent 落地時間會需要比較長。但目前來看,模型的推理能力、代碼生成能力和工具使用能力確實進展很快。這使得在數字世界裡面,如果我們對於一些目標結果比較確定的任務,比如說編程,Agent 落地的速度確實變快了很多。我們已經看到像 Devin 這樣的產品已經不只是一個想法,而是成爲了事實。
這裡面有兩個要點:一是如何更好地規劃任務,能夠做更長週期的任務;二是使用工具,包括寫代碼去使用和用已有的工具。這兩個能力都變得很強的時候,Agent 的落地速度可能會比大家想的要快,尤其是在數字世界裡面。
第三點是,一年前大家普遍認爲模型會越來越大,之前說是 7B、70B、甚至 700B。但目前來看,先進模型的大小提升其實不用那麼快。我們可以用 70B 的模型得到越來越好的結果,同時我們也能夠把同樣的能力放在更小的模型上去運行。
實際上,這種真正的超大模型可能主要用於對使用模型的對齊,或者說作爲 Teacher Model(教師模型)。這其實有點像最早個人電腦的時代。大家一開始都覺得 CPU 的處理器頻率要越來越高,但實際上到了 3GHz 之後,單核頻率就不怎麼單獨增長了,而是通過更好的架構、更低的能耗去提升性能。就像人的大腦一樣,不是要越來越大,而是在同樣的大小下,學到更多知識和技能,變得更加聰明。在這方面,我覺得模型成本的下降是超出預期的。雖然大家一直都知道模型的成本會越來越低,但現在我們看到每年同樣的模型或同樣的智能,它的成本能下降到原來的十分之一。這會解鎖很多應用機會,這些都是在 2024 年初時大家可能沒有那麼明顯意識到,或者說在過程中發生改變的觀點。
Koji:還有一個關於認知變遷的問題:有沒有哪些是你在 2024 年初覺得值得關注但沒那麼重要,但到今天卻變成了特別重要的認知?
雨森:我覺得首先作爲投資人,我們對於前沿研究的認知往往是有些滯後的。有些事情可能在研究員羣體中已經形成共識,但我們還處於後知後覺的狀態。
2024 年有個重點,就是強化學習(Reinforcement Learning ,RL)的興起。前面提到 Pre-training 已經到了一個瓶頸,而在 Post-training 裡面通過 RL 讓模型能力持續變強,尤其是在 o1 和 o3 發佈之後,大家發現在 RL 這條路上還可以走很遠,模型的能力可以提高很多。在 2024 年初的時候,這一點其實還只在很小的範圍內討論,還沒有成爲業界甚至研究界之外的普遍共識。所以我們發現預測大模型或者 AI 的技術路線永遠是一件很難的事情。RL 這個方面的人才其實也很稀缺,所以大家都在做這樣的團隊建設和技術儲備。
與此同時提出了一個非常重要的 Scaling Law,就是推理擴展定律(Inference Scaling Law):如何把推理時間延長,得到更好的結果。
這在去年是一個非常重要的進展,不僅體現在模型的設計上,也包括我們如何設計產品。因爲現在大部分產品像 ChatGPT、Claude 或者像 Cursor 這樣,都是要跟人進行實時互動,我說一句它回一句。那這個時候,如何讓它每一步能夠做更長的時間,甚至讓它自己能夠通過計劃使用工具持續地去做事情,而不需要我持續輸入。這種「慢思考」的思維方式不是張口就來,而是經過深思熟慮之後得到更好的結果。這方面如何獲得更好的表現會是今年非常重要的一點。
還有一個是,模型之前是沒有太多背景信息的。比如當我問 ChatGPT 一個問題,它實際上只有我的這個輸入作爲它的背景信息。事實上任何一個聰明人,如果只有一句話來回答問題,都是很難的。但我們現在看到,比如 Cursor 可以把整個組織的 Codebase 作爲背景信息。而 Devin 是整合在 Slack 裡邊,它能把組織裡面已有的對話記錄、功能記錄作爲背景信息。當模型在同樣的智能水平下,有了更多的信息,就能夠更好地理解意圖,更好地回答問題。
我覺得在這個方面,新的產品設計如何讓用戶能夠無痛、簡單地把更多背景信息帶進去,會變得很重要。所以我們現在看到的像 ChatGPT 這種一問一答的方式,我覺得還是一個非常原始的方式。大家都在思考新的產品形態是什麼樣子,這些都是今年大家逐漸意識到並浮出水面的東西。
Koji:我們在上一期的「十字路口」里正好聊到了 OpenAI 過去 12 天的連環發佈會發佈了什麼。關於前面提到的第三點,即如何獲得更多的背景信息,OpenAI 也發佈了一個新功能:ChatGPT 的 Mac 版本現在可以讀取你的屏幕,把屏幕上的內容作爲背景信息,結合你的問題來給出回覆。
這個讀屏功能並不是簡單的截屏,它可以讀取三個層面的內容。第一個層面是截圖式理解,即屏幕上顯示什麼它就理解什麼。第二個層面是它可以讀取程序窗口裡的所有內容,哪怕這些內容現在並沒有顯示在屏幕上,需要滾動才能看到,它也可以獲取這些信息。第三個層面是最厲害的,它可以知道你的光標位置。因爲光標在哪裡,往往表明你當前的注意力最集中在哪裡。因此當你問問題或與它討論時,它會結合你的光標位置或你選中的文字來進行回覆。
所以我覺得哪怕是在 Chatbot 這樣的模式下,能讀取更多背景信息的應用也會讓 AI 能力變得更強。
雨森:對,原來的 ChatGPT 有點像是你的一個筆友,你只能給它寫郵件,你寫一封它回一封。但如果這個「筆友」不是在郵件的另一端,而是站在你電腦後面,看着你如何使用電腦,甚至是住在你的電腦裡面,能看到屏幕上看不到的東西,它顯然會變得更有用。
所以我覺得如何把 AI 與用戶的背景信息、用戶已有的知識、組織已有的知識結合起來,對 AI 的作用是巨大的。因爲它現在能夠消化這麼多的信息,這當然也得益於模型技術的進步。
Koji:不僅是這些,最近剛發佈兩週的 Gemini 2.0 也推出了多模態理解功能。你可以直接打開攝像頭,然後指着攝像頭看到的東西問「這是什麼」。比如我試了一下,就問牆上一張電影節的海報:這是什麼電影節、哪一屆的海報。類似這樣的問題在過去都只存在於科幻電影中,但在今天已經變成現實,而且這個現實是在可接受的成本之內,並且能以非常快的速度返回答案。當然它還沒有特別好地變成一個 C 端產品,但大家去試用一下,我覺得這個效果真的很讓人驚豔。
03
從 ChatGPT 到 Devin:AI 編程的四個發展階段與範式轉變
Koji:我們再聊一聊 AI 編程。編程領域今年取得了非常令人興奮的進展。雨森一直有很強的框架歸納和總結能力。前不久你跟我分享過你提煉出來的 AI 編程發展四段論,要不要在播客裡和大家分享一下?
雨森:這其實是和很多朋友一起探討得出的結果,是大家智慧的結晶。AI 編程從 ChatGPT 出現到現在也就兩年出頭的時間,但已經經歷了四個階段。
第一個階段是讓 AI 直接寫代碼,典型代表是早期的 ChatGPT、Claude。我們給它一個需求,比如「幫我寫個貪吃蛇」,它就給出一段代碼。在這個過程中,它既不知道我爲什麼要寫貪吃蛇,也不知道代碼運行情況如何。可能要我去本地編譯運行後發現報錯,再把錯誤告訴它,它才能給出調試後的結果。這時的 AI 完全就像一個只能通過郵件交流的筆友,是簡單的問答模式。
第二階段是以 GitHub Copilot 爲代表,AI 開始擁有上下文,它可以把整個組織的代碼庫作爲 context。這樣 AI 就獲得了大量新的背景信息。但這時用戶還是需要手動把代碼貼到 IDE 裡面進行調試。我覺得這是 2.0 階段,就是我們讓 AI 擁有了 codebase 作爲上下文。
2024 年一個非常大的進步是以 Cursor 爲代表的編程 Copilot 的出現。它的核心理念是預測用戶未來要寫什麼代碼。根據你的代碼庫以及剛纔寫的代碼,它預測你接下來要寫什麼代碼、創建什麼文件、做什麼操作。這裡面對於生成代碼的質量和數量,以及文件的創建和修改都有很大提升。後來 Windsurf 還加入了對命令行操作的自動化,這樣 AI 就能很好地使用我的電腦。原來的 AI 是在一張紙上寫代碼,我把代碼抄走運行;現在 AI 可以在我的電腦上創建文件、執行命令行操作,進入到「我爲你寫」的階段。
當我們覺得這已經很令人興奮時,Devin 的出現帶來了幾個重要突破:首先,它可以異步工作。Cursor、Windsurf 這些工具雖然一步操作做的事情比較多,但仍然需要持續的注意力,即「我說一步它做一步」。而 Devin 可以持續工作,把用戶的注意力釋放出來。這是因爲它多了一個 Planner,可以規劃任務。
其次,它可以通過虛擬機執行更多操作,做更多調試工作。比如你寫個網站,它可以自己用虛擬機去訪問這個網站,檢查前端後端的業務邏輯是否正確,並且可以隨時打斷和調整。大家用 Cursor 或者 ChatGPT 都知道,你無法在它輸出的中間做調整,必須等它輸出完後才能修改。但 Devin 就像真人一樣,你可以在它完成任務時給出新指令,它會把這個結合到已有的 Planner 裡調整計劃。這就從「爲你寫」進化到了「爲你做」。
總結一下這四個階段:第一階段是讓 AI 寫代碼,代表是 ChatGPT;第二階段是 AI 開放代碼庫,代表是 GitHub Copilot;第三階段是 AI 可以自動寫代碼並執行,代表是 Cursor 和 Windsurf;第四階段是 AI 虛擬員工,Devin 開創了一個很好的先例。
04
AI 出海攻略:深耕用戶需求,巧用內容營銷,避免簡單投放
Koji:這很像一個比喻:1.0 時代的 AI 是「讀萬卷書」來回答問題,到了 4.0 時代則變成了「行萬里路」。它成爲一個真實的員工,你給它下達任務,它就去外面完成一圈,再回來向你彙報。這是我們親眼見證的、在這一年中發生的躍遷式四階段變化。
真格在過去投資了不少出海的 AI 創業團隊,其中非常典型的代表是 HeyGen 和 Monica,都表現得超級優秀。所以也想和你探討一下出海的話題。
今年在整個行業裡有一句廣爲流傳的說法是「不出海就出局」,出海似乎變得非常重要,甚至是至關重要。所以首先想問你的是,爲什麼海外 AI 的落地和國內的反差這麼大?以至於我們都鼓勵英語都說不好的國內創業者去勇敢嘗試,做一做 AI 的出海?
雨森:最核心的原因是 AI 目前主要是一個提高生產力的技術,而在人均工資高很多的歐美地區,他們對工具的付費意願更強。
所以當你做一個生產力工具時,比如像我們投資的 HeyGen、Monica 還有 Oculus、Max AI 等一系列提高生產力的工具,海外用戶尤其是歐美用戶對於生產力付費的意願比較強,而且他們付的是美元,所以這個絕對金額更高。這是最重要的因素。
同時也有一些其他原因:比如說去海外能夠使用能力更強的模型,如 Sonnet 3.5 或者 GPT-4o,所以能夠解鎖更多的應用場景,而國內大家能用到的模型確實還有一些差距。另外,當一個產品做好之後,因爲大模型本身可以處理多語言的輸入和輸出,既然已經做了,爲什麼不把它面向全球化推廣呢?
我覺得現在普遍採用了訂閱制,這在國內確實比較難推行,但是海外訂閱已經被廣泛接受了。這樣對於創業團隊來說,他們做商業收入的能力也提高了很多。
Koji:所以你認爲這一代的 AI 創業者,他需要具備哪些特點?然後你會鼓勵他出海嗎?因爲我想你也不會鼓勵所有人出海。
雨森:其實我們現在覺得當所有 VC 都勸創業者出海的時候,這往往就說明市場太熱了。
因爲我們一直在警惕這種所謂特別共識性的觀點。而且我們覺得大部分中國創業者出海肯定是一個 debuff 而不是 buff,因爲畢竟是客場作戰,你要解決很多在國內不需要解決的問題,以及去了解很多原來並不瞭解的用戶。
中國的機會其實很多,像我們在國內投的 Kimi、與愛爲舞這些 AI 公司,其實增長得更快。只是說它的商業化可能會稍微慢一點。但是我覺得這也是互聯網時代我們學到的一點。其實想想看互聯網時代,當 eBay 那個時候很早商業化、抽佣金的時候,淘寶先免費,然後最後做成了更牛的商業模式。在中國和歐美市場,本來適合的商業模式就不太一樣,並不是每個團隊都要去出海。
Koji:在今天已經選擇要出海的中國創業者,我相信有很多人在聽我們這期播客內容。那雨森,你會有什麼樣的建議給到他們嗎?
雨森:我覺得出海其實跟在任何地方做產品一樣,首先要非常瞭解用戶的真實需求。在出海的過程中,因爲隔着語言和地理位置的障礙,所以這一點變得更加重要,尤其在企業服務領域。因爲之前我們見到蠻多中國做企業服務的創業者,覺得我們的工程師能力很強,解決問題的能力很強,所以他們覺得出海可以去超越競爭對手。
雖然我們的團隊執行力很強,但定義關鍵問題需要實地調研和真正瞭解客戶。所以尤其是在這種需要以銷售驅動的領域,我們覺得一定要找到有 Go-to-Market 經驗的專家,甚至團隊要去到對應的目的地。像 Monica 這樣偏用戶端的產品,需求可能相對比較普世或容易理解,那這個倒不一定。但對於企業服務來說,人一定要出去。
當然我們看到有很多做小衆市場的,因爲這類需求理解起來最容易,可能全人類都差不多。這是第一點,就是真的要搞清楚用戶和需求。第二點,我覺得普遍做得好的團隊的共性,就是要想清楚並找到一個低成本高回報的營銷策略。比如我們看到 HeyGen、Monica、Viggle 這些中國出海比較好的產品,其實往往都是把 SEO、社交媒體傳播,或者優質內容的病毒式傳播這些營銷策略用得比較好,而不是簡單地去做投放的打法。當然如果你的產品變現能力很強,這個時候也許做投放能把 ROI 算過來,但基本上現在投放都很貴。
所以如何巧妙地做營銷,尤其是通過產品特性實現病毒式營銷,變得非常重要。
把海外的 Twitter 這些平臺用好,其實跟國內很不一樣。因爲在國內大家可能習慣了去投信息流、做投放,通過很厲害的投放方式去做。而在海外我覺得更要巧妙地去做。國內團隊的產品執行力往往都很強,所以無非就是說做什麼和怎麼推廣這兩點,可能是大家普遍遇到比較有挑戰,或者說做好了就會比較加分的地方。
05
AI 硬件創業:看上去很美,但需要謹慎對待
Koji:其實大家還有一個觀點,就是覺得這一波做 AI 硬件的也蠻多的。做 AI 硬件可以特別好地利用到中國的優勢資源。那在 AI 硬件領域,雨森你們在過去一年看過或投資了什麼項目嗎?
雨森:AI 硬件我們看了蠻多項目,但說實話我覺得硬件看上去很美,卻不一定真的那麼好落地。
過去落地比較好的還是這種,比如說海外已經把產品原型打出來了,我們去把它做得更快、更便宜,或者更小。當然我們也看到一些團隊,比如像 Plaud,確實做出了很有創意的產品。但我覺得整體來說,硬件的擴展速度其實都沒有那麼快,軟件反而還是更加適合現在 AI 擴散的載體。所以我們對於硬件一直都是比較謹慎的。
當然我們也有投這樣的創業者,但我們整體並沒有像有的基金那樣投了很多。我自己對於 AI 硬件一直覺得,包括像當時的 Rabbit、Humane 剛出來的時候,我自己都是持比較謹慎的態度。
06
Devin:不只是一個編程工具,而是首個真實可用的AI Agent
Koji:好,我們進到今天的第二部分,我們將和雨森一起來聊一聊 Devin。首先要和大家特別說明的是,我們今天會用非開發者的視角來聊。因爲我倆都不是專業的工程師,雖然學了七年的計算機科學,但畢業之後就一直做產品經理。也是直到半年前 Cursor 發佈之後,才重新開始寫代碼,應該說是重新開始命令 AI 幫我寫代碼(笑)。
但另一方面,正是因爲我和雨森都是非開發者的背景,這反而讓我們可以用獨特的視角去感受和體驗 Devin,並且去預測 AI Coding Agent 乃至更廣義的 AI Agent 將如何改變每個人未來的生活和工作。
因爲我們認爲這一代 AI 編程技術最終會沿着兩個方向發展:一個是服務專業的程序員和開發者,第二是賦能所有像我們這樣的非開發者。而後者的商業價值和應用前景可能更加深遠而廣泛。
那第一個問題想問一下雨森,我們在發佈的第一天,你其實就花了 500 美金去充值。那你充值了 Devin 之後,第一個用 Devin 做的事情是什麼?以及你用它做的讓你印象最深刻的事情是什麼?
雨森:Devin 在安裝完成之後,它有一些推薦的任務。其中有一個就是它會把你的名字帶進去,在網上找你的信息,給你做個人網站。之後我讓它做了我通常讓實習生做的典型工作,我給它一個任務:我們要改一改我們的創投基金的價值觀宣言(Manifesto)。然後,我說你去找一找美國有哪些頂級 VC,他們的 Manifesto 是什麼?這是一個典型的任務,你大概知道需要找什麼,但這需要有信息收集整理和解決問題的能力。
我看它去做,發現很多有意思的點。它首先要確定什麼是美國的 Top VC,所以先去 Pitchbook、CB Insights 這些網站找有沒有 Top VC 的列表。它先找到了它認爲 Top 的十幾家 VC,我看了看列表確實是比較頂級的十家,它就一個個去官網找他們的 Manifesto。但是 Manifesto 這個東西在 VC 裡邊其實有不同的叫法。比如說紅杉叫 Ethos,在 Founders Fund 叫 Manifesto,在別的地方可能叫 About 或者 Philosophy。並且還有幾個 VC 的網站上沒有這樣的內容,就是沒有一個關於「我是誰,我的價值觀」的描述。所以我看到 Devin 在這個過程中,它在嘗試理解這個任務,找到最符合的內容。
比如說它在找 Accel 這家 VC(也是美國非常有名的 VC)時,發現官網上沒有這樣的內容。但它就去 News 裡面找,找來找去找了兩三年,他們有篇文章裡面介紹了 Accel 的價值觀方法論。它把那個內容拿出來作爲它要找的內容。所以你可以看到它像一個初級人類員工一樣去解決問題,不是很機械地說你網站上有沒有個叫 Manifesto 的東西,沒有就沒找到。而是說我需要去看看你整個網站上面有沒有比較符合這個內容定位的內容,然後去尋找。
它最後給我一個包含 10 個 VC 對應 Manifesto 的 Markdown 文件,但這裡面有很多 AI 模型現在常見的問題。比如說它有時候容易偷懶,因爲我要它把全文拿下來,但在幾個 VC 的內容裡面,它就給自己做了個總結。這是我們很多時候用現在 AI 的 Chatbot 也會遇到的問題,就是因爲 Token 數的原因不給你全文,而是給你一個縮略。這個時候就要告訴它說,你要給我完整的文本內容。所以它其實跟真正的實習生一樣需要教導。但我覺得這裡面它體現的規劃能力,以及對於不能直接解決的任務去創造性解決的能力,是非常有意思的。
當然這可能不是大家使用 Devin 的典型場景,因爲我沒有讓它去編程,而是讓它來做一個語言模型 AI 的常見事情。所以我完全可以想到,現在我們有適合編程的 Devin,那麼我們完全可以有適合做文本工作、適合金融界或法律界工作的對應 Agent 產品。
在這裡面我認爲,只要我定義的工作是一個人坐在電腦前,通過使用電腦、上網、使用軟件能夠解決的工作,那麼它大概率都能被或多或少地在這個工作流程裡得到體現。這個還是蠻讓我覺得驚豔的。
Koji:所以你從第一天到現在,在兩週左右的時間裡,你感覺自己體驗到了一個什麼樣的未來?
雨森:在體驗 Devin 之後,我感覺它作爲第一個真正能用的 Agent 產品,可能標誌着人類歷史的一個重要時刻。
爲什麼這麼說呢?因爲人類歷史上發明了很多工具,有人說「人就是能夠使用工具的動物。」但所有這些工具基本上都可以分爲兩類:第一種是需要持續注意力的工具,比如電鑽、錘子或鍵盤鼠標,它需要我們持續的注意力關注和輸入;第二種是機械重複的自動化工具,比如洗衣機、自動售貨機、流水線,它可以不需要我們關注,但只能解決重複的任務。
我們一直在尋找第三種——不需要持續注意力,但同時能自己規劃去解決問題的工具。這就是所謂的 Autonomous Agent。
在原來的構想裡,可能只有像 Viggle 這樣的產品在硬件上實現了。在軟件層面,我們一直沒有看到這樣的產品出現。去年有一些像 AutoGPT 這樣的嘗試,但都還停留在產品原型階段。
我發現 Cursor 定義了真正的 Agent 產品需要具備的幾個特點:
第一是由於強大的任務規劃能力帶來的異步體驗。它原來設計的場景是在 Slack 裡你可以 @Devin 說幫我改這個 Bug,然後它自己就去改了。只有在它真的需要幫助或完成任務時纔會來找我。這跟實習生很像,交代任務後他會自己工作,只在遇到解決不了的問題時纔來找我。與此同時,我可以給多個實習生派活,讓我能專注做真正重要的事情。
第二是在雲端部署的虛擬機。它可以使用瀏覽器,未來還能使用更多軟件,從而完成更多任務。這和原來的 Cursor 和 Windsurf 用我自己的電腦完全不一樣。如果大家之前用過類似於 RPA 的軟件,大家會發現 RPA 在操作的時候,你是什麼都不敢操作的,因爲你的操作會打斷它的流程。AI 是在用你的電腦。但 Devin 是在用虛擬機,就像我們給實習生配電腦一樣,AI 用自己的虛擬機帶來的靈活性非常不同。
第三,Devin 做事時像真實員工一樣會學習和成長。比如說我們招個實習生,他第一天肯定會搞砸很多事情,因爲他不知道在我們這個組織裡面該如何處理很多社交行爲。當他做一件事情的時候,會逐漸意識到自己需要積累相關經驗,這些經驗被稱爲「知識」。他會主動提示說自己學到了某個知識點,比如在找信息時要儘量去官網查找。我會確認他學到了這些好的知識,這個過程和我們跟實習生、員工做評估很像。就像員工寫工作總結說學到了哪幾點,我們會肯定說「對,這幾點做得很對」。這樣理論上就可以不斷積累組織內的專有知識,讓他變得更加適應這個團隊。
其實我們在招人時也是這樣。一個員工剛來的時候,他的價值相對有限,需要持續學習才能更好地適應組織。但之前在使用工具時,我們都希望這個工具一打開就能用,不會期待說一臺電腦要不斷學習才能越來越好用。
在 Devin 這裡,我們真正看到了它具備類似人類員工的成長曲線。雖然這還比較早期,但我們發現這樣的範式轉變非常重要。
第四,Devin 提出了根據完成任務進行收費的模式。500 美元對應 250 個 ACU,每個 ACU 約 15 分鐘工作,換算下來每小時 8 美元。這已經低於加州最低工資標準(16 美元/小時)的一半。隨着 AI 算力提高、成本下降,這筆投入在未來能做更多事情。相比招人還要處理人事、場地、管理等問題,AI 是 7×24 小時不知疲倦的員工。
有朋友說得很有意思:程序員喜歡 Cursor,因爲它是程序員的 Copilot,能幫助提升效率;老闆喜歡 Devin,因爲老闆考慮如何花錢買到生產力。Devin 展示了一個潛在的範式變化,就是通過花錢去擴展生產力。我認爲 Devin 讓我看到了工作的 Scaling Law。
在很多 Coding Agent 裡,第一個任務往往是做個人網站,我們開玩笑說「這就是新時代的 Hello World。」這個任務它完成得不錯,因爲從網上找我的信息比較容易,它能快速搭建網站。
Koji:Devin 的出現,不僅讓大家覺得 AI 編程變得很厲害,更是定義了一個新的交互方式。大家可以看到,AI Agent 可以如此工作。因爲我和雨森在 Devin 裡面用一個團隊賬號,我能看到他所有任務的進展,能看到他怎麼用 Devin,Devin 又怎麼迴應他。
這真的有一種在辦公室裡的感覺。有一個實習生一開始在幫雨森做事,現在他做了一個報告。正好雨森下樓吃飯了,我看到了他的報告,就給他建議說,其實雨森想要的是這樣,你再去完善一下,等他回來就可以看了。這種真的像是在用一個人,這也是爲什麼我們說它是一個真正的 Agent。因爲 Agent 翻譯過來是「人」,而不僅僅是機器,它是某種助理的意思。這是爲什麼我感覺 Devin 產生了一個新的、像用助理一樣的範式。
雨森:對,這裡面還有很多細節挺有意思的。我再舉一個例子,在我們另外一個朋友的任務裡,他要 Devin 去 LinkedIn 上抓一些人的信息。比如說 OpenAI 的中國員工,但 Devin 顯然沒有 LinkedIn 賬號,所以它需要找用戶說,你能不能幫我登錄一下 LinkedIn 賬號。這時候,因爲 Devin 運行在虛擬機上,所以它有個互動模式。作爲用戶,我可以在虛擬機裡輸入我的 LinkedIn 賬號和密碼,然後 Devin 就繼續使用。
這很像什麼呢?比如我們招一個實習生,給他配了臺電腦,但他沒有特定軟件的訂閱賬號,他就會說「老闆你來輸一下你的賬號」,在我把賬號輸進去之後,他就繼續用我登錄好的賬號工作。
這就是爲什麼虛擬機變得很重要,因爲它可以在裡面做很多操作,不打斷我的工作流程。否則就像 Cursor 或 Windsurf 那樣借用我的電腦,那時我什麼也幹不了。這種異步的方式讓我可以同時給 Devin 佈置很多任務,它是個並行的工作模式,我只需要付出算力成本就行了。
這其實很重要。比如在日常生活中我有一個實習生,但如果我有十個實習生,每個人都能幫我做很多事情。這個工作效率的提升可能是指數級的。
Koji:就讓我想起了當年說「人人都是產品經理」,但今天就變成了「人人都是 CEO」。因爲在和 AI 單位互動的過程當中,好像只需要做 CEO 最喜歡做的三件事:第一,下指令;第二,檢查工作;第三,高水平一點的 CEO 還可以給它一些啓發和指點。
雨森:其實很多人在使用 Devin 或其他 AI 產品時,都會遇到一個問題:我要做什麼,以及我該如何提出需求。想象一下,如果我們招一個員工,只對他說「幫我寫個淘寶」,那這個人肯定是做不出來的。但爲什麼我們對 AI 常常會有一些不切實際的想法,認爲說「你給我做個淘寶」它就能做出來?這顯然是不對的。
確實,我們每個人都要思考自己到底要做什麼。很多人面對一個很強大的模型時,雖然它具備很多能力,但關鍵在於你是否明確自己想做的事情,以及能否用更加合理、容易理解、更有結構的方式提出需求。
就像我們自己在做產品經理、設計師、程序員的時候,也很煩那種自己都沒搞懂需求的老闆,比如提出「五彩斑斕的黑」這樣的需求。但當我們自己成爲 AI 的老闆時,我們能不能做一個好的老闆?這其實是接下來每個人都要學會的過程:如何當一個好老闆。
Koji:其實在使用過程中還有一個很強的感受,這也是 hidecloud 前段時間提到的。他提醒大家,Devin 有一個非常厲害之處,在於它可以幫助我們調用人類歷史上的智慧結晶。這句話怎麼理解呢?
就是說我們要完成一個任務時,往往不知道世界上已經存在這樣的輪子,不知道誰已經開發了這樣的工具。因爲很多工具是以代碼的形式,以代碼庫的形式放在 GitHub 或者 Hugging Face 上。要把這樣的代碼下載到本地,部署到機器上,並且和其他工作或軟件程序聯通運行,這件事一千個人裡可能只有一個人能做到。但今天有了 Devin 之後,理論上人人都可以做到,因爲你可以用自然語言像老闆一樣下指令。
舉一個具體的例子:比如說現在我們要做一個國際象棋應用。在過去,僅僅是把國際象棋的規則寫出來,就需要花幾百行甚至上千行代碼。你可能會想說,我去搜索一下,看看是不是已經有人把這個規則寫成了可調用的代碼庫。但你可能會搜出 Google 幾百頁的結果,在這裡面什麼是最好的、什麼是最佳實踐也不知道。但有了 Devin 之後,你可以把這個命令下給它,它會用自己的分析方式幫你找到已經存在的最適合的程序代碼庫,然後直接用起來。
這帶來的價值是:所有前人開發過的、用於解決特定問題的工具或代碼庫,你都可以直接使用,不必重新造輪子。你可以站在巨人的肩膀上,用這些經過社區驗證的最佳實踐來開發自己想要的工具。我覺得這也是 Devin 包括 Cursor 實現的一個價值,雖然可能不那麼顯著,但影響很深遠。
雨森:當 ChatGPT 剛出現時,我就有一個很強烈的感覺:如果你的工作中有很多是複製粘貼或者「縫合怪」的部分,那這個是很容易被替代的。大家發現最早被 AI 大幅提效(說得好聽點是提效,說得不好聽是容易被替代)的工作,其實就是初級美工的這種剪貼型設計工作。比如把別人的設計抄過來,或者初級代碼工作者把某個庫簡單修改後應用到自己項目裡。這樣的工作最容易被替代,所以前端程序員其實面臨很大的壓力,因爲前端展示大部分時候並不需要那麼多創新的想法。
在這個過程中,我覺得對於大家來說,如何提出想法、如何創造性地解決問題,這些能力會變得越來越重要。
而找到已有的解決方案,把它們用膠水粘起來的工作,恰恰是 AI 最擅長的。我們工作中的大部分內容其實都是已經被解決過的問題,或者已經被髮明的輪子,只是以前人類不知道這些輪子的存在,或者沒有辦法把它們很好地拼接起來。但現在 AI 能夠幫我們做到這一點,讓我們能夠專注于思考「要做什麼」這件事情,這會變得越來越重要。
這也讓我想到對於教育的影響。我們之前大量的教育,包括培訓都在教「怎麼做執行工作」。就好像當沒有計算器的時候,我們要學大量的手算和心算。但現在,我們需要了解計算的原理,但未必要去做這些具體的計算。我們可以把更多的精力花在思考要做什麼、提出正確的問題上。這也是我覺得未來教育體系需要做出重大變革的原因。
Koji:所以 2025 年是非常值得期待的。從 Devin 的發佈,我們看到的不只是 AI 編程被 Agent 整個升級到下一個級別,這樣新範式的出現會給方方面面帶來顛覆式的革命,也意味着各種創業的機會。
剛纔雨森提到了一個非常有趣的觀點:Devin 是人類歷史上第一個既不需要持續注意力,又不只是機械重複的工具。這也讓我們看到了工作的某種 Scaling Law。您覺得可以再展開講解一下嗎?讓大家更好地理解這意味着怎樣的了不起的價值。
雨森:首先說說 Scaling Law,最直白的解釋就是我能夠通過投入更多的錢來獲得更多的生產力,這裡的錢可以等價於算力。這其實很不容易,想想看,很多公司融了很多錢,但似乎並不能把錢有效地轉化爲生產力——他們需要招人、搭建組織、做各種瑣事。但隨着這種可以異步工作的 AI Agent 的出現,我們可以把很多任務分配給不同類型的 AI 去做。它們消耗的是算力和電力,就能完成任務本身,而且可以並行進行。
你完全可以想象,會有一個更擅長提出需求、拆解需求的「產品經理型」AI 去指揮很多 AI 程序員工作,形成一個虛擬組織。在這個組織裡,你更需要考慮兩件事:第一,你要做什麼;第二,要有足夠的算力和資金投入。在這樣一個正在快速成爲現實的組織裡,我們可以通過投入更多的錢和算力,有效地把工作規模化擴展。這就是所謂的工作的 Scaling Law。
第二點很有趣。我們經常遇到創業者說「我有個很好的想法,但缺個程序員」。
優秀的編程執行能力現在還是稀缺資源。但當執行本身不再稀缺,「做什麼」就變得尤爲重要。就像剛纔說的,每個人都要學會當老闆。這樣我們能看到更多的創業機會,很多原本因爲缺乏優秀程序員而被埋沒的創業者,現在可能會獲得更多機會,更多創意可能被付諸實踐。這也是我們可以把創業這件事情規模化的一個原因:因爲通過投入資金就能提高生產力。
這一切得以實現是因爲 AI Agent 能夠並行工作。如果我們的注意力要放在工具上,那注意力是有限的。但現在我們的注意力可以分配到不同的 Agent 上,一個人可以同時給多個 Agent 下達指令去完成任務。
Koji:其實說到 Scaling Law,我想到一個比喻。當年王興讓我們看一本書叫「領導梯隊」,書中講到當你第一次成爲小團隊的領導時,你要有一個重要的認知轉變:你的產出不再是你個人的產出,而是整個團隊的產出。
在今天,我們從 Devin 身上看到的工作的 Scaling Law 其實也是類似的。這裡的產出不再是你一個人專注在眼前工作的產出,而是取決於你如何把團隊任務下達好,把檢查標準設定好。團隊的所有產出,包括 Devin 的所有產出,最終都會成爲你的產出。這意味着你可以用有限的注意力實現無限的 Scale-up。只要你能夠管理足夠多的人和 Agent,而且管理 AI Agent 比管理人要容易得多,因爲管理人涉及更多的溝通協調和情緒價值。我理解這可能就是雨森想說的工作的 Scaling Law。
雨森:這個概念沒有問題:設想如果你能成爲一家跨國公司的 CEO,能夠指揮上千人、上萬人,你能做什麼事情?以前我們沒有這樣的機會,但現在可以通過管理 AI Agent、讓 Agent 去調動其他 Agent 來獲得類似的機會。這所需要的就是錢和算力,而很多公司其實並不缺錢,他們缺的是人才,是能把事情執行出來的組織結構。
所以我相信在這種情況下會出現兩種趨勢:一方面,有實力的公司和個人能做更多的事情;另一方面,很多有想法的人可以通過相對較少的成本,快速把想法實現出來,獲得用戶認可或投資,這樣我們就會有更多創業者和創新空間。
Koji:對,這就是今年最流行的說法之一:「超級個體」。因爲一個人在獲得越來越多工具的賦能之後,包括 AI Agent 的賦能,就可以做到原來需要十個人、二十個人才能完成的事情。
不過 Devin 發佈後不久,也收到了很多吐槽和批評。對此你會怎麼看?
雨森:很多批評都集中在 500 美金的價格上,大家把它和 Cursor 20 美金的價格進行對比。首先,我認爲這是兩種不同的範式。
一種是需要用我的時間去使用的工具,它讓我的時間變得更高效,但並沒有省下時間。所以在使用 Cursor 這種工具型產品時,因爲我的成本並沒有下降,實際上是我的成本加上工具的成本。但如果把它當作一個員工,對比對象就變成了員工的工資。只要它能夠比同等價格招到的員工幹更多的活,我認爲這個價格在歐美市場是可以接受的。很多人一看到價格就說這是不是在割韭菜,其實關鍵是看你怎麼看待和使用它。
我和一些程序員討論他們使用 Cursor 和 Devin 的體驗,發現在 Devin 能力還不夠強的時候,使用 Devin 對於大多數程序員的工作流是一個很大的轉變。因爲程序員自己懂得代碼如何運行,他們往往希望自己能夠掌控全局,所以這個時候 Cursor 這樣的 Copilot 是一個更適合他們當前工作流程的方案。已經習慣了使用 IDE 工作的程序員,在有任務要完成時,需要和 Devin 對話、等待 Devin 工作然後驗收,這個過程並不那麼高效。他們更希望自己去修 Bug 或者寫代碼,如果你是一個很厲害的程序員,你可能不會願意必須帶一個能力有限的實習生。因爲現在的 Devin 還只是個實習生水平,培養實習生需要時間和耐心。
這個時候程序員可能會覺得,與其等你寫代碼,還要幫你解決問題,不如自己寫。我覺得在技術早期階段這是完全可以理解的,我們要從人的角度去看待這個問題。如果一個人犯錯誤,作爲管理者我們往往會比較有耐心,因爲我們知道人是會學習和成長的。今天指出他的問題,他可能就會記住,然後會有更多的動力去工作,通過培訓成爲不錯的程序員。
Devin 其實是可以學習的。但我們現在對於 AI 的軟件和產品還沒有建立起「它可以成長、可以學習、可以被管理」的預期。
所以當它出現問題時,很多用戶的反應就變成了「我買了一個 500 美金這麼貴的工具,居然也會出問題」,感到失望。因此在企業引入 Devin 這樣的產品時,對其期望值的管理變得很重要。包括 Devin 自己在文檔中也說明,它首先是做一些會安排給實習生做的事情,比如簡單的前端任務、修改 Bug、給前端加一個 Dark Mode 的開關之類的工作。
但是人類提出好問題的能力也是需要學習的。我經常看到有人提出「幫我寫個淘寶」「幫我做個微信」這樣的需求,這遠超出它的能力範圍。現在的 Devin 和所有 AI 產品一樣,會傻傻地接下這個任務說「好,我來幫你寫個淘寶」。這種情況下得到的結果肯定不會令人滿意。如何用好一個工具是需要學習的,現在還沒有到給什麼需求都能直接完成的程度,那樣就不是實習生而是神了。
隨着 Devin 能力的提升,以及對組織環境理解的加深,我相信它會從實習生逐漸成長爲初級全職員工,然後變成資深全職員工,這需要一個接受的過程。
我覺得 Cursor 是在現有流程上的漸進式創新,它沒有讓程序員的工作發生翻天覆地的改變。但 Devin 是一個顛覆式創新的邏輯,這往往需要很多適應時間和不同的入職培訓過程。第一個產品可能未必能做到這一點,所以我並不覺得 Devin 就一定是最終答案。
很可能 Devin 只是展示了未來 AI 產品的一種形態。我們要真正學會適應、使用 AI 型的產品,就像適應 SaaS 這個概念、適應遠程辦公這樣的分佈式工作概念一樣,都需要很長的時間和合適的契機。所以我覺得它在方向上給了我們很大的指示,但現在還是實習生水平。在這個過程中指出它的問題很容易,但更重要的是它提出了這樣一個未來的方向,從這裡得到啓發去做更好的 Agent 纔是關鍵。
Koji:這就像半杯水的理論,有人從半杯水裡看到的是價值,有人看到的是問題。就像我們剛纔討論 Devin 完成「尋找十個頂級 VC 的 Manifesto」這個任務時,它知道如何在 Accel 官網沒有相關背景的情況下,從新聞稿中找到這些內容。這是一個巨大的亮點,它會設定任務、會反思、會自檢查。另一方面確實也存在很多問題,比如它做出來的網頁非常不美觀。但看到亮點而不是問題,看到未來的可能性而不是當下值得批評的點,這讓我想到:批評者往往感到正確,但只有建造者雖然看上去笨拙,卻更有可能會成功。
這讓我想到王慧文說過的一句話:如果你相信一件事情終究會發生,那就每隔三年做一次。Agent 從人類有科幻開始就一直被認爲會出現,也時不時會有人去嘗試。而在看到 Devin 之後,感覺這可能是我們最接近成功的一次。
我們再來聊聊 2025 年。整個 2024 年,雖然我們的討論也挺樂觀,但整個大環境時不時會出現各種悲觀的論調。我尤其記得在第二、三季度的時候,整個語境都在討論 AI 的 PMF 究竟在哪裡,看上去這一波 AI 落地比預期要難。
現在站在 2025 年的開端,有一個非常簡單的 Yes or No 的問題:雨森你對 2025 年是樂觀的嗎?
雨森:我其實還是很樂觀的。
第一,AI 應用找 PMF 這件事本身就不應該期待它那麼快。我經常打個比方,雖然很多人把 ChatGPT 的發佈與 iPhone 發佈做對比,說 AI 來到了 iPhone 時代,但我始終認爲它代表的是一個黑莓時代。
黑莓時代和 iPhone 時代有什麼區別?黑莓時代可能很多聽衆還沒有用過黑莓,這屬於我們 80 後的記憶。在 iPhone 發佈之前,智能手機的形態很不統一,因爲那時技術還比較早期,發展也比較分散,大家沒有找到一個收斂的路徑。這導致很多事情想做但做不到,技術本身也很貴,沒有統一的開發標準和產品標準,開發者也比較少。所以在那個時候,想做移動互聯網上真正火的應用,比如抖音是很難做出來的。我反覆提到過這個觀點:在黑莓時代做不了抖音。隨着技術進步,從黑莓時代到 iPhone 時代會解鎖更多的應用機會。
iPhone 出現之後,首先技術發展足夠好了,很多應用從「想做」變成「能做」,包括它有好的攝像頭、好的屏幕、好的處理器。其次技術變得標準化,iPhone 發佈之後,手機都長了一個樣子,大家發現技術方向收斂了。同時也誕生了更多的開發者,因爲開發變得容易,技術也標準化和便宜了,大家更理解了,所以 iPhone 時代誕生了大量的應用。
在 ChatGPT 剛出來時,我們也發現很多事情想得到做不到。比如 Agent 就是個典型的例子,2023 年上半年有個嘗試叫 AutoGPT,它提出了很多很好的概念,也是用語言模型先做計劃,然後去檢查完成情況並迭代。但那時的模型太多幻覺,很難有效使用工具,也很難有效瀏覽網絡,所以根本做不到。這是個典型的「在黑莓時代做抖音做不出來」的例子。
現在隨着 Agent 在推理能力、編程能力、工具使用能力上的進步,Agent 的樣子就更加有模有樣了。雖然還有很多缺點,但至少已經達到實習生水平可用的第一步。這是技術進步解鎖更多應用機會的典型例子,我相信這是一個最終會把我們從黑莓時代帶到 iPhone 時代的例子。
從 ChatGPT 出現到現在這兩年,我們看到了巨大的進步,這讓我很樂觀。僅僅兩年時間,AI 編程就從 ChatGPT 的「你問我答」變成了 Devin 的「你問我做」和 Cursor 的「你問我寫」,帶來了非常大的進步,這個速度其實很快。
第二,很多時候 PMF 是來自於技術本身的進步。比如 Cursor 這個產品其實在 2023 年就出現了,但當時它提出的預測下一個行動,需要更強大的模型去進行預測並寫出更好的代碼。可以說是 Sonnet 3.5 的出現造就了 Cursor 真正能夠完成它要做的事情。Sonnet 3.5 激活了 Cursor 想要交付的產品體驗,同時 Cursor 的普及也讓 Sonnet 3.5 迅速成爲 AI 編程領域最受歡迎的模型,這是個互相成就的關係。
同樣,Devin 這樣的產品要成功,也需要模型在推理、工具使用這些能力上的提高。Sonnet 3.5 或者 GPT 4o 現在可能還不足以把它做好。所以 Devin 這個產品形態可能需要一個更先進的模型去激活它,這個模型可能是 o1、o3 或者是 Anthropic 的其他新模型。這是一個產品等待模型激活,然後讓模型得到廣泛使用的互惠過程,所以這個階段確實需要技術和模型本身的進步。
我們剛剛經歷的移動互聯網成熟期有個特點是產品非常容易使用。比如抖音動動手指就可以了,微信、小紅書都很容易上手。但當我們來到一個技術的早期,要用好一個產品是有門檻的。大家可以想想最早的智能手機、個人電腦、互聯網,其實都需要學習才能使用。
現在很多人使用 AI 時遠遠沒有把產品裡的智能提取出來。現在的大模型,不管是 OpenAI、Claude 還是 Kimi,其實模型裡都已經壓縮了大量的知識和智能。但我們有沒有學會正確地使用它,高效地提問,高效地提取模型裡的智能。
我認爲大部分人還沒有學會,包括我自己。我一直都在發現原來模型能夠爲我做這樣的事情,回答這樣的問題。所以在這個過程中,我們經歷了從易用產品的移動互聯網時代到需要學習使用的深度 AI 時代。
這個時候大家一開始體驗會有點挫敗感,覺得產品有點難用,這就是技術早期的特點。很多時候應用已經可以做很多事情了,只是我們還不太會用,還沒有變成一個好的提問者或者好的管理者。
這些都需要學習,或者說需要等模型能力越來越強時幫我們做這些事情。到那時可能我們又會進入到一個產品應用期,但現在產品還處在和我們磨合的階段。
Koji:所以大家要在嘗試的過程中瞭解邊界在哪裡,以及邊界現在如何不斷拓展。我想補充一下,除了剛纔提到的技術和模型的新進步所解鎖的新機會,尤其在 Agent 這個領域,還有第四個方面。
在上一期「十字路口」,我們討論 OpenAI 12 天發佈會時,嘉賓大聰明提到,這次發佈會其實有一些重磅內容沒有公佈,是出於 PR 考慮或是不想讓競爭對手過度關注。其中有一個對 Agent 至關重要的點,就是現在 OpenAI 輸出的 Function Call 以及結構化輸出的能力,能夠讓 Agent 得到更加精確的指令。這一點之前可能被忽略了,但說出來後非常合理。
再看 2025 年,雨森你認爲什麼樣的應用方向比較容易落地?這也是現在創業者非常關注的方向。
雨森:從過去兩年比較容易落地的方向來看,我覺得有幾個。
第一個是能幫客戶賺錢的。如果你的技術還不夠完善,但能直接幫我賺錢,或在商業化流程中直接提高效率就變得很重要。比如說像 Midjourney,它有幾億美金的年化收入,其中約一半收入來自廣告類需求,就是用它去生成商業用途的圖像來投放廣告。這是一個很實在的場景,我本來做這些廣告就是爲了賺錢,現在能夠更快更好地製作廣告內容。比如 HeyGen 主要也被用於營銷場景,大家用它來製作宣傳型的視頻廣告內容。所以首先,能幫客戶賺到錢的技術,在早期階段大家就願意花時間去使用、去琢磨。
第二個是能夠在重要任務上提高十倍以上生產力的。因爲一個好的技術,如果只提高 50% 的生產力,那其實大家可能還會有很多阻力。一定是這個東西能帶來非常強的生產力提升,比如說像 Cursor、Devin 這種對程序員來說絕對是十倍生產力的提高。程序員花時間去找代碼庫可能就得花很長時間,所以大家使用它的動力纔會變得非常強。
再比如 Perplexity 這樣的 AI 搜索引擎,對於傳統搜索引擎來說,它也是個十倍生產力的提升。因爲原來我要找 Koji 資料,得去搜索很多內容,要看十幾二十篇 「新世相」的文章。現在我只要去問它,它會幫我去看這幾十篇網頁然後進行總結。所以在信息收集提問類的問題上,比搜索引擎要高出十倍以上的效率。這種產品比較容易找到產品市場契合度。
第三點就是滿足人性基本需求,比如說 NSFW 內容,大家也都看到了很多這樣的場景。整體來說,要麼能賺錢,要麼能幫我提高非常高的效率,這兩個能實現一個就非常好。
Koji:那有什麼樣的應用方向是你覺得大家要稍微迴避一下,做起來有點難度的?
雨森:在移動互聯網裡,很多贏家都是「殺時間」的應用。在中國,大家習慣了做一個用戶粘性很高的應用,用戶在上面花很多時間,然後通過投放廣告賺錢。字節、小紅書、快手都是這個範式。這是移動互聯網已有的範式,因爲它是一個新設備,讓用戶原來無法上網的時間變得可用,是一個從零到一的邏輯。
現在當抖音這樣的應用已經佔用我們大量時間的時候,如果 AI 應用一開始就要和這些成熟玩家比拼「殺時間」,就會遇到競爭對手已經非常強大,並且已經佔據大部分時間的情況。這時再做「殺時間」的應用是很難的。
最後能落地的只有相對小衆、面向特定人羣的產品。而針對普通用戶的 AI 陪伴聊天很難比抖音這樣的視頻更有吸引力。與巨頭搶時間的應用要謹慎。
第二,改變物理世界還是比較難的事情。我們剛纔說到 AI 寫代碼、AI 使用工具都還是在數字世界裡。在數字世界裡 AI 可以做很多事情,但在物理世界,AI 現在連拿起一個杯子這樣基礎的動作操作還是比較難的。
雖然我們現在看到人形機器人非常火爆,但在這個方向上,技術的實現路徑以及如何擴展模型的數據,還都是開放性問題。在未來三五年內,要改變物理世界的應用還會遇到很多挑戰。
第三,這兩年有不少設備想要替代手機,比如 Rabbit、Humane 這些。他們強調要做一個替代手機的產品,包括現在大約有 100 個團隊在做智能眼鏡。我的看法是,如果你做的場景是手機已有場景中的一個,比如打電話、搜索周邊信息、聽音樂等,那替代手機是非常難的事情。
目前來看,能與手機共存的硬件,基本都是在做手機完全做不到的事情。比如無人機可以飛,智能手錶可以戴在手腕上,智能戒指可以套在手上,或者像 Insta360 可以在運動場景下使用。但像 Humane、Rabbit 這些產品,其實都是在做手機已經做得很好的場景。這時用戶的切換動力非常小,因爲手機在大多數場景下已經至少能做到 80% 的程度。除非你做的這個產品好很多很多,或者是手機根本不能做的事情,否則要替代手機會很難。
我覺得 2025 年我們可以看到特別多的 Agent 產品出現。這裡面很多會遇到一個挑戰:當你要對組織做出很大改變時,能否實現這樣的改變。比如 Devin 就面臨着要改變程序員的工作方式,從自己寫代碼變成指揮別人寫代碼。這種工作流的改變對很多組織來說都有很多阻力,尤其是在大公司裡。
我們發現,在大公司推行 AI 還牽扯到很多數據權限、隱私安全等問題。如果要改變工作流,很多人的工作都會發生變化,那就會有更大的難度。所以我覺得要對組織做出很大改變,除非你能顯著提高生產力,讓組織有不得不用的理由,或者針對中小型企業去做。否則針對大組織做大改變,很多時候面臨的是人性的壁壘,而不是技術的壁壘。
07
2025 展望:Agent、個性化服務與超人類水平的突破
Koji:我們剛纔聊到,技術的解鎖帶來了一些新的機會,討論較多的是模型的推理能力、幻覺降低、計算機使用能力所帶來的 Agent 機會。除此之外,還有哪些技術的解鎖你認爲在 2025 年可能帶來浪潮式的 AI 創業機會?
雨森:我自己總結了幾個 2025 年可能帶來浪潮式 AI 創業機會的技術解鎖方向:
第一是 Agent。我們剛纔討論過,未來會出現針對各個領域的 AI 產品。它們會借鑑 Devin 的思路,做異步的工具使用,按工作量收費。
在美國,有人把原來的 SaaS(Software as a Service)反過來叫「Service as Software」,即把服務變成軟件銷售,或者說是 sell work, not software,銷售的是工作結果而非工具本身。
2025 年可能會有很多這樣的嘗試,雖然很多會失敗,但也會有一些有意思的產品誕生。
第二是「Scalable Personalization(可擴展的個性化)」。回顧互聯網內容分發的發展歷程:先是門戶網站的「千人一面」,每個人看到的都一樣;然後是搜索引擎,針對關鍵詞提供個性化內容,但同樣的關鍵詞得到相同結果;再到以抖音爲代表的推薦算法,根據用戶背景信息主動推送感興趣的內容。
現在,我們在思考更進一步的個性化:如果用戶想看的內容還不存在,就爲他生成。比如 Sora 這樣的視頻生成技術,就是要按照個性化需求生成內容。最近增長很快的應用 bolt.new 和 Windsurf,都是通過文本 Prompt 生成個性化網站。在軟件開發領域,未來可能不再是像微信、抖音這樣的「好萊塢大片式」集中化開發,而是爲每類用戶提供更個性化的軟件 / 內容體驗。
Google 的 NotebookLM 也體現了這種趨勢。比如播客內容,現在我們只能聽到已經錄製的對話,但未來可能通過 AI 生成任意兩個人關於特定話題的對話。隨着 AI 能力提升,我們使用的軟件、消費的內容都將變得更加個性化。
第三是 在 o3 中我們能看到 AI 能力從「普通人水平」進化到「超人水平」。早期的 MMLU 等測試還在評估 AI 是否達到普通人水平,現在已經轉向針對精英人類的 Benchmark,如面向程序員的 SWE-bench、美國高中數學競賽 AIME、PhD 資格考試 GPQA 等。在 2024 年初,o1、o3 等先進模型在這些測試中已經達到了 80 分左右的水平。
我們現在需要建立超人類水平的 Benchmark,比如陶哲軒背書的 FrontierMath。o3 最近在 Codeforces 上獲得 2700 分,這是全人類僅有 130 多人達到過的水平。這意味着 AI 在科學研究、前沿探索方面將發揮重要作用。
我看到 o3 出來之後,有人詬病說它做一個任務需要花很多錢,算力消耗很大。但 o3 的高算力模式本來就不是給普通任務用的,它的定位是解決人類前沿最難的研究和探索問題。這個東西貴是很正常的事情。
其實我們以後會發現 AI 模型在日常任務和前沿研究上可能會有分叉。就像「生活大爆炸」裡面的 Sheldon,他是個很厲害的科學家,但日常任務一塌糊塗。有的 AI 模型就更像 Sheldon,去解決前沿探索的問題;有的就像價廉物美的 o3 mini,主要用來幹活的,可能就像一個程序員;還有更加簡單的模型,就是爲了回答一些端側的簡單問題,比如說今天天氣怎麼樣這樣的日常需求。
在這裡,我們既可以看到日常需求被越來越高效便宜地解決,也能看到在真正的前沿研究裡,AI 跟科學家一起協作,爲人類獲得新的進展,從而產生新的知識。這一點讓我覺得非常興奮。
Koji:今年在多模態方面還有一個較大的突破。除 4o 實時語音外,還有一點被 OpenAI 發佈放在一個不太起眼的角落,但卻被認爲是 12 天來最值得關注的成果之一,即他們的多端到多端的多模態互動。你認爲多模態在明年會帶來哪些值得期待的創業機會?
雨森:第一重要的是 AI 怎麼理解這個多模態的世界。
對於文本來說,比如「今天天氣很好」這幾個字,是一個非常簡單的句子,但它裡面蘊含了大量需要看到才能理解的東西,所以一圖勝千言。
圖片和影像中包含的信息特別多。如果 AI 不能充分理解這些信息,它的智能就會有很大的缺陷。現在的 AI 就像一個瞎子,雖然瞎子也可以解很厲害的數學題,這可能並不妨礙什麼,但要具備更完整的智能,多模態的理解能力確實很重要。
OpenAI 和海外的先進研究者普遍認爲生成能力可能不是最重要的,所以 Sora 現在獲得的資源相對比較少。在美國,多模態的生成是個相對平行的路線,因爲它的落地場景主要是娛樂內容和內容生產,所以跟 AGI 似乎還是有些距離。像 Anthropic 這樣的公司因爲不做多模態生成,他們認爲靠文本、代碼和 API 就能實現 AGI,這是不同的觀點。
關於多模態這個話題,我覺得 NotebookLM 給我們一個很好的啓示:如何把一個模態的內容轉換到另一個模態進行消費。
比如說我們原來做 TTS,是把文本直接轉成語音,但把文本轉成播客,不是簡單地把它讀出來就完了,那隻能叫讀書。播客需要把內容變成更適合在音頻模態消費的形式。同樣,從文本到視頻也是如此,我們把《三國演義》拍成電視劇,不是簡單地還原,而是需要藝術改編。視頻到文本、視頻到聲音也是這樣。在不同模態之間自然轉換,並在每個模態中創造最適合該模態消費的內容,這是一個很令人激動的過程。
假設我喜歡刷抖音,那我能把《三體》變成適合抖音消費的內容,或者變成適合播客消費的內容,這在內容消費上會帶來很多機會。
更進一步說,大家認爲多模態的生成和理解對具身智能會有很大幫助。我們看到很多前沿研究,比如最近的 Genesis 項目,研究如何實現對物理世界的模擬,以及機器人如何操作現實生活中的物體,這些都是很有意思的研究。不過這個領域我最近研究得相對較少。
總的來說,多模態之間的轉換確實是一個非常重要的方向。就像你提到的 Gemini 2.0,它能夠高效理解接收到的視頻信號。這帶來一些很直觀的應用場景,比如在生活中,有很多東西我們看到卻不會用,但如果它的視頻生成能力夠強,就可以直接在視頻畫面上疊加使用指示。比如我們之前跟 Google 的研究員討論過這樣一個場景:我家有個咖啡機,把手機對着它,視頻流裡就會直接疊加一個「按這個按鈕開始煮咖啡」的視頻提示。這個提示視頻是生成的,但會疊加在現有視頻上。這些都是很有意思的想法,但目前可能還需要技術進一步提升。
08
AI Native 應用:等待深度技術擴散後的新商業模式
Koji:我覺得 2025 年很可能會看到這樣的應用出現,包括它和 AI 硬件的結合。比如之前看到一個 demo 是帶着 AI 眼鏡打網球,它可以給你實時指導,告訴你對面球過來時如何調整姿態和接球方式,幫助你更好地提升水平。
關於多端到多端,我想再多說一點,這是我最近感到非常驚喜的發展。就像上一期「十字路口」節目中嘉賓提到的,在 12 天發佈會上,這項技術雖然發佈了,但被放在一個不起眼的角落。他認爲這其實是最值得關注的突破。OpenAI 爲了避免被競爭對手關注,選擇低調地透露這一信息。不過在開發者羣體中,他們還是在一些重點開發者那裡進行了一對一的推廣。
這項技術的特別之處在於可以同時接收多模態輸入,並同時輸出多模態內容。而且這種輸入和輸出是多端到多端的。大家知道端到端的概念,那麼多端到多端其實是端到端在級別上的幾個層次躍升。
另外還想問問雨森一個很有意思的問題,這應該是所有人都關注的:你認爲 AI Native 應用的大機會可能會是什麼樣子?
雨森:首先我覺得大機會的出現,應該是在深度 AI 技術擴散之後。如果現在使用的還是小衆人羣,那大機會可能還沒有顯現。讓我們覆盤一下歷史上互聯網原生應用和移動互聯網原生應用的出現過程。
第一步是隨着技術擴散,用新技術解決老問題。比如互聯網時代,我們有電子郵件解決通信問題,有門戶網站解決看新聞的問題,有自營電商解決賣貨的問題。但隨着互聯網進一步擴張,當人們都上網後纔出現了社交網絡;信息都上網後,纔出現了搜索引擎的必要性;當買家、賣家、支付和物流都建設完善後,纔出現了平臺電商。這些平臺電商、社交網絡、搜索引擎纔是真正的互聯網原生應用,而且都是創業公司做的,最終佔據了最大的市值。
移動互聯網原生應用也是類似,當移動互聯網(包括智能手機硬件和 4G 網絡)普及後,內容生產者和消費者都用上了智能手機,纔會出現抖音、快手、小紅書這樣的移動互聯網信息平臺。當藍領工作者都用上智能手機後,才能誕生美團外賣、滴滴這樣的應用;當遊戲玩家都用上手機後,才能出現米哈遊和王者榮耀這樣的移動互聯網原生遊戲。
AI Native 應用的出現應該也會遵循類似邏輯。首先可能是像 ChatGPT 這樣的應用,讓每個人都有了 AI 助手,但它的擴散規模還需要更大。當我們每個人都有了自己的 AI 助手,用 AI 解決工作中的很多問題,甚至像現在這樣開會,就會產生新的可能。
這時 AI 與 AI 之間的互動會產生什麼樣的結果?比如在一個公司裡,如果大部分工作執行都由 AI 來完成,那麼對生產力、對企業服務軟件可能產生巨大變化。因爲你不僅要執行,還要管理這些 AI,爲它們下達任務、進行任務拆解。這些可能是人類完全做不到的,因爲人沒有那麼多注意力和精力。
另外一個重要主題是 AI 時代的商業化方式。在移動互聯網和互聯網時代,大量商業化都是通過廣告進行的。但當你用 Kimi 或 Perplexity 問問題時,原來搜索引擎裡的廣告、網頁上的廣告都不會被看到,因爲是 AI 幫你看了這些網頁。這就需要重構價值獲取方式。我從 AI 那裡得到答案的價值該如何提取?原來廣告是給人看的,但 AI 看到廣告就會把它們過濾掉。所以對廣告商業模式的顛覆,也會帶來很多 AI Native 應用的機會。
Koji:我們最後一個問題,就是在 2025 年,真格基金和你最感興趣的投資方向會有哪些?尤其是這裡面有沒有一些是行業的非共識,是你們差異化的觀點?
雨森:我們的差異化觀點主要有三個方面:
第一,我們對「殺時間」類應用會比較謹慎。現在很多人都在按照字節跳動的經驗去找下一個字節跳動,尋找一個耗時高、靠投放起量的 To C 應用。但我覺得當用戶時長已經被字節佔用這麼多的情況下,下一個殺手級應用未必會以這種範式出現。也就是說,下一個字節跳動可能不會長得像字節跳動。
第二,相比當下對人形機器人的熱情,我們保持相對冷靜。我們看到很多人形機器人本體公司獲得了大量融資,但通用型人形機器人的技術路徑,無論是 Sim-to-Real、從視頻角度訓練...