☰

李開復闢謠「掉隊」傳聞，零一萬物推「白菜價」頂級模型

AI新浪潮觀察

9min read

宛辰 2024/10/21

摘要

AI「六小虎」分野，零一萬物的牌面

大模型發展到現在，我們應該關注什麼？

像 OpenAI o1 這樣的技術新範式是其一；像 canvas、NotebookLM 這樣的產品新思路也是；還包括用戶、客戶營收這樣的商業化指標。

目標多元，但資源有限。

進入 10 月，國內的大模型創業公司「六小虎」（月之暗面、Minimax、百川智能、智譜 AI、零一萬物、階躍星辰）開始在不同的道路上做出選擇。

10 月 16 日，繼千億參數模型 Yi-Large 之後，零一萬物正式對外發布新旗艦模型 Yi-Lightning，在國際權威盲測榜單 LMSYS 上，Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet，排名世界第六，中國第一。

在國際權威盲測榜單 LMSYS 上，Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet，排名世界第六，中國第一。｜圖片來源：零一萬物

對此，零一萬物創始人李開復稱 Yi-Lightning 是「頂級模型白菜價」，這是當前 AI 領域最需要的。他表示，「Yi-Lightning 和馬斯克的 xAI Grok 打平，並列第六名；同時也是全球第三的中國大模型企業，排在零一萬物之前的模型基本只有 OpenAI 和 Google」，這是中國大模型首度實現的最佳成績。在推理速度和價格上，Yi-Lightning 的最高生成速度提速近四成，每百萬 token 僅需 0.99 元，且該定價仍有利潤。

李開復透露，這次預訓練只用 2000 張 GPU 訓練一個半月，只花了 300 多萬美金，做出來的預訓練模型跟 Grok 打平，只花它的 1% 或 2% 的成本。

進入 2024 年，鮮少有發佈會只展示模型能力本身，AI 落地的產品、場景、客戶案例等都成爲外界關注的重點。會上，零一萬物也首度公佈了全新 ToB 戰略下的首發行業應用產品 AI 2.0 數字人，聚焦零售和電商等場景。

對於 ToC 產品及海外進展，本次發佈會上未作披露。今年 5 月 Yi-Large 的發佈會上，零一萬物預計今年營收預計可達 1 億人民幣。

李開復在朋友圈闢謠｜圖片來源：網絡

早在 5 天前，李開復已在朋友圈迴應了停止預訓練的傳言，並在知乎上談到了他對大模型接下來將如何洗牌的思考。今天 Yi-Lightning 的發佈進一步回擊了傳言，李開復也進一步聊到了當前大模型競賽中的幾大爭議。以下是他的思考，經極客公園整理：

01 六小虎分野之 01 萬物的牌面：「頂級模型白菜價」

問：模型做到「世界第六，中國第一」，同時以較低的價格推向市場，如何實現的？

李開復：零一萬物在 Yi-Lightning 的定價上並沒有虧本。

成立第一天起，零一萬物同時啓動了模型訓練、AI Infra、AI 應用三大團隊，三個團隊成熟後，再對接到一起。零一萬物將這一模式總結爲模基共建、模應一體兩大戰略。AI Infra 助力模型訓練和推理，以更低的訓練成本，訓練出性能領先的模型，以更低的推理成本支撐應用層的探索。

我們不會賠錢賣模型，但也不會賺很多錢，而是在成本線上加一點點小小的利潤，就得到了今天 0.99 元/百萬 token 的價格。

挑選模型 API 最重要的一點，是模型性能一定要優秀，在這個前提之下才去挑最便宜的，我相信，綜合 Yi-Lightning 的模型質量和價格來看，Yi-Lightning 很可能是很多開發者最認可、最高性價比的模型。

問：零一萬物首次公佈 ToB 相關矩陣，未來會進一步在 ToB 方向深耕嗎？

李開復：在國內，大模型 ToB 相對於 AI 1.0 時代有不同的打法，首要任務就是要尋找少數能夠按使用情況收費的方法，而不是項目定製的方法。能得到比較高利潤率的訂單再去做。

今天零一萬物推出的 AI 2.0 數字人解決方案不是做一單賠一單的做法，它專注到用戶重大的痛點需求和盈利點，也就是一個店長或 KOL 平時做一次直播浪費最重要的資源——他的時間。這個時間就算做一小時直播能賺到一千塊錢，也就是這一千塊錢，但如果用數字人直播就不是一小時了，可能可以做一千個小時（直播），哪怕每一個小時只能賺一半的錢，一千個小時還是可以賺五百倍的錢，這樣賬就很好算了。

如果真的能把數字人做到端到端，只要輸入公司內部的東西，選一個形象、聲音按一個鈕就開始直播，等於賣給這個企業一個印鈔機，印鈔機要收租賃費就可行。除了直播以外，我們的 AI 2.0 數字人解決方案已經跑通了更多業務場景，比如 AI 伴侶、IP 形象、辦公會議等等。

整體來看，零一萬物 ToB 整體解決方案會採取「一橫一縱」的打法。先將單個行業做深做透，進而以自身技術能力和行業積累爲基礎，凝練出標準化的 ToB 解決方案，爲各行各業的企業客戶將本提效。

問：除了數字人解決方案，零一萬物是否還有其他 ToB 解決方案？

李開復：除了我們已經發布的 AI 2.0 數字人、API 之外，零一萬物目前還有 AI Infra 解決方案、私有化定製模型等其他 ToB 業務，我們會在近期正式對外發布，敬請期待。

問：零一萬物在海外推出 ToC 產品，國內陸續推出 ToB 產品，當前在 B 端、C 端的產品現狀如何？

李開復：一個大模型公司同時做 ToB 和 ToC 很辛苦，銷售方法、利潤的比例、需要多少投放纔會有收入等評估體系完全不同。也需要多元化的管理方式，因爲兩個團隊的基因不一樣，做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個領域有經驗，也在試着做，但也絕對不能什麼都做。

ToB 上，零一選擇做國內市場，是因爲找到了一些破局的空間，比如用數字人來做零售、餐飲等，能做一個完整的解決方案。另外還有兩三個領域開始在做，現在還不方便披露。ToB 不做海外市場，是因爲全世界的範疇裡，ToB 供應商基本都是當地的。選擇在國內做 ToB，還要選擇有利潤的解決方案做，而不只是賣模型、不只是做項目制，這是我們 ToB 的做法。

ToC 我們主要佈局海外。當我們開始做零一萬物時，國內還沒有合適的中文模型，只有在國外先嚐試，迭代了一個、兩個、三個產品，這些產品現在表現有些很好，有些沒有那麼好，在不斷地調整中。

我們也在觀察什麼時候適合在國內市場做什麼樣的產品，目前做 ToC 產品面臨一個很大的問題——流量成本越來越高。我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣，近來還有相當的流失，在這樣一個環境裡，我們會非常謹慎，先不推出中國本土新的 ToC 應用，同時已有的產品還會繼續維護，但更多的精力會在海外的土壤用更低的成本買到非常高質量的用戶，或者能直接把 App 賣出去，讓用戶來訂閱收費，那邊訂閱習慣相對成熟。

換句話說，現在現狀選擇在海外做 ToC 產品，變現能力和消耗用戶增長的成本算賬可以算得過來，以後再關注國內有什麼機會可以推出。

02一輪預訓練已降至 300 萬美金，「六小虎」都可以 cover

問：此前有消息稱 AI 方面的六小虎，某幾家放棄了預訓練。站在行業的角度，逐步放棄模型預訓練會成爲行業整體趨勢嗎？

李開復：做好預訓練模型是一個技術活，而且要非常多有才華的人在一起工作，慢工出細活。需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人、很好的算法同學，一起做出來。

如果一個公司能有幸擁有這麼多優秀的人才，能夠跨領域的合作，我相信中國絕對可以做出世界排名前十的預訓練的通用模型，但不是每家公司都可以做這件事情，做這件事情的成本也比較高，以後有可能會越來越少的大模型公司做預訓練。

不過據我所知，這六家公司融資額度都是夠的，我們做預訓練的 production run，訓練一次三四百萬美金，這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才，想做預訓練的決心，融資額跟芯片都不會是問題的。

03 AGI 的上限：o1 開啓推理層面的新範式，OpenAI 還藏着技術

問：今年 5 月份，Yi-Large 把中美頂尖模型的時間差縮短到六個月，這次 Yi-Lightning 發佈直接擊敗了 GPT-4o，把時間差甚至縮短到了五個月，零一萬物如何能繼續追趕縮短這個時間差？

李開復：縮短時間差非常困難，我不預測我們可以縮短這個時間差。因爲畢竟人家是用十萬張 GPU 訓練出來，我們用的是兩千張 GPU 訓練出來。

Yi-Lightning 的效果是因爲團隊和社區大家都熱心聰明去使用，去理解對方做出來的東西，再加上我們自己每家的研發有特色，比如數據處理、訓推優化等等，現在這一套方法論在零一萬物已經成熟了，我們有信心把自己的創新加上我們的一些特長，在關注 OpenAI 和其他公司發佈的新技術，儘快地去能夠了解這些技術的核心重要性，然後把它的能力在我們自己的產品裡面發揮出來。

我覺得這套方法保持在六個月左右，就已經是很好的結果了。如果期待破局，可能需要一個前所未有的算法纔有機會。我們千萬不要認爲落後六個月是一個很羞恥的事情，或者一定是要追趕的事情，因爲我很多海外朋友都認爲中國會遠遠落後，人家十萬張 GPU 等，我們要被甩掉三年、五年甚至十年都有可能，現在零一萬物證明了不會落後這麼多，而且這次 LMSYS 的榜單上也有其他兩家中國公司表現不錯。

問：OpenAI 的 o1 發佈後，從技術上帶來在推理側的 Scaling 新範式，你怎麼看？對初創公司會有哪些影響？

李開復：OpenAI 真的是很厲害的公司，在他們的員工交流時，他們說OpenAI 內部還有一些好東西，但是不急拿出來，因爲他們領先行業足夠多。這次他們把 o1 拿出來主要是因爲 GPT-5 訓練不順利，而他們需要融資，就先把 o1 公開，這是他們能做而別人不能做的。

OpenAI o1 雖然隱藏了所有中間的思考狀態，但是很多人還是在網上開始猜它怎麼做，我們認爲有一些揣測還是比較靠譜，所以當你發了一個新技術，這個技術被很多聰明人使用、揣測，我覺得五個月以後，應該也有不少類似 o1 模型的能力出現在各個模型公司，包括零一萬物。

o1 的思考模式是把之前只在預訓練中 scaling 的趨勢擴展到了推理，這件事情對行業是最大的認知的改變。過去大家覺得誰預訓練做好就夠了，慢慢大家發現後訓練 SFT 和強化訓練都是非常重要。

所以零一萬物的團隊剛開始做的主要是專注預訓練，之後又有很多很厲害的人加入，幫我們把後訓練也做出來，現在看來推理也很重要，感謝 OpenAI 點醒我們這一點，相信現在很多中美公司都在往 o1 方向狂奔。

*頭圖來源：視覺中國

本文爲極客公園原創文章，轉載請聯繫極客君微信 geekparkGO

零一萬物大模型人工智能

李開復闢謠「掉隊」傳聞，零一萬物推「白菜價」頂級模型

相關資訊