超越 GPT-4o 零一萬物Yi-Lightning 登世界第六 李開復:絕不放棄預訓練

10月16日消息,繼上半年千億參數模型 Yi-Large 之後,零一萬物正式對外發布最新旗艦模型 Yi-Lightning。在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中國第一。

零一萬物 CEO 李開復博士表示,Yi-Lightning 的出色表現是零一萬物“模基共建”戰略落地的又一里程碑。作爲兼具性能與性價比的新旗艦模型,Yi-Lightning 也將成爲零一萬物探索“模應一體”的重要基石。

“中國大模型產業進入到了“耐力賽”階段,如何讓大模型賦能千行百業,提升企業新質生產力是一個重要的命題。這不僅將牽涉到“大模型+行業”的未來發展方向,甚至會影響世界的創新版圖。”

我們注意到,這是在 LMSYS 這一全球大模型必爭的公開擂臺上,中國大模型首度實現“超越 OpenAI GPT-4o ”的最佳成績。在一衆國內模型中,Yi-Lightning 緊隨 OpenAI、 Google 之後,與xAI 打平,進擊全球前三大模型企業,居世界第一梯隊大模型公司之列。

作爲模型落地的典型場景之一,翻譯場景十分全面地考驗了模型語言理解和生成、跨語言能力、上下文感知能力,通過 Yi-Lightning 與Qwen2.5-72b-Instruct、DeepSeek-V2.5、Doubao-pro 的對比,Yi-Lightning 的模型性能也得到了最直觀的展現:

Yi-Lightning 在推理速度和推理成本方面同樣有所突破——較上一代旗艦模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成。在與 GPT-4o 的對比中,Yi-Lightning 的生成速度堪稱“極速”:

價格方面,仰賴於自研 AI Infra (AI基礎設施) 能力,零一萬物將最新旗艦模型 Yi-Lightning 的 API 價格降至極低水平,每百萬 token 僅收費0.99元。

據李開復介紹,經過一年多的沉澱,零一萬物的“模應一體”戰略在 ToB 領域內有了更直觀的體現。目前,零一萬物已推出了 AI 2.0數字人解決方案、全行業解決方案、AI Infra 等產品及服務,面向 B/G 端客戶構建起了從定製模型到專有應用搭建的一整套解決方案。

基於以 Yi Lightning 模型爲代表的 Yi 模型,零一萬物搭建起了包含角色大模型、直播聲音大模型、電商話術大模型在內的一整套專用模型基座,形成了與 AI 1.0時代完全不同的數字人解決方案。

其中,角色大模型爲零一萬物 AI 2.0數字人提供了動作訓練、表情生成等能力,直播聲音大模型使得數字人邁過了多國語言和情感表達的門檻,電商話術大模型則成爲了數字人主播的“AI 大腦”,負責鏈接知識庫,完成智能對話。

得益於零一萬物在文本理解、多模態方面的模型能力,搭載角色大模型與直播聲音大模型的零一萬物 AI 2.0數字人在形象更爲逼真、聲音也更貼合垂直場景的需求。

但與AI 1.0時代的數字人相比最爲本質的不同點在於,零一萬物爲 AI 2.0數字人配備了“AI 大腦”——在電商話術大模型加持下,數字人能夠基於模型自有知識庫與外接數據庫,自主生成直播話術,也能夠快速、精準地識別直播彈幕的互動意圖,給出對應解答。

除直播外,零一萬物也爲數字人客戶準備了 AI 2.0門店短視頻解決方案。客戶可通過極簡流程,隨時生成、超低成本和高品質營銷視頻視頻,解決了傳統真人短視頻的成本和製作週期問題。短視頻與直播內容相互配合,爲商品提供持續曝光,提升轉化率。

據披露,目前,零一萬物的 AI 2.0數字人解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個應用場景,合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等,均取得了顯著的GMV提升。其中某頭部酒旅企業在接入 Yi-Lightning 全新加持的數字人直播後,GMV 較此前上升170%。

不僅如此,截止目前,零一萬物 ToB 解決方案已在零售、醫療、教育、物流等領域內完成落地,涉及 AI 搜索、AI 生產力工具、AI 智能巡檢等應用場景。自今年6月開始,零一萬物相繼宣佈與阿里雲、360、順豐科技、飛書、釘釘、鈦動科技等企業達成合作,已積累起了一批包含世界500強企業在內的付費企業客戶。

據悉,Yi-Lightning 正式接入後,無論是標準化的全行業解決方案,還是更聚焦垂直領域的私有化定製業務,都迎來了更多可能性。

附李開復與媒體對談實錄精華:

問:模型做到“世界第六,中國第一”,同時以較低的價格推向市場,是如何實現的?

李開復:零一萬物在 Yi-Lightning 的定價上並沒有虧本。成立第一天起,零一萬物同時啓動了模型訓練、AI Infra、AI 應用三大團隊,三個團隊成熟後,再對接到一起。零一萬物將這一模式總結爲模基共建、模應一體兩大戰略。AI Infra 助力模型訓練和推理,以更低的訓練成本,訓練出性能領先的模型,以更低的推理成本支撐應用層的探索。我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤,就得到了今天 0.99 元/百萬 token 的價格。挑選模型 API 最重要的一點,是模型性能一定要優秀,在這個前提之下才去挑最便宜的,我相信,綜合 Yi-Lightning 的模型質量和價格來看,Yi-Lightning 很可能是很多開發者最認可、最高性價比的模型。

問:此前有消息稱,大模型“六小虎”(零一、智譜、百川、MiniMax、月之暗面、階躍星辰),其中某幾家放棄了預訓練。站在行業的角度,逐步放棄模型預訓練會成爲行業整體趨勢嗎?

李開復:做好預訓練模型是一個技術活,而且要非常多有才華的人在一起工作,慢工出細活。需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人、很好的算法同學,一起做出來。如果一個公司能有幸擁有這麼多優秀的人才,能夠跨領域的合作,我相信中國絕對可以做出世界排名前十的預訓練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以後有可能會越來越少的大模型公司做預訓練。不過據我所知,這六家公司融資額度都是夠的,我們做預訓練的 production run,訓練一次三四百萬美金,這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。

問:零一萬物首次公佈 ToB 相關矩陣,未來會進一步在 ToB 方向深耕嗎?

李開復:在國內,大模型 ToB 相對於AI 1.0 時代有不同的打法,首要任務就是要尋找少數能夠按使用情況收費的方法,而不是項目定製的方法。能得到比較高利潤率的訂單再去做。今天零一萬物推出的 AI 2.0 數字人解決方案不是做一單賠一單的做法,它專注到用戶重大的痛點需求和盈利點,也就是一個店長或 KOL 平時做一次直播浪費最重要的資源——他的時間。這個時間就算做一小時直播能賺到一千塊錢,也就是這一千塊錢,但如果用數字人直播就不是一小時了,可能可以做一千個小時(直播),哪怕每一個小時只能賺一半的錢,一千個小時還是可以賺五百倍的錢,這樣賬就很好算了。如果真的能把數字人做到端到端,只要輸入公司內部的東西,選一個形象、聲音按一個鈕就開始直播,等於賣給這個企業一個印鈔機,印鈔機要收租賃費就可行。除了直播以外,我們的 AI 2.0 數字人解決方案已經跑通了更多業務場景,比如 AI 伴侶、IP 形象、辦公會議等等。整體來看,零一萬物 ToB 整體解決方案會採取「一橫一縱」的打法。先將單個行業做深做透,進而以自身技術能力和行業積累爲基礎,凝練出標準化的 ToB 解決方案,爲各行各業的企業客戶將本提效。

問:除了數字人解決方案,零一萬物是否還有其他 ToB 解決方案?

李開復:除了我們已經發布的 AI 2.0 數字人、API 之外,零一萬物目前還有 AI Infra 解決方案、私有化定製模型等其他 ToB 業務,我們會在近期正式對外發布,敬請期待。

問:零一萬物在海外推出 ToC 產品,國內陸續推出 ToB 產品,當前在 B 端、C 端的產品現狀如何?

李開復:一個大模型公司同時做 ToB 和 ToC 很辛苦,銷售方法、利潤的比例、需要多少投放纔會有收入等評估體系完全不同。也需要多元化的管理方式,因爲兩個團隊的基因不一樣,做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個領域有經驗,也在試着做,但也絕對不能什麼都做。ToB 上,零一選擇做國內市場,是因爲找到了一些破局的空間,比如用數字人來做零售、餐飲等,能做一個完整的解決方案。另外還有兩三個領域開始在做,現在還不方便披露。ToB 不做海外市場,是因爲全世界的範疇裡,ToB 供應商基本都是當地的。選擇在國內做 ToB,還要選擇有利潤的解決方案做,而不只是賣模型、不只是做項目制,這是我們 ToB 的做法。ToC 我們主要佈局海外。當我們開始做零一萬物時,國內還沒有合適的中文模型,只有在國外先嚐試,迭代了一個、兩個、三個產品,這些產品現在表現有些很好,有些沒有那麼好,在不斷地調整中。我們也在觀察什麼時候適合在國內市場做什麼樣的產品,目前做 ToC 產品面臨一個很大的問題——流量成本越來越高。我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當的流失,在這樣一個環境裡,我們會非常謹慎,先不推出中國本土新的 ToC 應用,同時已有的產品還會繼續維護,但更多的精力會在海外的土壤用更低的成本買到非常高質量的用戶,或者能直接把 App 賣出去,讓用戶來訂閱收費,那邊訂閱習慣相對成熟。換句話說,現在現狀選擇在海外做 ToC 產品,變現能力和消耗用戶增長的成本算賬可以算得過來,以後再關注國內有什麼機會可以推出。

問:今年5月,Yi-Large 把中美頂尖模型的時間差縮短到六個月,這次 Yi-Lightning 發佈直接擊敗了 GPT-4o,把時間差甚至縮短到了五個月,你覺得之後中美大模型如何縮短時間差?

李開復:縮短時間差非常困難,我不預測我們可以縮短這個時間差。因爲畢竟人家是用十萬張 GPU 訓練出來,我們用的是兩千張 GPU 訓練出來。Yi-Lightning 的效果是因爲團隊和社區大家都熱心聰明去使用,去理解對方做出來的東西,再加上我們自己每家的研發有特色,比如數據處理、訓推優化等等,現在這一套方法論在零一萬物已經成熟了,我們有信心把自己的創新加上我們的一些特長,在關注 OpenAI 和其他公司發佈的新技術,儘快地去能夠了解這些技術的核心重要性,然後把它的能力在我們自己的產品裡面發揮出來。我覺得這套方法保持在六個月左右,就已經是很好的結果了。如果期待破局,可能需要一個前所未有的算法纔有機會。我們千萬不要認爲落後六個月是一個很羞恥的事情,或者一定是要追趕的事情,因爲我很多海外朋友都認爲中國會遠遠落後,人家十萬張 GPU 等,我們要被甩掉三年、五年甚至十年都有可能,現在零一萬物證明了不會落後這麼多,而且這次 LMSYS 的榜單上也有其他兩家中國公司表現不錯。