大模型迎落地元年 瀾舟科技周明提出成功“九字訣”

21世紀經濟報道記者白楊 北京報道

在AI領域,周明是公認的“大牛”。從1999年加入微軟亞洲研究院,到2020年離開,他在微軟工作了21年。期間,他帶領團隊進行了微軟輸入法、必應詞典、中英翻譯等重要產品和項目的研發,並對微軟Office、必應搜索、Windows等產品中的自然語言技術做出了重要貢獻。

所以在創業前,周明身上已經冠有諸多榮譽,比如他是微軟亞洲研究院副院長,是國際計算語言學協會 (ACL)主席,是中國計算機學會理事,是中文信息技術專委會主任等等。而現在,他最重要的身份是瀾舟科技創始人兼CEO。

2020年底,周明隱約感知到大模型的發展勢頭,便毅然決然地離開了微軟,並於2021年6月創辦了瀾舟科技。僅過了一年半,ChatGPT就橫空出世,大模型賽道成爲風口,周明也成爲了中國大模型的先行者。

去年3月,瀾舟科技發佈了孟子大模型GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公衆開放。

3月18日,瀾舟科技在北京召開了大模型技術和產品發佈會。會上,周明表示,以大模型爲代表的人工智能正在重塑人類的未來,而2024年將是大模型落地元年。

之所以做出這樣的判斷,周明稱,“一方面是過去一年,大模型發展得非常好,已經具備了落地的能力,另一方面,是企業的降本增效,做了很多數據也積攢了很多業務落地場景”。

大模型落地“九字法則”

在瀾舟科技成立之初,周明就明確了公司的業務方向——以ToB爲主,ToC爲輔。他認爲,大模型在中國的最大應用前景是在企業的服務機會上,而不是寫詩作詞。“我們應該利用國家發展大勢,通過落地創造價值,拉動創新,而不是單純地去追趕美國,OpenAI在幹什麼我們就去幹什麼。”

不過周明也表示,雖然今年是大模型落地元年,但並不意味着遍地是黃金,因爲還有很多環節沒有跑通,很多地方沒有開拓出來。

最近幾天,周明一直在思考,大模型落地的成功秘訣是什麼。他想到了雷軍提出的互聯網創業七字法則——專注、極致、口碑、快。他覺得,這七字法則也適用於大模型,比如企業一定要專注,要想清楚做什麼和不做什麼;企業也要做到快,快速研發、快速實施和快速部署。

在此基礎上,周明認爲還需要加上兩個字——“成本”,這樣纔是大模型落地的九字法則。“大模型創業不能不在意成本,一定要有造血的能力。無論是在研發、商業活動,還是交付的時候,每一個環節都要注重成本問題。”周明說道。

實際上,大模型的訓練和部署成本問題也是阻礙很多企業應用大模型的重要原因。動輒上千萬的模型費用,企業很難接受,但對大模型廠商來說,訓練成本如果降不下來,也不可能把部署成本降下來。

針對成本問題,瀾舟科技對102家企業進行調研發現,雖然大模型是越大越好,但是,企業對於大模型的需求主要就集中在語言理解能力上,包括意圖理解、多輪對話、文本生成、機器翻譯等。

所以在ToB場景,只要能把這幾個能力做到極致,企業就會買單。“那多大的模型可以滿足這些能力需求?我們發現百億到千億之間就足夠,再大一點確實效果會更好,但ROI就沒有那麼明顯了。”周明說。

因此,瀾舟科技目前在做的,就是專注把參數量爲7B、13B、40B最高到100B的這些ToB場景使用最多的LLM模型做到最佳並大幅度提升大模型的推理效率。

“一橫N縱”體系

發佈會上,瀾舟科技也公佈了自己的“一橫N縱”體系。其中,“一橫”是指孟子大模型技術,“N縱”則是基於孟子大模型推出的ToB技術和產品。

在大模型技術方面,周明表示,近期,瀾舟科技已經完成了Mengzi3-13B的大模型訓練,並且3月30日,Mengzi3-13B的模型將在GitHub、HuggingFace、魔搭和始智AI社區開源。

值得一提的是,瀾舟科技訓練孟子V3背後,離不開總規模爲3T tokens的Mengzi-3數據集,該數據集包含了網頁、代碼、書籍、論文等高質量數據來源,相當於上一代數據集的2.7倍,且整體數據質量也提高了很多。

此外,瀾舟科技合夥人、首席產品官李京梅對外公佈了瀾舟的一系列應用能力型產品,包括AI文檔理解、文檔問答、文檔輔助寫作、機器翻譯、瀾舟智會、AI搜索。

談及大模型落地,周明一直強調,創新和落地是相輔相成的,不要一味地創新或者一味地落地,而是要把這兩者聯繫在一起,讓它快速迭代。

同時,周明還表示,大模型落地需要生態來助力,“一個團隊或一個公司無論多強大,也不可能把所有事情做好,需要跟其他公司多多合作,共同營造一個良好的生態環境,在這樣的環境下,大家才能都得到發展的機會。”