迎戰大模型時代:Open AI、馬斯克、阿里都出新招了

Open AI要做生態,“蘋果化”。馬斯克治下的xAI要“瞭解宇宙到底發生了什麼”。阿里雲要做AI時代的基礎設施。這些都並非易事,引領潮流注定要面對不同的挑戰,克服不同的難題。

作者|週一圍

編輯|安心

當下,全球人工智能(AI)一日千里,在歷史的進程裡極速狂奔。出激動人心的時刻一波接着一波。

11月7日,宇宙最紅AI公司Open AI舉辦首屆開發者大會,吸引令全球科技界的關注。Open AI不僅發佈了多項技術升級,更是外露了打造生態的野心:構建GPTStore,走向“蘋果化”。

Open AI創始人Sam Altman在開發者大會演講

11月4日,宇宙最紅企業家馬斯克旗下xAI團隊發佈了首個AI大模型產品Grok。馬斯克稱表示,xAI的宏大目標是瞭解宇宙到底發生了什麼,且一定會與OpenAI展開競爭。

在10月31日開幕的雲棲大會上,人工智能、大模型、雲計算同樣是超級話題。在這次大會上,阿里巴巴新任董事局主席蔡崇信宣佈了一件對業界影響重大的事:阿里巴巴要打造AI時代最開放的雲。

蔡崇信表示,開放是希望讓大家開發AI、使用AI變得更加容易和便宜,幫助各行業,特別是中小企業把AI轉化爲生產力。

換句話說,在大模型時代,阿里雲要做的不是端到端的超級應用,而是迴歸公有云,扮演“水電煤”的角色,做AI 時代的基礎設施。

8年前的雲棲大會上,阿里巴巴董事局主席馬雲發表了激情澎湃的演講。他當時說,阿里雲的整個思想,就是把阿里巴巴積累的數據、計算能力以及雲的一切,分享給無數追夢者、無數創業者,能夠讓他們夢想成真。

那時,國內移動互聯網發展日新月異,阿里雲已是國內最大的雲計算平臺,重塑了開發者獲取計算資源的方式。

但他們有更大的野心:向金融、生命科學、新能源等更多領域拓展,成爲更多領域創新、提效的基礎設施。

圖注:2015年,阿里雲首次啓動大規模廣告,新的品牌廣告在各大機場上線。

彼時,阿里巴巴剛在美國上市不久,它不想侷限於做一家電商平臺,其業務版圖逐漸拓寬至文娛、雲計算、人工智能等。阿里雲的財務數據在2015年首次出現在阿里的財報中。在資本市場,阿里雲一度代表的是阿里巴巴第二增長曲線。

今年的雲棲大會有點“夢迴2015”的意思,阿里雲不僅再提開放,就連大會主題都用了2015年的同款——“計算,爲了無法計算的價值”。

當然,阿里雲也期待通過開放和生態,在AI時代再造高增長。

就在馬雲振臂高呼,宣佈“分享阿里雲的一切”之後,阿里雲持續吃到了“開放”帶來的紅利——營收連續12個季度翻倍增長;長期以近50%的份額在國內公有云市場排第一。

圖注:阿里財報中,2016財年Q1對應自然年2015年Q2,以此類推。

但從2019財年Q1起,阿里雲的增長神話開始褪色,之後就進入了持續放緩的週期。近幾個季度,阿里雲營收增速維持在個位數。

背後是行業大勢變了。上雲需求從移動互聯網逐漸向政企市場切換,加上疫情等因素,國內互聯網雲廠商都慢了下來。

2023年,大模型的爆發讓人工智能與雲計算曆史性地結合在一起,也爲算力體系帶來重構和創新的歷史機遇。阿里雲創始人王堅將這次結合視爲雲計算的第三次浪潮。

作爲國內收入規模和市場份額最大的雲廠商,阿里雲顯然希望再次抓住時代的大勢,繼續領先。

蘇格拉底說,人不能兩次踏進同一條河流。阿里雲卻要在“計算”這條大河裡,再次抓住歷史機遇。這並非易事,它註定要面對不同的挑戰,克服不同的難題。

“不開放就沒有未來”

今年以來,ChatGPT引爆了大模型,中國市場更是上演“百模大戰”。

據北京市經濟和信息化局的數據,截至今年10月,僅北京市就有百餘款大模型產品,佔全國總量的一半左右。意味着,國內大模型已經超過200個。

截至目前,國內有頭有臉的互聯網/科技公司、有名氣的創業者都推出了自家的大模型。百度和阿里雲屬於先行者。3月份,百度在全球互聯網大廠中首個發佈大模型產品文心一言;一個月後,阿里雲推出通義千問大模型。

在當時的發佈會上,阿里雲CTO周靖人說,所有軟件都值得接入大模型升級改造,阿里將開放通義千問的能力,幫助每家企業打造自己的專屬大模型。

但大模型到目前仍處在初級階段,一個基礎模型要真正用到實際場景裡,還需要很多二次開發,結合領域知識才能解決具體領域的問題。

從需求端看,企業通過自研或者與第三方模型服務商合作,打造一個主力模型。同時,在主力模型之外,通常還會採用多個外部模型,應用於不同的場景。

總得來說,需求端對模型的需求是多元的,採用的第三方模型不會只限於一家。阿里雲魔搭社區的數據也能作證這一點。魔搭上線一年,就匯聚了聚了280萬開發者,2300多個優質模型,模型下載量超過1億。

這意味着,雲廠商很難通過自研大模型的方式滿足需求的大多數,也很難形成壟斷。但作爲雲廠商,客戶又對阿里雲提出了更多要求。

周靖人近期接受《晚點LatePost》採訪時提到,他們最開始做大模型時,想把幾百臺服務器連起來做訓練,但很難,他們需要把雲團隊與模型團隊緊密配合,雲優化一點,大模型進步一點,如此往復、交替往前走。

因此他們判斷:並不是把足夠多的GPU連起來就能支撐大模型的發展,AI 和雲是不可分割的整體;推動模型進步需要對雲的各層級的技術做升級和創新。

截至目前,全國80%的科技企業和超過一半的AI大模型公司都跑在阿里雲上,他們的需求是多種多樣的。

例如百川智能這樣的客戶,他們能開發通用模型,需要的是 AI 基礎設施。朗新科技、央視網、亞信科技這樣的客戶,他們的需求是基於通用模型,結合自身數據和行業知識開發專屬大模型。也有童話故事、供春AI這樣的創業公司,他們直接調用阿里雲的大模型,以最低的IT成本創業。

客戶的多樣化需求阿里雲對分佈式框架設計、服務器設計、網絡、存儲、機器學習框架等諸多方面進行升級、重構,幫助客戶訓練好大模型、用好大模型。

作爲AI基礎設施,只有形成更繁榮的生態,讓市場上有更多更好的模型和應用,算力需求才能更大,阿里雲才能最終受益。

開源、社區是現階段助力AI生態繁榮的重要途徑,蔡崇信甚至在致辭中強調,“沒有開放就沒有生態,沒有生態就沒有未來”。

的確,開源可以讓更多模型開發者和企業免費調用模型,以更低的成本加快模型的開發和落地。社區是開發者交流的平臺,幫助中國開發者降低模型的使用門檻,同時在社區上線的開源模型也可以在這裡及時獲得反饋,不斷優化、升級。

也因此,阿里雲成爲國內最早開源自研大模型的科技公司。目前,阿里雲已開源通義千問7B、14B版本,下載量突破百萬。通義千問72B模型也即將開源,它將成爲中國參數最大的開源模型。

爲推動AI生態繁榮,這次雲棲大會上,阿里雲還宣佈了“雲工開物”計劃,要給每個想嘗試 AI 前沿技術的高校學生提供全年 300 元的阿里雲產品免費額度。這相當於給每個學生配備了一臺雲服務器。

AI基礎設施怎麼做?

把通義千問大模型開源,供業界免費使用,這是阿里雲打造開放生態的其中一環。截至目前,阿里雲已初步建成AI時代全棧的雲計算體系。

具體來看,主要包括四個大的部分:

其一,高性能分佈式模型訓練平臺——PAI靈駿。爲保證大模型訓練的穩定互聯和高效並行計算,近期阿里雲全新升級了PAI靈駿,底層採用HPN 7.0新一代AI集羣網絡架構,可支持高達10萬卡量級的集羣可擴展規模,超大規模分佈式訓練加速比高達96%。

其二,低延時模型推理與服務平臺——PAI靈積。它可以爲其他模型廠商提供API接口,並提供推理服務。

據阿里雲披露的數據,目前其提供的AI基礎設施可幫助企業在大模型訓練中節省50%的算力資源,將大模型的訓練效率提升10倍,推理效率提升2倍以上。

截至目前,中國衆多主流大模型都已通過阿里雲對外提供API服務,包括通義系列、Baichuan系列、智譜AI ChatGLM系列、姜子牙通用大模型等。

Baichuan系列出自大模型創業公司百川智能。百川成立僅半年時間就發佈了7款大模型,平均每月迭代一款模型。

百川智能創始人兼CEO王小川表示,模型快速迭代和部署離不開雲計算,百川智能與阿里雲在模型預訓練和模型部署等方面都進行了深入合作。在雙方共同努力下,百川很好地完成了千卡大模型訓練任務,並有效降低了模型推理成本,提升了模型部署效率。

其三,在模型層,阿里雲不僅發佈了千億級參數規模的大模型通義千問2.0,同時發佈了一系列行業模型。此前,70億、140億參數的通義千問模型已開源,720 億參數的版本在11月份開源。

去年11月,AI開源社區魔搭ModelScope正式上線。目前,這裡已聚集2300多款AI模型,吸引了280萬名AI開發者,AI模型下載量突破1億,是中國規模最大、開發者最活躍的AI社區。模型豐富、開源免費,中文爲主都是其顯著特色。

其四,在大模型應用開發工具方面,在今年雲棲大會上,阿里雲發佈了一站式應用開發平臺——“百鍊”。它可幫助企業客戶快速結合自身數據集,基於通用模型訓練出專屬模型並開發應用。

周靖人強調,阿里雲全棧雲計算體系是要爲不同類型的開發者和客戶提供支持。而阿里雲通義大模型不是爲了做一個端到端的超級應用,而是向行業展示和開放能力;阿里雲所有的模型都歡迎被集成。

雲廠商的第三波“大勢”

2011年,在阿里雲首屆開發者大會上,時任阿里巴巴集團首席架構師、阿里雲總裁的王堅曾斷言:雲計算與移動互聯網的結合,將形成”蝴蝶效應”帶給人們生活巨大的變革。

“雲給移動互聯網帶來的蝴蝶效應,我認爲到今天爲止還沒有顯露出來,這可能是今後五到十年需要努力的東西。”王堅說。

今天回頭看,雲計算的發展實踐證實了王堅的預判。在今年的雲棲大會上,王堅再次發出了對雲計算的預判——雲計算與GPT的結合,就像當年電與電動機的關係,將開啓雲計算的第三次浪潮。

按照他的劃分,從1991年萬維網的出現到2003年雲計算第一次提供服務,是雲計算的第一次浪潮。而非雲原生的“傳統企業”開始使用雲計算是第二次浪潮,標誌性事件是2022年北京冬奧會上,雲計算首次承載了賽事的核心繫統。

1834年,隨着第一臺實用電動機誕生,電動機逐漸進入實用化階段,從此拉開了電力革命的序幕。電力的廣泛應用,改變了人類的生活,也帶動了產業結構的顛覆性變化。

在王堅看來,大模型的出現不是科學研究工具的革命,而是一場會讓科研發生一次革命的工具。他說,相信未來雲計算將像電那樣,作爲一種公共服務、基礎設施存在,具有非常久遠的生命力。

美國著名投資機構A16Z也曾在題爲《生成式AI平臺,誰主沉浮?》的文章中提到雲計算在生成式AI產業鏈中的角色。

文章提到,生成式AI的技術棧自上而下可包括三個層級——應用層、模型層、基礎設施。無論是應用層還是模型層,最終的需求都導向了基礎設施——每秒浮點運算(FLOPS)都是生成式AI的命脈。

也因此,文章稱,生成式AI市場裡大量的資金最終流向了基礎設施公司,他們主要是雲廠商和硬件製造商。A16Z推測,生成式AI總營收的10%-20%將流向雲廠商。

微軟是Open AI早期投資者,持股49%的最大股東,也是Open AI爆火後的最大受益者。以微軟最新財報(自然年2023年Q3)爲例,微軟智能雲業務逆勢增長,營收同比增長19.4%;其中拳頭產品Azure營收增長提速到29%。微軟雲業務的表現優於亞馬遜的AWS和谷歌雲;微軟管理層將雲業務的逆勢增長歸功於AI。

圖注:微軟財報中,2024財年Q1對應自然年2023年Q3,以此類推。

在國內,大模型落地和商用仍處於早期階段。作爲基礎設施供應商,阿里雲還在打造生態的階段,賺錢還不是最重要的事,也還需要時間。

不過,近日有消息稱,由於GPU芯片供給受限,國內一些雲廠商開始惜售AI算力。

分析認爲,租賃需求見漲,擁卡爲王,芯片禁令對於有卡的算力提供方來說,是挑戰也是紅利。

也許這會加速國內雲廠商在模型時代的商業化進程。

合作平臺

澎湃|第一財經|南財號|界面|華爾街見聞|36氪|鈦媒體|虎嗅|雪球|富途|東方財富財富號|騰訊|新浪|本站 | 搜狐|大風號|頭條號|百家號

內容轉載:文末留言或後臺發消息