長三角議事廳|以集約化和協同舉措促進長三角算力高效整合
今年“兩會”期間,國務院總理李強在政府工作報告中強調了“適度超前建設數字基礎設施,加快形成全國一體化算力體系”的重要性。作爲國家算力佈局的重要組成部分,區域性算力體系的構建不僅有助於優化算力資源的分配與利用,還能推動區域間優勢互補。
面對深度學習和模型訓練等智能計算需求的迅猛增長,長三角地區正處於智能算力發展的關鍵節點。爲應對研發和能源投入高成本、維護難度大等現實挑戰,當前亟需構建區域算力體系並實現集約化發展,以推動資源高效共享,提升長三角在全球數字經濟領域的競爭力。
算力佈局碎片化制約長三角智算產業發展
當前長三角地區算力分散的問題日益凸顯,背後有兩個主要原因。首先,國內AI芯片供應因地緣政治因素受到嚴重製約,導致區內企業不得不以數倍於官方定價的高成本,通過非正規渠道採購和運輸少量芯片來滿足算力供應需求。這種高昂的費用和分散採購模式大幅減緩了算力的增長,並使算力佈局進一步碎片化。
其次,長三角地區的各城市在人工智能領域你追我趕,紛紛建設本地智算中心,以拉動基礎設施投資、吸引外部資本和人才,並推動產業升級。截至2023年,全國在建和運營的政府主導智算中心達到18個,其中長三角區域就有7個,而區域內的企業智算中心也有6個。總體建設密度和分散度均高於全國平均水平。再加上區域內各省市還在籌備中的新算力中心項目,使得本已有限的算力資源更加分散。
因此,儘管在長三角內部已逐漸形成上海“兩核一帶”、江蘇“雙核三區四基地”、浙江“杭州主核心,寧溫金義副核心”以及安徽的蕪湖集羣算力公共服務平臺等集羣化佈局,但整體上仍偏向以點狀和塊狀爲主的“高密度、強分散”佈局。這不僅阻礙了區域內算力網絡的一體化建設,也限制了算力資源的共享和調度。
與此同時,出於安全考慮,各城市政府普遍傾向於自建數據中心以支撐政務信息系統。金融機構和大型國有企業爲了確保數據安全與資產保值,也更願意自建數據中心。這就導致長三角地區的雲計算市場當前仍以混合雲、私有云和專屬云爲主,難以形成統一的公有云服務市場,進而導致了算力資源的分散。
從細分業務類型來看,專屬雲服務目前佔據了區域內市場的主導地位,尤其在政府項目中佔比超過六成。然而,這類服務的CPU利用率僅約爲10%,遠低於公有云40%的平均水平。同時,專屬雲通常以託管而非租賃形式存在,投入巨大但應用範圍有限,收益較低,卻還要消耗相當多的算力資源。
此外,長三角的雲計算市場目前仍以IaaS(基礎設施即服務)爲主,與全球向SaaS(軟件即服務)轉型的趨勢形成對比,PaaS(平臺即服務)和靈活的軟件應用支撐服務也有所不足。這種局地化的雲服務模式必然導致成本高企,不利於優質公有云生態的可持續發展。
構建區域算力體系,須注重集約、市場化和自主可控
新形勢下,提升算力資源整合水平已成爲長三角推動區域高質量發展的當務之急。我們建議可協同採取優化構建區域“算力網”、強化公有云市場化建設以及推進算力產品的國產替代等策略與措施,以實現這一目標。
集約建設區域“算力網”
2023年2月,中共中央、國務院發佈了《數字中國建設整體佈局規劃》。同年12月,國家發改委等五部委聯合發佈了《關於深入實施“東數西算”工程,加快構建全國一體化算力網的實施意見》,明確提出了系統優化算力基礎設施佈局的具體要求和路線圖。
對於長三角地區而言,加速算力資源整合的首要任務是推動算力中心的集約化發展。通過擴大現有算力中心的規模,並提升通用算力、智能算力及超級算力資源的建設和利用效率,長三角將能釋放出更多算力資源,爲區域內各類產業和科技企業發展提供堅實保障。
其次,要加強區域算力調度平臺體系的建設,科學評估區域內產業和技術發展的需求,推動算力資源與業務需求解耦,設計最優調度路徑,實現跨地區、跨行業的高效調度。
此外,需要從基礎設施建設入手,統一算力運營服務、調度和量化標準,實現算力註冊、身份認證和服務申請的一體化,以確保各類算力資源能夠流暢對接各類應用場景。
最後,長三角應建立政府引導、市場化運作、全社會參與的協同推進機制,推動公有云、混合雲、私有云、專屬雲等多種算力資源的併網調度,並探索碳排放額度與經濟利益之間的置換模式。
優化公有云架構,提升區域算力共享
一是加快構建長三角公有云整體架構。需加速形成長三角公有云的整體佈局,建立多核心、多層次分佈的樞紐城市數據中心集羣,推動各城市數據中心的集聚建設,擴展覆蓋全域的邊緣數據中心,構建完善的公有云生態。同時,應加快區域公共算力承載網的建設,確保算力在區域內高效流動與共享。
二是加強公有云的區域算力調度。應聚焦關鍵技術創新,涵蓋多雲管理、雲網協同、算力評估、算力感知和算網融合等技術領域的研發,打造長三角智能算力技術生態鏈。依託各地公共算力服務平臺,促進與全國其他地區在“東數西算”“東數西存”“東數西訓”“東視西渲”等應用場景中的合作與驗證,構建跨區域算力聯通體系。
三是打造長三角智算公共生態。在智能製造、金融服務、智慧城市等領域推動上層應用發展,降低智算中心的計算和維護成本,緩解基礎設施規模小、分散且運維成本高的現狀。鼓勵領先雲廠商打造開放的公共應用生態,與戰略合作伙伴緊密合作,推動生態系統協同發展。
四是加速推進區域“數算融合”和“電算融合”。推動阿里、華爲、電信等公有云服務商加速市場化建設,率先開放長三角非行政管理領域的數據資源和產品共享通道,通過市場化競爭形成以公有云爲核心的區域數算融合市場。加快公有云能源信息基礎設施建設,推動“源網荷儲”智算能源系統的協同發展,實現負載優化、綠色能源利用和分佈式佈局,提高公有云在能源調控中的靈活性,提升區域智算資源的整體利用率。
推動算力產品國產化,突破技術瓶頸
鑑於算力產品產業鏈的複雜性及其對外部環境的敏感性,長三角應加速推進芯片、服務器、操作系統等關鍵算力產品的國產化替代。短期目標是突破兼容CUDA技術的瓶頸,推動本土算力生態體系的建設。長期而言,應着力發展基於異構計算架構(如CANN)的自主軟硬件生態,形成全面的自主技術體系。
此外,需要強化編譯、調試和算法庫等開發工具的本土化替代,構建統一的編譯語言和兼容性解決方案。技術研發應聚焦於“一雲多芯”和“一雲多算”的應用,實現對異構芯片的統一調度和管理,構建長三角區域內多源異構算力的綜合技術能力。同時,通過優化公有云架構,整合現有芯片資源,形成超大規模的區域算力資源池,利用公有云實現靈活的算力調度,以支持區域內廣泛的算法訓練和推理應用,提升整體技術自主性和競爭力。
(本文作者林蘭繫上海社會科學院研究員)
“長三角議事廳”專欄由教育部人文社會科學重點研究基地·華東師範大學中國現代城市研究中心、上海市社會科學創新基地長三角區域一體化研究中心和澎湃研究所共同發起。解讀長三角一體化最新政策,提供一線調研報告,呈現務實政策建議。