觀察者網》高端GPU斷供 中國頂級超算根本不怕(鐵流)

美國管制超微與輝達的高階AI晶片輸至中國。(示意圖/shutterstock)

日前,網傳美國AMD、英偉達相繼收到總部通知,對中國區客戶斷供高端GPU,稱該事件的理由是「爲了防止被用於軍事」。隨後,英偉達發佈公告稱,美國政府已授權英偉達開發H100集成電路所需的出口、再出口和大陸轉讓。該授權還允許公司在2023年3月1日之前執行爲A100的美國客戶提供支持所需的出口。此外,美國政府還授權英偉達通過公司的香港工廠爲A100和H100訂單履行和物流到2023年9月1日。

鐵流認爲,美國政府此舉主要是針對中國超算、人工智能等關鍵行業,試圖通過在基礎硬體上卡脖子延緩中國科技進步,只不過英偉達遊說非常給力,使英偉達和大陸客戶獲得了緩衝期。從結果上說,該事件對中國頂級超算沒有任何影響,對人工智能行業會產生一定影響,對國產GPU公司而言則是利好。

●美國對超算加速器非常敏感

GPU可以分爲三類,分別是AI、FP和渲染。AI就是英偉達和AMD近年推出的一系列用於深度學習的加速卡;FP則是那些用在超算上的加速卡,支持雙精度浮點數運算,可以做科學計算,比如美國E級超算Frontier就搭載了AMD Radeon Instinct MI250X GPU作爲加速器;渲染就是比較傳統的做遊戲、做桌面,做各種圖形化應用。目前,TOP500榜單中很多超算就以GPU作爲加速器,TOP500榜單中第一名、第三名、第四名和第五名均使用了英偉達或AMD的GPU。

由於超算在國防、科研等諸多領域不可替代的作用,多年前,美國就針對中國HPC的雙精度高性能卡。2015年4月,美國政府宣佈制裁中國四家超算中心以及國防科技大學,禁止英特爾等美國公司向中國出口高性能計算晶片,理由是中國的超算涉嫌用於核爆試驗。當時天河二號就搭載Xeon Phi加速卡,美國的禁令使天河二號超算失去了使用Xeon Phi加速卡升級的途徑,逼迫天河二號換了國產加速器。

事實上,美國對於支持雙精度浮點數運算的晶片非常敏感,不要說專門用於超算的加速器,即便是出口民用高性能CPU技術,也要受出口管制法律約束。2014年,蘇州宏芯公司與IBM公司達成協議,引進IBM Power8處理器,然而,受美國出口法律管制,宏芯引進的Power8是閹割了浮點模塊的處理器。像ARM CPU由於浮點性能比較弱,大陸公司在引進技術時才免遭美國毒手。

從上述例子可以看出,美國政府對於超算加速器,以及一些具有較高雙精度浮點性能的晶片比較敏感,這方面的技術對中國防範比較嚴格。可以說,即便這次英偉達通過遊說獲得了一個寬限期,徹底斷供高端GPU只是時間問題。隨着中國綜合國力逐步增強,美國對中國的敵意會越來越大,技術脫鉤已經是大勢所趨。

●高端GPU斷供對中國頂級超算沒有影響

雖然美國稱英偉達和AMD的計算卡可能會被用於軍事,但實際上大陸頂級超算根本就不用美國的加速器。超算是國之重器,大陸單位早在20多年前就開啓了超算晶片的研發,是完全自主指令集,自主CPU架構,而且已經取得了豐碩的果實。在2011年,大陸就完成了神威藍光超算的研製,這款超算的性能在同時期不突出,但勝在超算晶片完全自主設計,不需要採購美國的超算晶片。在2016年,採用SW26010的神威太湖之光正式亮相,成爲全球首個100P級超算,並連續4次蟬聯TOP500第一名。

不久前,英國《金融時報》發佈了一篇題爲《美國急於在超算競賽中趕上中國》的報導,稱中國已在美國之前實現E級超算,首臺E級超算已經運行一年多,只是沒有參加排名,「中國企業現在更專注大陸競爭,而不是國際對手在做什麼」。

根據披露的公開信息,新一代神威超級計算機的計算能力由自主研發的多核SW26010P CPU 提供。雖然SW26010P CPU的具體參數我們無從得知,但2021年中國高性能計算機性能TOP100排行榜上有一款基於SW26010P 打造的超算,我們可以基於這臺超算一探究竟。

從榜單顯示的信息看,該超算在僅用992片SW26010P就打造出一臺13.9P的超算,作爲參照,神威太湖之光性能爲125P,使用SW26010晶片共計40960片,換算一下,SW26010P的性能相對於SW26010提升了5倍。更爲可怕的是,這臺超算效率極高,達到90.3%。作爲參照,TOP100榜單上前20的超算除神威太湖之光效率達到74%外,其餘超算效率在46%至62%之間。即便是美國超算Frontier,其效率也只有65%。

在應用方面,這臺新超算也取得了多項成績。2021年,「千萬核可擴展第一性原理拉曼光譜模擬」和「多架構大規模並行保辛結構電磁全動理學等離子體模擬」和「超大規模量子隨機電路實時模擬」三項應用入圍「戈登貝爾獎」。國際計算機協會將2021年度「戈登貝爾獎」授予中國超算應用團隊,我國聯合科研團隊基於新一代神威超級計算機的應用「超大規模量子隨機電路實時模擬」而獲此殊榮。

另外,天河超算在超算晶片上也使用了自主設計的加速器取代了英特爾的加速器,天河2號使用國產加速器升級之後,性能提升了70%以上。可以說,中國頂尖超算壓根不用英偉達和AMD的加速器,而且性能是世界頂尖,在應用方面也屢屢斬獲國際大獎。

●利好大陸國產GPU

近年來,一批GPU初創公司如雨後春筍般發展起來,多家公司獲得資本青睞,摩爾線程完成數輪投資獲得數十億元,無獨有偶,壁仞科技宣佈完成總額11億元的融資,沐曦集成電路宣佈完成近億元天使輪融資,登臨科技宣佈完成融資。另外,天數智芯、芯動科技等公司還即將發佈GPU新產品,或已經成功回片通過測試,開始客戶送樣。誠然,這當中不乏拿英偉達開源代碼去流片標榜國產的渾水摸魚之輩,但也有一些有理想有抱負的公司。

在這批GPU公司中,有一些是主打桌面GPU的,比如芯動科技、格蘭菲,就像素填充速率和FP32來說,風華2號、Arise-GT-10C0和GT1050大致處於同一檔,3DMark測試分數推算應當在GT75至GT1050之間。也有一些是主打人工智能,主攻數據中心場景,比如摩爾線程的MTT S2000和壁仞100。

這些大陸國產GPU雖然主攻場景不同,但都有一個共同的問題,那就是缺乏應用場景,而且對比英偉達和AMD的貨架商品並沒有多少性能優勢,在產業生態方面則完全被英偉達碾壓狀態。

這裡必須說明一下,一些廠商爲了營造光環,在PPT上會以田忌賽馬的方式進行宣傳,比如某款GPU就標榜自己超越國際旗艦算力,但實際上該GPU壓根不支持雙精度浮點運算,做不了科學運算,只能用於人工智能方向。其他廠商的宣傳也是類似,雖然在這些廠商的PPT中,英偉達的GPU總是作爲背景板被超越,但實際上這種宣傳是含有較大水分的。

過去,由於英偉達在軟體生態上非常成熟,而且GPU性能強,產品質量穩定,客戶根本找不到使用大陸國產GPU去替換英偉達的理由,但在這次事件後,大陸互聯網公司恐怕會找一個備胎,無論是自研GPU,還是收購一家初創公司,對於我國GPU行業而言都是利好。

●結語

當下,大陸國產GPU的水平明顯落後於國產CPU,國產CPU中不乏龍芯、申威這類採用自主指令集,完全自主研發,並且在各自的應用市場做的非常不錯的產品。而大陸國產GPU則大多數有境外技術來源, GPU公司大多數是從英偉達、Imagination、S3、圖芯等公司獲得技術,或者是逆向ATI老舊GPU起家,走的技術引進消化吸收的路子。

如果說大陸國產CPU已經是小米+步槍,依靠優秀的指揮、精湛的戰術能夠和美式裝備打的有來有回,國產GPU基本屬於冷熱兵器混用時代(大多數是冷兵器,少數是買來的洋槍洋炮),和英偉達、AMD的差距很大,少數幾款技術引進GPU能夠通過田忌賽馬的方式在PPT上與英偉達對標,但產品成熟度、產業生態和英偉達差距巨大。過去,大陸國產GPU能夠拿到融資,但很難找到市場,很難落地,但在今後,無論是政策,還是資本和市場都會給予國產GPU更多扶持和幫助。(作者爲科工力量專欄作者)

(本文來源觀察者網,授權中時新聞網刊登)

※以上言論不代表旺中媒體集團立場※