不僅僅是芯片,從一個側面看未來十年的中國ICT技術自主化
在 2018 年中興被制裁, 2019 年華爲被制裁的三四年來,芯片一直是國內技術自主化最爲關注的領域,國內的半導體產業鏈公司在過去的幾年也獲得了巨大的發展,下圖是國內模擬芯片公司思瑞浦的營收和利潤,可以看出 2019 年上半年營收還只有 9700 萬元,歸母淨利潤 1500 萬元,到了 2022 年上半年營收變成了 9.98 億元,歸母淨利潤變成了 2.35 億元,實現了四年 10 倍的爆炸式增長。
下圖是中芯國際的半年營收, 2019 年上半年爲 101.72 億元人民幣,今年上半年變成了 245.92 億人民幣,歸母淨利潤 2019 年上半年還只有 3.23 億人民幣,到 2022 年上半年竟然變成了 62.52 億人民幣,出現了一二十倍的增長。
然而除了芯片, ICT 技術自主化其實還有更爲廣闊的內容,目前由於芯片供應受限,因此我們的關注點都集中在芯片上面,但實際上,我國在基礎軟件上面的落後情況可不比芯片好多少。
IT 產業鏈是一個完整的產業鏈,
最底層是硬件的芯片,存儲,服務器,網絡設備硬件,
再往上一層是操作系統,數據庫和中間件 基礎軟件“三大件”,
最上層則是各種日常的應用,比如微信,支付寶。
而形勢的發展也需要在速度上儘快完成 ICT 底層技術的國產替代。
在基礎軟件這個部分,由於在日常的生活中能經常接觸到,因此公衆最爲關注的是操作系統,這是我們日常使用的筆記本電腦,平板電腦,智能手機都必須安裝的軟件系統。
但實際上數據庫這樣的基礎軟件,其實現自主化的重要性和難度並不亞於操作系統。
目前全球都在向數字化社會演進,千行百業都在走向數字化轉型,
我們現在去餐館吃飯都已經是掃碼點單了,我們現在去地鐵都已經是掃碼進站了,現在街頭的攝像頭已經可以輕鬆的完成車牌識別了,工廠的車間和倉庫則在部署越來越多的機器人,產線上有越來越多的傳感器監控產品的質量和設備的運行參數,我們生活中的一切都在走向智能化。
換言之,隨着數字化轉型,在人類社會中運行的公交車,地鐵,各行各業的企業,甚至住宅樓的電錶,水錶,都在不停的產生數據,傳送數據,這就導致全社會的數據量在猛增,
這些海量的數據往往都會放在雲上,用分佈式的方法存儲,提高數據的安全性和穩定性,而不是像傳統的方法那樣放在一個個獨立的服務器裡面,而對這些數據的處理又能夠產生極高的價值,因此全球包括中國在內數據總量在隨着數字化轉型而迅猛的增加。
而數據的存儲和處理則又離不開底層的核心軟件 — 數據庫。
然而包括操作系統,數據庫在內的基礎軟件,其國產化的難度並不比芯片低,甚至更高,
因爲其一是軟件和生態相關,基礎軟件上面都衍生着一大堆基於該軟件平臺開發運行的應用軟件,因此不僅僅是簡單的替代,而是會涉及到上層的大量應用軟件;
其二是基礎軟件的可靠性和穩定性極爲重要,尤其是數據庫這樣的基礎軟件,從國家機關的各類政務數據、商業銀行的存款貸款數據,到企業組織的人員管理信息、財務管理系統,都有數據庫在背後支撐。
作爲數字應用的核心,數據庫必須保證 7x24 小時不中斷運行,穩定、可靠、高效承載企業與個人的每一筆數據 , 尤其是像證券,銀行,保險這樣的金融機構,承載着幾百萬人,幾千萬人乃至上億人的資金數據,更是不能容忍出現任何的大的差錯,因此國產化的替代對自主技術也提出了非常高的要求。
根據我看到的有關調研報告, 2022 年我國金融業國外數據庫產品總體佔比高達 92.62% ,其中保險業國外數據庫比例接近 97% ,證券業更是接近 99% ,銀行業要好一些,但也有 82% 多,而在金融業整體所用的數據庫中,特別是 Oracle 佔比超過一半,約爲 51.5% 。
像證券業這樣交易時延要求極高的系統, 我國證券集中交易系統的龍頭公司,其交易系統就 與 Oracle 數據庫形成深度綁定。
而 Oracle (甲骨文)是一家美國公司,其創始人拉里•埃裡森 2018 年 10 月在接受福克斯採訪時曾說
“如果就這麼讓中國經濟超越我們,讓中國培養出比我們更多的工程師,讓中國科技公司擊敗我們的科技公司,那我們就離軍事科技也落後的那天不遠了。美國與中國的激烈競爭中,我站美國隊。”
在今年的俄烏戰爭中, Oracle 公司就響應美國的制裁,暫停了在俄羅斯的業務,下圖 Oracle 的官方推特直接說支持烏克蘭。
儘管國內還有不少行業在大量的使用 Oracle 的產品,但中國市場對於 Oracle 公司來說並不大, 2019 年和 2020 年其營收中,來自中國市場的營收佔比都僅 5% 不到,其中 2019 年爲 4.77% , 2020 年爲 4.95% ,這就意味着該公司即使失去中國市場,對其損失也不會太大。
Oracle 響應美國對俄羅斯的制裁並不是孤例,實際上 2019 年 5 月華爲被列入實體清單時, Oracle 公司作爲華爲的 IT 系統供應商,爲其提供企業 ERP 軟件和數據庫產品,華爲無疑是 Oracle 公司全球的大客戶之一。
但在美國開始宣佈制裁後, Oracle 立即對華爲實行停服斷供,迫使華爲開始全面自研 ERP 系統進行替代,並在自研的 ERP 中 部署上線了 華爲自研 GaussDB 數據庫,並已完成700TB的數據量遷移,同時,在華爲終端雲部署自研GaussDB數據庫上線數據達到6PB,替代了使用多年的Oracle和MySQL。
在11月7日的華爲全聯接大會上,華爲雲CEO張平安稱,在關鍵行業的核心應用領域,交易型數據庫基本上都是來自美國的數據庫,爲了給全球客戶提供一個更優選擇,華爲雲打造了全球領先的雲原生交易數據庫GaussDB,更快,更穩,更可信。
不僅如此,和以往的國產化相比,這次的國產化還有個明顯的不同,那就是即使在技術上跨過了門檻,在技術上可以替代了,但也還必須考慮到美國這個風險因素,
在以往,我們即使有某個模塊使用了美國的技術,但如果總體系統是自主設計的,大部分模塊是自研的,其實也已經達到了自主化技術的標準,也可以稱之爲自主技術。
但是美國風險的存在,則對自主化提出了更高的要求,也就是要求技術必須是真正完全去美化的,可以不受美國製裁的。
會不會受到美國的制裁是檢驗是否是真正的自主化,最清晰明瞭的標準,也有着極高的要求,由於美國因素的存在,其長臂管轄的無孔不入,導致即使是開源代碼仍然具有風險和不安全性。
在全球最大的開源代碼託管平臺 Github 的官網上面,在 GitHub and Trade Controls (貿易控制)頁面,就明確的寫了 GitHub 提供的服務,以及上傳的代碼都可能受到貿易控制規定的限制,包括美國出口管制條例 EAR 。
“GitHub Enterprise Server, and the information you upload to either product may be subject to trade control regulations, including under the U.S Export Administration Regulations(the EAR)
https://docs.github.com/en/site-policy/other-site-policies/github-and-trade-controls
而在今年的俄烏戰爭爆發後,
2 月 28 日俄羅斯《生意人報》發文章稱, GitHub 正在考慮限制俄羅斯軟件開發者訪問開源軟件源代碼儲存庫,“雖然看上去開源軟件是自由使用的,但開源協議仍然存在,而且內含部分限制,比如禁止受制裁國家的居民使用免費貼出的代碼”。
而據俄媒 Habr 報道,從 4 月 13 日起, GitHub 屏蔽受美國製裁公司的俄羅斯開發者賬戶,其中就包括 Sberbank 和 Alfa-Bank 兩大俄羅斯銀行。這些被屏蔽的企業賬號不僅被禁用代碼庫、並且賬號直接被平臺刪除等。
中國也是被美國製裁的重災區,這幾年越來越多的中國機構被列入到了美國的制裁清單上面。目前國內已經有不少國產數據庫廠家,但不少是基於開源的 MySQL 數據庫代碼進行開發,自身缺乏自主演進和發展的能力,也不具備對所有代碼完全,深入的理解能力。
而 MySQL 開源社區目前也是在美國 Oracle 公司的控制之下, MySQL 的開發者爲瑞典 MySQL AB 公司,該公司在 2008 年的時候被 SUN 公司收購。而 2009 年 SUN 又被 Oracle 收購,這意味着 MySQL 直接受到美國政府的管轄。
不僅如此, MySQL 使用的代碼託管平臺也是 GitHub ,因此使用了 MySQL 的開源代碼,並依賴於 MySQL 開源社區更新的數據庫產品,會有嚴重的隱憂,因爲一旦形勢變化,是可能導致參與社區的渠道被封鎖,無法獲得新的代碼更新甚至完全停止開源社區服務,使得已經部署的業務產品無法進行系統升級和修復漏洞,業務無法長期維持,試想如果誰會敢於冒着風險讓幾千萬人幾億人的數據在漏洞下運行呢?
目前美國對中國的技術流動管制和壓制在越來越嚴厲,
2022 年 5 月 26 日, BIS (美國商務部工業和安全局)主導的《信息安全控制:網絡安全物項》正式發佈。該規定稱出於“國家安全和防恐考慮”,當美國實體與“受限制國家和地區”區域的“政府最終用戶”分享網絡安全事項時,需要先向美國政府申請,獲得許可後才能跨境發送可能存在的網絡安全漏洞。未來還有可能進一步限制其他範圍。
國內多個機構對此規定進行了解讀,並且分析了其管控範圍,但實際上對我們來說,在美國加大對中國技術壓制和流動管制的大趨勢下,長期看起管控範圍並不重要,因爲今天只限於政府最終用戶,明天它也可能擴展到更多的非政府更多用戶,今天它只限制某些軟件的漏洞披露和修復需申報,豁免另外一部分,明天也可以取消豁免。
像目前大量的網絡安全漏洞就是通過開源社區發佈的,這一規定意味着,
如果未來管控進一步升級,那麼像MySQL這樣屬於美國公司控制的開源技術平臺及其用戶,在發現技術漏洞時第一選擇將是在通過美國政府申請確認後纔可向全球公開漏洞及補丁措施 ,因爲誰會知道公佈漏洞後會不會被用於美國定義的受限制名單上的用戶呢?
這種的審覈過程必然會延長漏洞公佈的時間,也有可能會被拒絕的風險,畢竟決定權掌握在美國政府手裡,而這會危害到下游使用了 MySQL 數據庫平臺的用戶的數據安全。
微軟就很反對這個規定,認爲這會限制其日常的網絡安全部署活動,因爲認爲“ Government end user (政府最終用戶)”的定義不清楚,因爲它可能包括各種國際組織,科研機構和企業,這會使得企業在公佈網絡安全漏洞和補丁時產生額外的核查負擔以及非故意的犯錯,因此請求明確政府最終用戶的定義,但微軟的請求被 BIS 所拒絕,顯然對於各個實體來說,是否公佈漏洞最佳的選擇就是先向美國政府申請確認,以免違法。
而更進一步,隨着中美關係的變化,美國在未來有進一步擴大制裁範圍的可能,即從政府最終用戶向非政府最終用戶擴展。
同時在 Oracle 公司控制下的 MySQL ,其開源協議是可能更改的,目前 MySQL 的 GPL2.0 開源協議就規定,所有修改、引用、集成、分發來自 MySQL 的相關程序都需要公示開源才能合規使用,如果無法公示開源需要向 MySQL 協商購買一定數量的 商業許可。
總之,美國和 Oracle 公司牢牢掌握着 MySQL 的控制權,如果技術演進依賴 MySQL 提供的服務和更新,你要符合它的要求,才能允許讓你繼續使用開源版本,否則必須購買其商業許可,則不是真正的自主化。
目前國內重點企業都已經意識到走向國產化的重要性,而國產數據庫在技術上已經在逐漸發展,國內六大銀行之一的中國郵政儲蓄銀行,在全國擁有超過 6 億個人客戶、 4 萬個網點,系統要面臨百 TB 級的海量歷史數據、千億級單表數據量,甚至在高峰期需面對上萬的用戶併發量,其在 2021 年 6 月宣佈採購 Oracle 數據庫軟件四年期原廠標準服務,金額高達 1.453 億人民幣。
其在解釋單一採購原因時說:
“當前我行多個核心生產系統使用 Oracle 數據庫進行數據存儲和處理,無法替換,須向甲骨文(中國)軟件系統有限公司進行採購,確保系統正常運行及相關業務的正常開展。按照我行《中國郵政儲蓄銀行單一來源採購實施辦法( 2021 年修訂版)》第四條“(一)只能從唯一供應商處採購的,包括但不限於以下情形: 5. 需要採購不可替代的知識產權、專有技術的情況。”相關條款,因此,建議採用單一來源採購方式進行採購。”
感受到國產化的迫切的中國郵政儲蓄銀行,其新一代個人業務分佈式核心系統就使用了國產的數據庫,並於 2022 年 4 月全面上線,系統上線後具備日均 20 億筆、峰值 6.7 萬筆 / 秒的交易處理能力,在 9 月底的季度結息中僅花 23 分鐘就完成了原來傳統商業數據庫需要 70 分鐘完成的工作量。
值得一提的是該系統實現了真正的去 O 化,既沒有使用 Oracle 的商業數據庫,也沒有使用同屬於 Oracle 公司開源 MySQL 數據庫平臺。這樣的國產替代顯然對於國內的數據安全是有積極意義的。
在國內基礎軟件的國產化方面,國內一些大公司都是比較積極的,像華爲除了推出自己商業版的鴻蒙( harmony OS )操作系統,服務器的歐拉操作系 統,數據庫的 GaussDB( 高斯數據庫)之外,也和美系廠家一樣提供了免費的開源版本 OpenHarmony , OpenEuler ,以及 OpenGauss ,把基礎的能力對外開源和開放,以吸引國內開發者基於這些開源平臺做二次開發,讓更多的國內行業的數字化是建立在國產自研的基礎技術上。
ICT 底層技術國產化的三個意義
縱觀二戰以來的第三次科技革命,即使以信息技術爲核心,而美國在這一波浪潮中牢牢的掌握了技術的制高點,在底層的芯片和基礎軟件部分打造了全球信息社會的底座根基,
而在這方面,實事求是的說我們和美國的差距還是很大的,比在應用領域和美國的差距還要大的多, 搞底層根技術的國產化,
第一個意義是擺脫美國製裁,不僅是爲中國公司和機構,也是爲全球提供更多的選擇。
而美國從 2018 年開始制裁中興, 2019 年開始全面制裁攻擊華爲,所帶來的影響絕不僅僅是芯片方面,而是刺激中國全方位的打造全球第二套信息社會軟硬件商業底座,包括芯片,存儲,服務器,網絡設備在內的各種硬件,以及操作系統,數據庫,中間件, EDA 工具軟件在內的各種基礎軟件,爲全球提供一個可以擺脫美國製裁控制的選擇,
而這個技術必須是真正的實現去美化的,不會被美國的制裁卡脖子和影響的。
第二個意義是滿足中國和全球社會發展的客觀要求
另外不僅僅是美國製裁的問題,全球數字化轉型也帶來了數據量的迅速增長,以及對快速處理海量數據的需求,這也在客觀上要求中國的自主化技術必須快速發展以適應中國社會的需求和全球競爭的需要,發展出自己的芯片,操作系統,數據庫等根技術。
未來中國乃至全球各國,經濟的運行都是基於數字化社會,理解這一點並不複雜,像是這兩年中國銷量在迅速增長的新能源汽車,如果不能聯網和有足夠的車機功能(自動駕駛,語音操縱,高清攝像頭等等),大部分消費者是不會購買的,而這些功能都會產生大量的數據,也需要處理大量的數據。
第三個意義是隻有實現了真正自主纔可能領先
我們在經濟總量上超過美國的時間在越來越近,但全球各國都在向數字化社會轉型,如果我們到時候的數字化底層技術是高度依賴美國的,就不能說我們已經真正的超過了美國,因爲即使你在經濟總量數字超過美國了,但是別人隨時可以把你的底座抽走和破壞,那這種超越是不牢固的,是被別人掌控的。
而實現自主化,則提供了一個超越美國的機會,只有有了真正的自己的東西,纔有可能做出超過別人的東西。
本文講的數據庫,和操作系統,芯片一樣,都是底層根技術中的一環,
而不管是國際環境還是發展的客觀需求,都需要有真正的高性能國產根技術提供給市場,這樣才能真正的實現國內未來長期發展的經濟安全。