張鈸院士:從技術層面解決人工智能安全問題

中國科學院院士清華大學人工智能研究院院長張鈸受訪者供圖

當前,由人工智能引領的新一輪科技革命產業變革方興未艾。在移動互聯網、大數據、超級計算、傳感網、腦科學等新理論技術驅動下,人工智能呈現深度學習、跨界融合人機協同、羣智開放、自主操控等新特徵,正在對經濟發展、社會進步、全球治理等方面產生重大而深遠的影響。

近年來,中央在多次重要會議中對人工智能的重要性和發展前景進行闡述。加快發展新一代人工智能是我們贏得全球科技競爭主動權的重要戰略抓手。

當前,我國人工智能產業發展處於什麼階段?如何看待當前的發展態勢?未來應如何引導產業安全有序健康發展?圍繞這些問題,近日,人民網科技頻道專訪了中國科學院院士、清華大學人工智能研究院院長張鈸。

張鈸表示,當前中國在人工智能產業發展方面與國際先進水平的差距並不是很大,但企業質量有待與數量“看齊”,在拓寬應用場景、加強數據安全算法安全等方面加大功夫。

他提出“第三代人工智能”的概念,並表示希望通過政策法規之外的技術途徑解決人工智能的安全問題。

以下爲專訪實錄:

人民網科技:人工智能是新一輪科技革命和產業變革的重要驅動力量,加快發展新一代人工智能是事關我國能否抓住新一輪科技革命和產業變革機遇的戰略問題。對於當前我國人工智能產業發展進程,您怎麼看?

張鈸:業界普遍認爲,人工智能到目前爲止經歷了兩代。“第一代人工智能”是知識驅動型的,也被稱作“符號主義”;“第二代人工智能”是數據驅動型的,就是大家現在非常熟悉的“大數據”“深度學習”。

人工智能最早於1956年起步於國外,而在中國則起步於1978年。不過這60年中,前面40年左右,也就是“第一代人工智能”,其進展較小。真正的進展主要是在近20年裡取得的,也就是“第二代人工智能”。就目前來看,中國和國際上的發展差距並不是很大。

聚焦產業領域,我們所說的人工智能產業實際上分爲兩個大類:一類是傳統信息產業智能化,典型的就是如BAT、字節跳動這樣的互聯網公司。他們在發展過程中積累了大量用戶,然後根據這些用戶數據建立了相應的模型畫像,也就是建立所謂的用戶“知識圖譜”。以物品配送爲例,由用戶位置、商家位置、以及騎手的位置等信息組成的幾千萬甚至上億的數據,建立成庫,再通過人工智能的算法將其匹配、優化,可以大大提升配送效率。通過這種方式升級傳統產業,已經取得了非常大的效益。在這方面,中國是做得不錯的。

人民網科技:人臉識別、智能音箱、智能客服……近年來,不僅越來越多的企業開始涉足人工智能,“人工智能”也成爲高考考生最關注的專業方向之一。在您看來,當前人工智能是否“過熱”?

張鈸:據統計,全球10億美金估值以上的人工智能企業一共有40家,其中美國20家,中國15家。從數量上來說,中國穩處於第二位。然而需要注意的是,這些企業雖然估值很高,但盈利能力還很有限,大部分可能還在虧本。這是不容過度樂觀的。

我認爲,人工智能核心產業應該是獨立於信息產業的,像智能交通、智慧醫療、智慧城市、自動駕駛這樣由人工智能技術發展出來的產業。這方面的產業我們現在還處於發展初期。

人民網科技:最近,“戴頭盔看房”的新聞上了熱搜,也由此引發了人臉識別技術是否被濫用的討論。我們的人工智能產業要想健康發展,還面臨着哪些挑戰?應該如何突破?

張鈸:剛纔我提到,全世界人工智能的“明星”初創企業,中國佔了超過三分之一。數量雖然多,但質量仍有待提升。這些企業除了盈利能力有限之外,還存在嚴重的“同質化現象

爲什麼會出現這種現象?首先,應用場景有限。除了人臉識別、安防等,別的領域不好用。第二,不安全。包括數據的不安全和算法的不安全。我認爲這兩方面是當前制約我們人工智能產業發展的主要因素。

首先是數據的不安全。我們知道,現在人工智能應用效果很大程度上依賴數據質量,但由此會帶來隱私泄漏等安全問題,如果解決不好隱私保護的問題,人工智能產業不可能健康發展。

第二是算法的不安全。所謂算法的不安全,就是在一定條件訓練出來的模型,如果用到條件不大一樣的地方就行不通了。術語也叫做算法對於測試環境脆弱性,或者叫“不魯棒性”。以無人駕駛爲例,人工智能訓練的時候不可能窮盡所有的情境,當遇到新的突發事件便無法處理了。同時,這種脆弱性還使得人工智能系統容易被攻擊、被欺騙。

對於人工智能的安全問題,我們不僅需要從政策、法規等方面進行治理,也要儘可能地從技術層面來解決,這也是我們提出“第三代人工智能”的初衷。

所謂的“第三代人工智能”,其發展路徑融合了第一代的知識驅動和第二代的數據驅動的人工智能,利用知識、數據、算法和算力4個要素,建立新的可解釋和魯棒的AI理論與方法,發展安全、可信、可靠和可擴展的AI技術。

人民網科技:當前,以深度學習爲特徵的“第二代人工智能”還處於方興未艾的階段,業界能否接受“第三代人工智能”的概念?

張鈸:人工智能經歷了60多年的發展,現在看來,前面這些年的發展基本上還只是“序幕”。儘管現在我們看到人工智能的各種應用很多,但實際上用到的技術基本上還是傳統的信息處理,人工智能真正的問題還沒有被深入研究

此前,大多數人還不太能接受“第三代人工智能”的概念,因爲大家對“第二代人工智能”的期望特別高,覺得靠深度學習,人工智能就可以不斷髮展下去。但後來發現並非如此。

我們是在2015年左右較早提出“第三代人工智能”這一觀點的,後來有國外學者在2018年也提出了類似的觀點。

人民網科技:“第三代人工智能”要從技術層面出發來解決人工智能的安全問題,具體該如何發展?

張鈸:發展“第三代人工智能”,我們提出要建立可解釋和魯棒性人工智能理論;然後在此基礎上,發展安全、可信、可靠和可擴展的人工智能技術;最後,推動創新應用。也就是說,要創新應用、發展產業,必須先解決前面兩個問題。

具體來說,我們的方法是把知識和數據結合起來。在這四、五年裡,我們做了一些相關的工作,部分成果也已經實現了產業化應用。最近通過我們孵化的企業RealAI推出的數據安全平臺RealSecure、算法安全平臺RealSafe,就是這些成果的直接體現。

需要指出的是,這些工作目前也只能在特定情況下“就事論事”地去解決一些安全性問題。也就是說,人工智能的安全問題目前還沒有找到根本的解法,而且很可能會成爲永恆的話題。正所謂“道高一尺,魔高一丈”。人工智能安全領域未來將會處於一種攻防不斷對抗的狀態,因此算法也必須不斷更新。

發展“第三代人工智能”將是一個長期的過程。我們現在還處於摸索階段。但好在人工智能有個特點,就是每個階段性成果都會有很大的應用價值。這也是爲什麼各國目前都很重視發展人工智能的重要原因之一。