邁向AI 2.0 仰賴基礎科研突破

熱門話題

ChatGPT誕生已經多時,中國產學界競相發展,爲何中外高等院校難以首先誕生大模型,大陸同濟大學電腦系副主任何良華教授兼認爲,學界很難出現ChatGPT這樣的模型,主要是算力和數據的問題。北京清華大學人工智慧研究院常務副院長孫茂松指出,中國乃至全球發展大模型,最終的突破關鍵,還是在基礎科學的突破。

大陸《第一財經》報導,何良華8月24日在2023世界人工智慧大會(WAIC)青年優秀論文獎頒獎儀式暨青年科學家論壇上說,大模型非常吃算力,大學也難以去購買大量的算力。而有了算力之後,要把參數訓練得比較成熟,需要海量的數據,但是學界是拿不到這麼多數據。除了這兩個問題,還和學界自身的需求有關。

「我們都期望在理論上做一些創新。比如我的學生如果跟我說現在需要幾千張卡(算力)來做一個事情,我所有的經費給他也不夠,課題也難以立項。因爲它既不是應用,又不是理論,找不到這樣一筆經費,研究只能中斷。」

大陸科技部人工智慧發展研究中心5月底發佈《中國人工智慧大模型地圖研究報告》顯示,當前大陸10億參數規模以上的大模型已發佈79個。

《第一財經》報導,不久前浦江基礎科學發展論壇上,孫茂松教授指出,中國乃至全球發展大模型最終的突破關鍵,是基礎科學的突破。

他說,對於大模型,當前的問題在於並不清楚OpenAI的機理是如何運作的,就連推出ChatGPT的OpenAI公司執行長阿特曼也表示,雖然做出了GPT,但也不清楚發生的原理,「實際上就是對這個機理還不清楚」。

孫茂松認爲,現有的人工智慧模型已經能做到說話通順,但這個問題的內在實現邏輯仍然十分複雜。如果弄清楚了大模型裡的規律、ChatGPT背後的機理,就有可能克服現有人工智慧大模型的侷限性,建立下一代人工智慧的理論和模型。

和團隊率先在中國發布具備ChatGPT能力語言模型MOSS的復旦大學電腦學院教授邱錫鵬表示,大模型更頂尖的研究機構在業界,這是不可迴避的事實。從DeepMind再到OpenAI,都是如此。美國很多著名大學,從研究實力上看,已經落後於這些頂級研究機構。