☰

邁向AI 2.0 仰賴基礎科研突破

熱門話題

ChatGPT誕生已經多時，中國產學界競相發展，爲何中外高等院校難以首先誕生大模型，大陸同濟大學電腦系副主任何良華教授兼認爲，學界很難出現ChatGPT這樣的模型，主要是算力和數據的問題。北京清華大學人工智慧研究院常務副院長孫茂松指出，中國乃至全球發展大模型，最終的突破關鍵，還是在基礎科學的突破。

大陸《第一財經》報導，何良華8月24日在2023世界人工智慧大會（WAIC）青年優秀論文獎頒獎儀式暨青年科學家論壇上說，大模型非常吃算力，大學也難以去購買大量的算力。而有了算力之後，要把參數訓練得比較成熟，需要海量的數據，但是學界是拿不到這麼多數據。除了這兩個問題，還和學界自身的需求有關。

「我們都期望在理論上做一些創新。比如我的學生如果跟我說現在需要幾千張卡（算力）來做一個事情，我所有的經費給他也不夠，課題也難以立項。因爲它既不是應用，又不是理論，找不到這樣一筆經費，研究只能中斷。」

大陸科技部人工智慧發展研究中心5月底發佈《中國人工智慧大模型地圖研究報告》顯示，當前大陸10億參數規模以上的大模型已發佈79個。

《第一財經》報導，不久前浦江基礎科學發展論壇上，孫茂松教授指出，中國乃至全球發展大模型最終的突破關鍵，是基礎科學的突破。

他說，對於大模型，當前的問題在於並不清楚OpenAI的機理是如何運作的，就連推出ChatGPT的OpenAI公司執行長阿特曼也表示，雖然做出了GPT，但也不清楚發生的原理，「實際上就是對這個機理還不清楚」。

孫茂松認爲，現有的人工智慧模型已經能做到說話通順，但這個問題的內在實現邏輯仍然十分複雜。如果弄清楚了大模型裡的規律、ChatGPT背後的機理，就有可能克服現有人工智慧大模型的侷限性，建立下一代人工智慧的理論和模型。

和團隊率先在中國發布具備ChatGPT能力語言模型MOSS的復旦大學電腦學院教授邱錫鵬表示，大模型更頂尖的研究機構在業界，這是不可迴避的事實。從DeepMind再到OpenAI，都是如此。美國很多著名大學，從研究實力上看，已經落後於這些頂級研究機構。

相關資訊