國家數據局徵求意見:支持開展通用人工智能大模型和垂直領域人工智能大模型訓練

人民網北京12月15日電 (記者申佳平)據國家發展改革委官網消息,爲發揮數據要素乘數效應,賦能經濟社會發展,國家數據局起草了《“數據要素×”三年行動計劃(2024-2026年)(徵求意見稿)》(以下簡稱《徵求意見稿》),並向社會公開徵求意見。《徵求意見稿》提出,支持開展通用人工智能大模型和垂直領域人工智能大模型訓練。

隨着新一輪科技革命和產業變革深入發展,數據作爲關鍵生產要素的價值日益凸顯。《徵求意見稿》指出,近年來,我國數字經濟快速發展,數字基礎設施全球領先,數字技術和產業體系日臻完善,爲更好發揮數據要素作用奠定了堅實基礎。但與此同時,也存在場景釋放不夠、數據供給不足、流通機制不暢等問題,爲此,通過實施“數據要素×”行動,發揮我國海量數據規模和豐富應用場景優勢,推動數據在不同場景中發揮千姿百態的乘數效應,促進我國數據基礎資源優勢轉化爲經濟發展新優勢。

《徵求意見稿》要求,到2026年底,數據要素應用場景廣度和深度大幅拓展,在經濟發展領域數據要素乘數效應得到顯現,打造300個以上示範性強、顯示度高、帶動性廣的典型應用場景,產品和服務質量效益實現明顯提升,涌現出一批成效明顯的數據要素應用示範地區,培育一批創新能力強、市場影響力大的數據商和第三方專業服務機構,數據產業年均增速超過20%,數據交易規模增長1倍,場內交易規模大幅提升,推動數據要素價值創造的新業態成爲經濟增長新動力,數據賦能經濟提質增效作用更加凸顯,成爲高質量發展的重要驅動力量。

《徵求意見稿》部署了“數據要素×智能製造”“數據要素×智慧農業”“數據要素×商貿流通”“數據要素×交通運輸”“數據要素×金融服務”“數據要素×科技創新”“數據要素×文化旅遊”“數據要素×醫療健康”“數據要素×應急管理”“數據要素×氣象服務”“數據要素×智慧城市”“數據要素×綠色低碳”等12項重點行動。

在“數據要素×科技創新”重點行動中,《徵求意見稿》提出,以科學數據支持大模型開發,深入挖掘包含科技文獻在內的各類科學數據,通過細粒度的知識抽取,構建科學知識資源底座,建設高質量語料庫和基礎科學數據集,支持開展通用人工智能大模型和垂直領域人工智能大模型訓練。

在保障支撐方面,《徵求意見稿》提出提升數據供給水平。完善數據資源體系,在科研、文化、交通運輸等領域,推動科研機構、龍頭企業、技術服務商等開展行業共性數據資源庫建設,打造高質量人工智能大模型訓練數據集。加強公共數據資源供給,支持在重點領域開展公共數據授權運營試點。

同時,《徵求意見稿》要求優化數據流通環境。打造安全可信流通環境,深化隱私計算、可信數據空間、區塊鏈等技術應用,充分依託已有設施,探索建設重點行業和領域數據流通平臺,促進數據合規高效流通使用。加強數據安全保障。落實數據安全法規制度,建立健全數據安全治理體系,完善數據分類分級保護制度,落實網絡安全等級保護、關鍵信息基礎設施安全保護等制度,加強個人信息保護,提升數據安全保障水平。