中科院自動化所發佈跨模態通用人工智能平臺“紫東太初”

中國科學院自動化研究所(中科院自動化所)成功研發的跨模態通用人工智能(AI)平臺“紫東太初”9日正式對外發布，其以多模態大模型爲核心，基於全棧國產化基礎軟硬件平臺，可支撐全場景AI應用。

中科院自動化所所長、中國科學院大學人工智能學院院長徐波研究員當天在2021世界人工智能大會上就人工智能的最新進展做學術報告，發佈“紫東太初”並展示該所最新打造的虛擬人“小初”，對通用多模態大模型的人機對話進行演示。

徐波介紹說，依託面向超大規模的高效分佈式訓練框架，中科院自動化所構建出具有業界領先性能的中文預訓練模型、語音預訓練模型、視覺預訓練模型，並開拓性地通過跨模態語義關聯實現圖文音(視覺-文本-語音)三模態統一表示，構建三模態預訓練大模型，賦予跨模態通用人工智能平臺多種核心能力。

“紫東太初”兼具跨模態理解和生成能力，與單模態和圖文兩模態相比，其採用一個大模型就可以靈活支撐圖文音全場景AI應用，具有在無監督情況下多任務聯合學習、快速遷移到不同領域數據的強大能力。其引入語音模態後的多模態預訓練模型，可實現共性圖文音語義空間表徵和利用，並突破性直接實現三模態的統一表示。

徐波指出，“紫東太初”跨模態通用人工智能平臺包括三大關鍵技術和六大核心能力。三大關鍵技術分別是：多模態理解與生成多任務統一建模、面向國產化軟硬件的高效訓練與部署、多模態預訓練模型架構設計與優化；六大核心能力則體現爲：多模態統一表示與語義關聯、跨模態內容轉化與生成、預訓練模型網絡架構設計、標註受限自監督模型學習、模型適配與分佈式訓練、模型輕量化與推理加速。

他表示，“大數據+大模型+多模態”將改變當前單一模型對應單一任務的人工智能研發範式，多模態大模型將成爲不同領域的共性平臺技術，是邁向通用人工智能路徑的探索，具有廣闊應用前景。

同時，中科院自動化所全棧國產化通用人工智能平臺的成功實踐，將使人工智能研發的規則發生重大變革，對中國實現人工智能領域科技創新、佔領核心技術高地具有重要意義。

基於“紫東太初”打造的虛擬人“小初”，形象展示出不同模態間的互相轉換和生成實例，涵蓋視頻描述、智能問答、圖像檢索、吟詩作賦、中文續寫、雙語翻譯、語音識別等多個功能。徐波認爲，這表明，通過圖文音三模態的關聯與協同，可以有效提升機器的理解和生成能力，讓AI接近人類想象力。(記者孫自法)

中科院自動化所發佈跨模態通用人工智能平臺“紫東太初”

相關資訊