臺版ChatGPT來了!TAIDE寫信有禮貌 學測作文題目也難不倒
國科會也於記者會現場實測,要求TAIDE-13B撰寫一篇活動致詞稿。記者許維寧/攝影
國科會今天召開第10次委員會議報告「TAIDE推動成果與未來展望」,並於現場提供媒體實測,由TAIDE-13B試寫學測國文寫作題、歸納兩篇閱讀文章重點,進而撰寫具備起承轉合的文章;現場亦由媒體出題,由TAIDE撰寫邀訪信件。國科會主委吳政忠表示,最快今年四月中釋出商用TAIDE-7B版本,開放業者用於研發。
國際大型語言模型(LLM)時常產生偏誤或不符本土文化的迴應,國科會於去年4月啓動TAIDE計劃,欲打造專屬臺灣的大型語言模型。TAIDE團隊盤點公私部門資料並個別洽商授權,整備89.4GB繁體中文資料,並建置最新GPU運算資源,已開發TAIDE-7B商用版本,以及TAIDE-13B學研用版本模型,具備多輪對話以及阻絕不恰當迴應的能力。
國科會副執行秘書楊佳玲表示,近年LLM崛起,如ChatGPT推出僅兩個月使用人數即破億,但國際上LLM訓練時,中文仍以簡體資料庫爲主,內容便容易偏離臺灣文化和價值觀,爲此,臺灣必須打造、掌握自己的大型語言模型。
楊佳玲談到,TAIDE-13B在撰寫文章、信件、摘要、中翻英以及英翻中時,表現已和ChatGPT3.5相當,且TAIDE擁有更豐富的在地知識。
國科會也於記者會現場實測,提供TAIDE-13B今年學測國寫第一大題試題兩篇文章,並要求寫出兩文的主旨,TAIDE能確實歸納兩文重點,並且呼應題幹中的「genius」和「星巴克咖啡大師」;第二輪實測則要求回答「標籤化」使用於人身上的正面與負面作用,TAIDE仍記得兩文內容,且能撰寫題目要求;第三輪實測,TAIDE亦能撰寫具起承轉合的文章,並確實寫出對「標籤化」的看法。
另外,現場也要求TAIDE規劃臺中一日遊,TAIDE能規劃行程和時間,並另推薦北屯區的風景名勝;ChatGPT同樣能規劃旅遊行程,但則給出了虛構的「東海大學櫻花步道」,需要使用者再行確認。
記者會現場亦開放媒體出題,媒體要求TAIDE撰寫一封「有禮貌」的邀訪信予主委吳政忠,主旨爲欲採訪臺灣AI發展和半導體佈局,TAIDE則確實能呈現採訪媒體頭銜、問題,並於信件內加入敬語。
吳政忠形容,TAIDE形同政府蓋地基,進而讓各行各業在地基上興建樓房,盼能成爲各行業的基礎。最快今年四月中釋出商用TAIDE-7B,開放業者用於研發,屆時可望將TAIDE模型內建於筆記型電腦或手機內。
吳政忠也表示,不會排斥國人或企業使用ChatGPT,但畢竟使用了中國大陸的資料,因此國人還須佐以判斷;而TAIDE則是使用臺灣資料,相信對國人來說更友善與可靠。
國科會今天召開第10次委員會議報告「TAIDE推動成果與未來展望」。記者許維寧/攝影