產業導入生成式AI 邁步
由石化、醫療、電子業等跨領域業者合作的繁體中文專家模型「Project TAME」昨(1)日正式發表並免費供企業下載模型訓練,以在地化文化及用語,協助臺灣產業快速導入生成式AI落地應用。
這是電子業、石化業、醫療、法律等產業界提供專業領域的資料,用5,000億個字(token)訓練的語言模型,例如能精準解釋買東西「很盤」就是吃虧的意思,而Project TAME的考試成績,如臺灣的大學學測、律師考試等,都超越GPT-4o、Gemini等其他語言模型。
「Project TAME」由長春集團、和碩聯合科技、長庚醫院、欣興電子等企業攜手臺大資工、臺大資管,與律果科技、亞太智能機器合作,以輝達(NVIDIA)超級電腦「Taipei-1」提供算力與算法、相關的訓練框架,開源語言模型採用Llama 3 8B、70B版本。
該模型利用多家企業提供領域專業資料進行訓練,是唯一擁有產業專業知識的繁體中文開源模型。參與訓練的臺大博士班學生林彥廷指出,模型具有在地化的特色,避免以美國爲主的意識形態、文化觀點,Project TAME甚至可精確回答買東西「很盤」就是吃虧的意思。
一般企業要從零開始訓練10億參數模型,約需耗資3.8億元、耗時576小時,但以Project TAME 700億參數模型,企業導入只需1,600萬元的成本、3.5小時(模型迭代一次)就能訓練企業內部資料,大幅降低導入成本及時間。
長春集團董事長林顯東表示,希望建立臺灣文化的語言模型,爲繁體中文使用者帶來更精準的本地AI應用,除提升用戶體驗,也將提升臺灣在AI技術領域的競爭力,目前已開放各企業免費下載使用,長春集團內部已將「總裁講工安」做成資料庫可隨時生成教材,還可以AI預約會議室、做摘要。
律果科技表示,法律內容有很強的在地化需求,因此協助Project TAME加入臺灣法律語料進行訓練,目前在臺灣律師考試題目上,Project TAME分數均超過所有其他模型。欣興電子透過公司內部資料庫,把模型調校成內部專用的產業專家模型,預計未來可提供更符合公司內部作法的準確建議,提升工作效率。
延伸閱讀