☰

百川智能發佈千億級參數的大語言模型Baichuan3

觀點網訊：1月29日，百川智能發佈了超千億參數的大語言模型Baichuan3。該模型採用“動態數據選擇”、“重要度保持”及“異步CheckPoint存儲”等技術，顯著提升了性能，相較業界主流框架提升超過30%。其穩定訓練時間長達一個月以上，且故障恢復迅速，不超過10分鐘。在多項能力測評中，如CMMLU、GAOKAO、AGI-Eval以及數學和代碼專項評測MATH、HumanEval、MBPP等，Baichuan3均表現出色。

在醫療領域權威評測MCMLE、MedExam、CMExam中，它更成爲中文醫療任務最佳大模型。Baichuan3通過“迭代式強化學習”技術，進一步增強了語義理解和生成能力。

本文源自觀點網

相關資訊

▣ 夸克發佈自研千億級參數大模型
▣ 通義千問發佈首個千億級參數開源模型
▣ 百川智能發佈超千億大模型Baichuan 3，中文評測超越GPT-4
▣ 階躍星辰發佈Step-2萬億參數MoE語言大模型預覽版
▣ 數智早參｜科大訊飛多語言大模型發佈；Wolfspeed擱置近30億歐元建廠計劃
▣ 全球首個百億參數級遙感解譯基礎模型發佈
▣ AI早知道｜零一萬物發佈千億參數模型；智譜AI上線大模型開放平臺
▣ 通義千問開源千億級參數模型
▣ 百度智能雲發佈3款輕量級大模型+2款場景大模型
▣ vivo發佈自研藍心大模型：5款大模型覆蓋十億、百億、千億三個量級
AI飛速發展陸10億級參數規模以上大模型已發佈79個
▣ 智源發佈全球首個低碳萬億語言模型Tele—FLM
▣ 全球首個億級參數量地震波大模型“諦聽”發佈
▣ 百川智能發佈2代開源大模型，王小川：已超越LLaMA 2
▣ 王小川：有信心年底發佈國內最好的語言大模型
▣ 數智早參｜OpenAI官宣推出新的大語言模型GPT-4o；騰訊混元文生圖大模型開源
▣ 「天工大模型3.0」4月17日正式發佈——同步開源4000億參數MoE超級模型，性能超Grok1.0
▣ 微軟發佈Copilot智能體還帶來了本機小語言模型
▣ 天津大學“伏羲傳語”多語言大模型正式發佈並開源，應對大模型多語言能力不足
▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
▣ 聯想發佈AI Now 人工智能入口，集成Meta Llama 3本地大型語言模型
▣ 聯發科技發佈天璣8300最高支持100億參數AI大語言模型搭載手機2023年底上市
▣ 中國石油發佈330億參數崑崙大模型
▣ 百川智能與鵬城實驗室宣佈合力研發“鵬城-百川·腦海33B”大模型
▣ 百度智能雲發佈千帆大模型平臺3.0：一句話即可生成企業級應用
▣ 科大訊飛將在港投資 4 億港元，專注大語言模型等開發；英偉達 Mistral AI 聯手發佈 12B 參數小模型丨AI情報局
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 百度文心一言升級企業級大模型服務平臺“文心千帆”今日發佈
▣ 快手CEO程一笑：已開始研發超千億規模語言大模型以及多模態大模型

DMCA | PRIVACY | s@bg3.co