☰

斯坦福大模型評測榜：Claude 3第一

三言科技6月23日消息，日前，斯坦福大學基礎模型研究中心發佈大規模多任務語言理解能力評估排行榜，其中，綜合排名前十的大語言模型中有兩款來自中國廠商，分別是阿里巴巴的 Qwen2 Instruct（72B）和零一萬物的 Yi Large（Preview）。

排名如下：

1、Claude 3 Opus（20240229）： Anthropic（美國，亞馬遜投資）

2、GPT-4o（2024-05-13）：OpenAI（美國）

3、Gemini 1.5 Pro：谷歌（美國）

4、GPT-4（0613）：OpenAI（美國）

5、Qwen2 Instruct（72B）：阿里巴巴（中國）

6、GPT-4 Turbo（2024-04-09）：OpenAI（美國）

7、Gemini 1.5 Pro（0409 preview）：谷歌（美國）

8、GPT-4 Turbo（1106 preview）：OpenAI（美國）

9、Llama 3（70B）：Meta（美國）

10、Yi Large（Preview）：零一萬物（中國）

相關資訊

▣ 斯坦福抄襲國產大模型始末
▣ 商湯日日新多模態大模型權威評測第一
▣ OpenAI競爭對手Anthropic官宣Claude 3大模型
▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜
▣ Claude 3 Sonnet模型已登陸Amazon Bedrock
▣ 在「最難LLM評測榜單」上，階躍萬億參數模型拿下中國第一
▣ 福布斯大學排行 UC Berkeley跌落榜首與斯坦福並列第2
▣ 一個彈窗整懵Claude，瞬間玩不轉電腦了 | 斯坦福&港大新研究
▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜超GPT-4o等
▣ OpenAI o1全方位SOTA登頂lmsys排行榜！數學能力碾壓Claude和谷歌模型，o1-mini並列第一
▣ 斯坦福AI項目作者對抄襲中國大模型致歉承諾撤下相關模型
▣ 承認、道歉、刪除！斯坦福AI團隊抄襲中國大模型
Anthropic公佈可同時處理一本長篇小說內容的大型自然語言模型Claude 3
▣ Anthropic大模型測評首超GPT-4
▣ 深度解密大語言模型: 數據, 評估和系統 | 斯坦福最新“構建LLM大語言模型”講座三萬字全文（附視頻）
▣ 全球科技早參丨OpenAI競爭對手官宣Claude 3大模型
▣ 《通用大模型評測標準》發佈
▣ Anthropic發佈“GPT-4 對手”Claude 2大語言模型
▣ 斯坦福團隊迴應抄襲清華系大模型：是一種“不恰當的借鑑”，承諾撤下所有相關模型
▣ 超越GPT-4，斯坦福團隊手機可跑的大模型火了，一夜下載量超2k
《封神榜3》評測報告
▣ AI早知道｜Claude推類GPTs功能Projects；阿里巴巴Qwen-2成全球開源大模型榜首
▣ 斯坦福AI項目套殼中國大模型被抓包，抄襲團隊致歉並承諾撤下相關模型
▣ 炸鍋！斯坦福AI團隊，被曝抄襲中國大模型！各方最新迴應
▣ 大模型像人一樣操控電腦了！Claude 3.5重磅升級，搶先OpenAI
▣ 小K播早報|OpenAI競爭對手Anthropic官宣Claude 3大模型納斯達克中國金龍指數跌近4%
▣ 國產大模型被抄襲事件告終斯坦福團隊致歉並撤下模型面壁：知錯能改，善莫大焉
▣ 斯坦福AI研究團隊已正式道歉涉嫌抄襲大模型已被撤下
▣ 視頻生成模型變身智能體：斯坦福Percy Liang等提出VideoAgent

DMCA | PRIVACY | s@bg3.co