斯坦福大模型評測榜:Claude 3第一

三言科技6月23日消息,日前,斯坦福大學基礎模型研究中心發佈大規模多任務語言理解能力評估排行榜,其中,綜合排名前十的大語言模型中有兩款來自中國廠商,分別是阿里巴巴的 Qwen2 Instruct(72B)和零一萬物的 Yi Large(Preview)。

排名如下:

1、Claude 3 Opus(20240229): Anthropic(美國,亞馬遜投資)

2、GPT-4o(2024-05-13):OpenAI(美國)

3、Gemini 1.5 Pro:谷歌(美國)

4、GPT-4(0613):OpenAI(美國)

5、Qwen2 Instruct(72B):阿里巴巴(中國)

6、GPT-4 Turbo(2024-04-09):OpenAI(美國)

7、Gemini 1.5 Pro(0409 preview):谷歌(美國)

8、GPT-4 Turbo(1106 preview):OpenAI(美國)

9、Llama 3(70B):Meta(美國)

10、Yi Large(Preview):零一萬物(中國)