Kimi發佈新一代推理模型,數學能力對標OpenAI o1系列

11月16日,Kimi正式發佈新一代數學推理模型k0-math。基準測試顯示,Kimi k0-math的數學能力可對標OpenAI o1系列可公開使用的兩個模型:o1-mini和o1-preview。在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中,k0-math初代模型成績超過o1-mini和o1-preview模型。在兩個難度更大的競賽級別的數學題庫OMNI-MATH和AIME基準測試中,k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%。Kimi創始人楊植麟介紹稱,k0-math模型和Kimi探索版,未來幾周將會分批上線Kimi網頁版和Kimi智能助手APP。