阿里雲發佈開源模型Qwen2
北京商報訊(記者 魏蔚)6月7日,阿里雲發佈開源模型Qwen2-72B。通義千問團隊披露,Qwen2系列包含5個尺寸的預訓練和指令微調模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B爲混合專家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機制。在中英文之外,模型訓練數據中增加了27種語言相關的高質量數據。Qwen2還增大了上下文長度支持,Qwen2-72B-Instruct能夠完美處理128k上下文長度內的信息抽取任務。
相關資訊
- ▣ AI早知道|阿里雲發佈全球最強開源模型Qwen2;快手發佈可靈大模型
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ 阿里發佈開源多模態模型Qwen2-VL,多項性能超越GPT-4o
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 阿里國際發佈最新開源多模態模型Ovis
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ AI早知道|阿里通義將發佈視頻大模型;元象發佈MoE開源大模型
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ AI早知道|智源發佈多模態模型Emu3;阿里巴巴達摩院開源文檔處理模型
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- ▣ AI早知道|騰訊發佈最大規模開源MoE模型;阿里巴巴達摩院發佈八觀氣象大模型
- ▣ 阿里雲開源從模型到工具的AI全棧技術
- ▣ AI早知道|阿里雲發佈音頻模型;OpenAI發佈新技術PVG
- ▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
- ▣ 阿里雲CTO談大模型開閉源之爭:模型應用不能只對接一個形式
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 谷歌發佈 Gemma 2 開源 AI 模型
- ▣ 阿里雲CTO周靖人:通義千問開源模型下載量突破2000萬次
- ▣ 阿里雲財報:AI收入三位數增長 開源模型下載量破2000萬
- ▣ 阿里發佈Qwen2-Math:數學推理全球第一,超越GPT-4o和Claude-3.5
- ▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
- ▣ 阿里雲魔搭發起“ModelScope-Sora開源計劃”
- ▣ 阿里雲的開源算盤
- ▣ 阿里通義將發佈視頻生成大模型
- 阿里開源Qwen2.5-Coder全系列模型 助力編程新手開發各類應用
- ▣ AI早知道|Anthropic發佈Claude 3.5 Sonnet模型;阿里雲推出首個AI程序員
- ▣ Meta發佈LLAMA 3.1開源人工智能模型
- ▣ 阿里國際發佈首個大規模商用翻譯大模型