☰

阿里雲通義開源多模態推理模型QVQ在多領域表現突出

12月25日，阿里雲通義千問發佈開源多模態推理模型QVQ-72B-Preview。據瞭解，QVQ的優勢在視覺理解和推理能力，在解決數學、物理、科學等領域的複雜推理問題上表現尤爲突出。目前，開發者可在魔搭社區和HuggingFace平臺上直接體驗。

據瞭解，QVQ是一個會基於視覺進行深度思考推理的大模型。QVQ不但能感知更準確的視覺內容，並據此作出更細緻的分析推理，還會質疑自身假設，仔細審視其推理過程的每一步，經過深思熟慮後給出最後結論。QVQ可以輕鬆識別“梗圖”內涵；看真實照片可合理推斷出物體個數及高度等信息；在面對數學、物理、化學等各科學領域難題，QVQ能像人甚至科學家一樣，給出思考過程和準確答案。

目前，QVQ-72B-Preview已在魔搭社區和HuggingFace等平臺上開源，開發者可上手體驗。截至目前，通義千問Qwen的衍生模型數突破7.8萬個。

阿里雲通義開源多模態推理模型QVQ在多領域表現突出

相關資訊