MiniMax發佈萬億MoE模型abab 6.5

格隆匯4月17日|MiniMax正式推出abab 6.5系列模型,包含兩個模型:abab 6.5 和abab 6.5s。其中abab 6.5包含萬億參數,支持200k tokens的上下文長度;abab 6.5s跟 abab 6.5使用了同樣的訓練技術和數據,但是更高效,支持200k tokens的上下文長度,可以1秒內處理近3萬字的文本。