Em 1º de junho, a Xiyu Technology lançou oficialmente o modelo de nova geração MiniMax M3. Este modelo possui recursos de programação de ponta, contexto ultralongo de até 1M e suporta multimodalidade nativa (imagens, entrada de vídeo e operações de desktop de computador). Tornou-se o primeiro modelo na China a ter estas três capacidades ao mesmo tempo e é atualmente o único modelo de código aberto.


Segundo divulgações oficiais, no conjunto de avaliação de programação SWE-Bench Pro, o M3 obteve pontuação de 59,0%, superando GPT-5.5 e Gemini 3.1 Pro, e próximo do Opus 4.7; na avaliação do Agente Claw-Eval, M3 recebeu a pontuação mais alta; no conjunto de testes multimodal OmniDocBench, o M3 obteve pontuação superior ao Gemini 3.1 Pro.

M3 adota uma nova arquitetura de atenção esparsa MSA (MiniMax Sparse Attention). Em 1 milhão de contextos, o valor de cálculo por token é apenas 1/20 do modelo da geração anterior. O estágio de pré-preenchimento é acelerado em mais de 9 vezes e o estágio de decodificação é acelerado em mais de 15 vezes.

MiniMax atualizou simultaneamente o Código MiniMax do produto Agente e lançou um plano de assinatura Token Plan (Mais 49 yuans/mês, Máximo 119 yuans/mês, Ultra 469 yuans/mês). A API M3 está aberta para uso a partir de agora, e a versão de contexto 512k está disponível com 50% de desconto por tempo limitado, com duração de 7 dias. Os pesos dos modelos e os relatórios técnicos serão de código aberto dentro de 10 dias.