万亿参数阿里Qwen3Max正式发布国产最强大模型来了

阿里,你是真猛。

就在昨天,一个平平无奇的周二,阿里一口气发布了 6 个新模型/Agent!

如此高产,令人惊叹。

网友直接震惊了:阿里发布新模型的速度,就像烤蛋糕一样简单!

小火箭shadowrocket

在 6 个更新里,最靓的仔无疑要属 Qwen3-Max 正式版。

万亿参数是它身上最耀眼的标签,用阿里自己的话说,“大就是好,Just Scale it”。

今天就来聊聊 Qwen3-Max 。

严格意义上来说, Qwen3-Max 并不是一个新模型。

早在两周前,阿里就发布了它的预览版 Qwen3-Max-Preview 。

详情看这里: 阿里通义 Qwen3-Max 深夜上新!

就是这个预览版,发布时间不长,却已经在 LMArena 大模型排行榜排到了第三名。甚至超过了 GPT-5-Chat 。

小火箭shadowrocket

今天发布的则是正式版的 Qwen3-Max 。

除去基模,它面向用户的共有两个模型:非思考模型 Qwen3-Max-Instruct (已发布)及推理模型 Qwen3-Max-Thinking (还在训练中)。

从技术参数来看, Qwen3-Max 确实够“大”:

总参数超过 1T(1 万亿)

预训练使用了 36T tokens 的数据

采用 MoE(混合专家)架构,训练过程一气呵成

而从基准测试结果来看, Qwen3-Max 确实称得上 SOTA。

非思考模型 Qwen3-Max-Instruct 的性能大幅超越之前 Qwen 最厉害的 Qwen3-235B-A22B ,甚至超过了 Claude Opus 4 Non-thinking ,尤其是数学测评 AIME25 和编程测评 LiveCodeBench。

小火箭shadowrocket

推理模型 Qwen3-Max-Thinking 更狠。AIME 25 和 HMMT25 直接双百满分,整体表现接近 GPT-5 Pro 和 Grok 4 Heavy 。

小火箭shadowrocket

Qwen3-Max 虽强,但需要注意的是,它是一个闭源模型。

你可以在 Qwen Chat 在线体验,完全免费。

Qwen Chat:https://chat.qwen.ai/

相较于国内的通义千问,更推荐 Qwen Chat。模型更全,功能更多,灵活性、可玩性更好。

小火箭shadowrocket

如果你想调用 Qwen3-Max 的 API,那就只能在阿里云上付费使用了。

和 Qwen3-Coder 一样, Qwen3-Max 也是阶梯定价,注意小心“token 刺客”。

0-32K tokens:输入 1.2 美元/百万,输出 6 美元/百万

32K-128K tokens:输入 2.4 美元/百万,输出 12 美元/百万

128K-252K tokens:输入 3 美元/百万,输出 15 美元/百万

单从价格看,说实话,性价比一般般。

毕竟,OpenAI 的 GPT-5 API 价格也仅为输入 1.25 美元/百万 tokens,输出 10 美元/百万 tokens。而 GPT-5 的上下文长度可是有 40 万(400K)。

结语

理论上说, Qwen3-Max 可以算作国产 AI 模型目前的“天花板”了。

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/129.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>