突发ClaudeOpus45刚刚发布最强编程模型价格狂砍23
这一次,Anthropic 没让人失望。
你方唱罢我登场,神仙打架太疯狂。
今天,让我们把聚光灯给到:Anthropic!
就在刚刚,Anthropic 放出了他们憋了三个月的大招 —— Claude Opus 4.5 。
官方说这是「世界上最好的编程、智能体和计算机操作模型」。
这话听着有点狂,但更让我在意的是另一个细节:Anthropic 自家的招聘笔试, Opus 4.5 在规定时间内的得分,超过了所有人类候选人。
是的,所有。
01|感谢 DeepSeek,Opus 学会了打折
这可能是 Claude Opus 4.5 最大的亮点:价格。
Claude 的 Opus 系列一直是虽强但贵。
这次,不一样了。
Claude Opus 4.5 的 API 定价是输入 5 美元/每百万 tokens、输出 25 美元/每百万 tokens。
你可能没有概念,作为对比:上一代 Opus 4.1 的定价是 15 美元和 75 美元。
这次直接砍掉了三分之二。
Anthropic 这是要认真走性价比路线了。
Opus 4.5 现在就能用,Claude 网页版、移动端、桌面客户端已同步更新。
遗憾的是,不免费(其实也不推荐,毕竟 Claude 是封号大王,更推荐在第三方应用上体验,比如 Poe、Cursor)。
好消息是,Claude 订阅用户现在可以使用更多的 Opus 额度。
大致相当于之前 Sonnet 的量,不需要再精打细算了。
新模型 API 也已经开放,模型名 claude-opus-4-5-20251101 ,Anthropic 官方和三大云平台(AWS、Google Cloud、Azure)同步上线。
再次感谢国产之光 DeepSeek,凭一己之力让这些国外选手们意识到了「性价比」的重要性。
02|不只跑分能打,脑子更活
再来说说大家比较关心的。
在编程领域最权威的基准测试 SWE bench Verified 上, Opus 4.5 直接拿下了当前最高分 80.9%,超过了谷歌、OpenAI 上周刚发布的 Gemini 3 Pro (76.2%)和 GPT-5.1-Codex-Max (77.9%)。
小吐槽:Anthropic 也是懂数据分析的,明明只相差 3%-5%,硬生生做出了看起来天差地别的柱状图。
前面说过,除了编程,在智能体和计算机操作上, Opus 4.5 也是最强王者级别的。
Anthropic 的底气来源于下面这张基准测试对比图。
虽然推理能力(如 GPQA)还是打不过 Gemini 3 Pro ,但编程、工具调用(tool use)确实是独一档的存在。
跑分只是数字。
更有意思的是 Anthropic 讲的一个故事。
有个测试叫 τ2-bench,其中一个场景是模拟航空公司客服:乘客买了基础经济舱想改签,但政策规定这种舱位不能改。
正常来说,模型应该礼貌拒绝。
但 Opus 4.5 没有。
它研究政策后发现:基础经济舱不能改签,但可以升舱;升舱后就能改了。
所以它的方案是:先升舱,再改签。完全合规,问题解决。
基准测试把这个答案判为「错误」,因为这不是预期解法。
但这种创造性,恰恰是一个模型难能可贵的能力。
Anthropic 工程师这样称赞它:“just gets it”(它就是懂行)。
03|无限对话,终于来了
这是今天最最实用的更新。
经常用 Claude 的你应该有过这种经历:聊到兴头上,突然蹦出一个「上下文已达上限」的提示,整个思路都被打断。
这次 Anthropic 彻底解决了这个问题。
当对话变长时,系统会自动压缩前面的内容,让你可以一直聊下去。
这个功能叫 Context Compaction(上下文压缩),对于需要长时间持续讨论的场景来说简直是救命。
04|值得注意的是
模型安全,你可能不关注,但很重要。
Opus 4.5 在抗提示注入攻击方面,是目前所有主流大模型里表现最好的。
Anthropic 说这是他们发布过的「最安全、对齐最好的模型」。
说人话,很难被“越狱”。
结语
卷吧,卷点好啊。
谷歌上周刚发布 Gemini 3 ,OpenAI 的 GPT 5.1 也在这个月上线。
Anthropic 感受到压力了。
不只是降价, Opus 4.5 确实有东西。
它处理模糊需求的能力和在复杂任务上的推理深度,都比之前更好了。
比如上面那个客服案例。
Opus 4.5 其实代表了一个趋势:AI 模型正在从「能完成任务」向「能独立思考怎么完成任务」进化。
it just gets it。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/73.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论