GPT51被骂3个月后OpenAI终于认怂了

三个月前, GPT 5 发布时,CEO Sam Altman 说:“这是我们最强的模型”。

三个月后,OpenAI 发布 GPT 5.1 ,官方博客罕见地承认:“我们听到了用户的声音,真正好用的 AI 不仅要有智商,还得有情商。”

小火箭shadowrocket

很显然,OpenAI 终于“认怂”了。

01|GPT 5 怎么了?

先聊聊 GPT 5 到底发生了什么。

2025 年 8 月, GPT 5 以“最强模型”的姿态登场,在各种基准测试碾压对手。

但很快,网上出现了大量吐槽:

有人说新模型太冷漠,感觉在跟机器人对话。

有人怀念 GPT-4o 的温暖。

甚至很多用户觉得,自己跟 GPT-4o 建立的“情感连接”被新版本破坏了。

这就是 GPT-5 面临的尴尬:

技术上它确实更强了,但用户体验上它变得更“正确”却更“无聊”了。

它,不够温暖。

02|GPT 5.1 更新了什么?

11 月 12 日,OpenAI 发布 GPT 5.1 。

核心升级可以用四个字概括: 找回温度 。

两个版本

GPT 5.1 有两个版本。

日常版 GPT 5.1 Instant ,默认变得更温暖、更有人味。

你问它“我很焦虑怎么办”,它不再给你列一堆心理学术语,而是说:“我懂你,最近发生什么了吗?咱们慢慢聊。”

小火箭shadowrocket

而 GPT-5 则是先给你分析一通“为什么会焦虑”。

小火箭shadowrocket

另一个是深度推理版 GPT 5.1 Thinking 。

简单任务速度提升一倍,复杂任务思考时间延长一倍。

回答更清晰,晦涩难懂的术语更少。

自适应推理

这应该是 GPT 5.1 最核心的技术突破。

以前的模型要么一直“浅思考”,要么一直“深思考”。

GPT 5.1 能自己判断什么时候该快速回答,什么时候需要深入思考。

小火箭shadowrocket

比如你问“npm 怎么列出全局安装的包”,以前可能要 10 秒,现在2 秒直接出答案。

但你要是说“帮我重构这个多线程代码”,它会自动花更长时间分析,给出更可靠的方案。

开发者实测显示, GPT 5.1 比 GPT 5 快 1 到 2 倍,同时在工具密集型推理任务中消耗的 token 数量减少了一半。

更精准的指令遵循

这是很有意思、也很实用的一个更新。

你对模型说“始终用 6 个字回复”。

GPT 5 会先说“明白了,所有回复都将是 6 个字”,然后马上违反这一规则。

GPT 5.1 则会在接下来的对话中,严格遵循最初的指令要求,始终用 6 个字回复。

小火箭shadowrocket

03|编程能力,小有提升

GPT 5.1 正式发布当天,OpenAI 官方只放出了 SWE bench Verified(编程基准测试)的结果。

一方面,准确率更高: GPT 5.1 76.3%,比 GPT 5 72.8%,小有提升。

另一方面,token 效率更高。

不得不说,OpenAI 是会画统计图表的。

小火箭shadowrocket

除了编程, GPT 5.1 在其他方面的提升,小到可以忽略不计。

所以 OpenAI 官方把它放在了不起眼的小角落(附录)里。

小火箭shadowrocket

04|个性化:8 种对话风格

另外值得一提的, GPT 5.1 发布的同时,OpenAI 为 ChatGPT 新增了 8 种对话风格:默认、专业、友好、直率、古怪、高效、书呆子、愤世嫉俗。

你可以按需选择。

具体设置路径在:左下角 -> Settings 设置 -> Personalization 个性化 -> Base style and tone 语气语调 。

小火箭shadowrocket

05|小细节

目前,ChatGPT 所有用户的默认模型都已切换成了 GPT 5.1 ,包括免费用户。

GPT 5 会向付费用户继续开放三个月。

也就是,OpenAI 给了三个月过渡期。

GPT 5.1 API 也已上线。

价格与 GPT 5 相同,但新增了 24 小时缓存保留,理论上能降低调用成本。

结语

GPT 5.1 的发布时间非常微妙。

谷歌的 Gemini 3 即将发布。

OpenAI 选择在这个节点发布这个小版本更新,明显有意为之。

最强的 AI,不一定是最好用的 AI。

你觉得 GPT 5.1 怎么样,比 GPT 5 好用吗?

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/81.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>