GPT51被骂3个月后OpenAI终于认怂了
三个月前, GPT 5 发布时,CEO Sam Altman 说:“这是我们最强的模型”。
三个月后,OpenAI 发布 GPT 5.1 ,官方博客罕见地承认:“我们听到了用户的声音,真正好用的 AI 不仅要有智商,还得有情商。”
很显然,OpenAI 终于“认怂”了。
01|GPT 5 怎么了?
先聊聊 GPT 5 到底发生了什么。
2025 年 8 月, GPT 5 以“最强模型”的姿态登场,在各种基准测试碾压对手。
但很快,网上出现了大量吐槽:
有人说新模型太冷漠,感觉在跟机器人对话。
有人怀念 GPT-4o 的温暖。
甚至很多用户觉得,自己跟 GPT-4o 建立的“情感连接”被新版本破坏了。
这就是 GPT-5 面临的尴尬:
技术上它确实更强了,但用户体验上它变得更“正确”却更“无聊”了。
它,不够温暖。
02|GPT 5.1 更新了什么?
11 月 12 日,OpenAI 发布 GPT 5.1 。
核心升级可以用四个字概括: 找回温度 。
两个版本
GPT 5.1 有两个版本。
日常版 GPT 5.1 Instant ,默认变得更温暖、更有人味。
你问它“我很焦虑怎么办”,它不再给你列一堆心理学术语,而是说:“我懂你,最近发生什么了吗?咱们慢慢聊。”
而 GPT-5 则是先给你分析一通“为什么会焦虑”。
另一个是深度推理版 GPT 5.1 Thinking 。
简单任务速度提升一倍,复杂任务思考时间延长一倍。
回答更清晰,晦涩难懂的术语更少。
自适应推理
这应该是 GPT 5.1 最核心的技术突破。
以前的模型要么一直“浅思考”,要么一直“深思考”。
GPT 5.1 能自己判断什么时候该快速回答,什么时候需要深入思考。
比如你问“npm 怎么列出全局安装的包”,以前可能要 10 秒,现在2 秒直接出答案。
但你要是说“帮我重构这个多线程代码”,它会自动花更长时间分析,给出更可靠的方案。
开发者实测显示, GPT 5.1 比 GPT 5 快 1 到 2 倍,同时在工具密集型推理任务中消耗的 token 数量减少了一半。
更精准的指令遵循
这是很有意思、也很实用的一个更新。
你对模型说“始终用 6 个字回复”。
GPT 5 会先说“明白了,所有回复都将是 6 个字”,然后马上违反这一规则。
GPT 5.1 则会在接下来的对话中,严格遵循最初的指令要求,始终用 6 个字回复。
03|编程能力,小有提升
GPT 5.1 正式发布当天,OpenAI 官方只放出了 SWE bench Verified(编程基准测试)的结果。
一方面,准确率更高: GPT 5.1 76.3%,比 GPT 5 72.8%,小有提升。
另一方面,token 效率更高。
不得不说,OpenAI 是会画统计图表的。
除了编程, GPT 5.1 在其他方面的提升,小到可以忽略不计。
所以 OpenAI 官方把它放在了不起眼的小角落(附录)里。
04|个性化:8 种对话风格
另外值得一提的, GPT 5.1 发布的同时,OpenAI 为 ChatGPT 新增了 8 种对话风格:默认、专业、友好、直率、古怪、高效、书呆子、愤世嫉俗。
你可以按需选择。
具体设置路径在:左下角 -> Settings 设置 -> Personalization 个性化 -> Base style and tone 语气语调 。
05|小细节
目前,ChatGPT 所有用户的默认模型都已切换成了 GPT 5.1 ,包括免费用户。
GPT 5 会向付费用户继续开放三个月。
也就是,OpenAI 给了三个月过渡期。
GPT 5.1 API 也已上线。
价格与 GPT 5 相同,但新增了 24 小时缓存保留,理论上能降低调用成本。
结语
GPT 5.1 的发布时间非常微妙。
谷歌的 Gemini 3 即将发布。
OpenAI 选择在这个节点发布这个小版本更新,明显有意为之。
最强的 AI,不一定是最好用的 AI。
你觉得 GPT 5.1 怎么样,比 GPT 5 好用吗?
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/81.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论