Gemini3DeepThink谷歌最强模型来了月费1800值吗

谷歌继续发力。

Gemini 3 Deep Think ,这个基于 Gemini 3 Pro 、让谷歌的安全团队额外审查了半个多月的「深度思考」模型,昨天正式上线了。

这是谷歌迄今为止最强的 AI 模型。

然而,目前 Deep Think 仅对 250 美元/月的 AI Ultra 付费用户开放。

小火箭shadowrocket

01|Deep Think,它有多猛?

它是几乎所有最难基准测试的第一名。

Humanity's Last Exam (号称「人类最后一场考试」)准确率 41.0%,这是不借助任何工具的裸考成绩。

HLE 这个测试的设计初衷就是出一套题难倒所有 AI,而 Gemini 3 Deep Think 直接突破新高。

GPQA Diamond 得分高达 93.8%,这是博士级别的科学推理测试。

ARC-AGI-2 测试拿下 45.1%(开启工具调用),而当初的 Gemini 2.5 Pro 仅得分 4.9%。

这是一个今年 3 月刚推出的新基准测试,由 Keras 之父 François Chollet 主导研发。

它专门用来检验 AI 解决新问题的能力,45.1% 同样是目前公开的最高分。

小火箭shadowrocket

更值得一提的是它的工作原理:「并行推理」。

普通 AI 思考问题是线性的,想一步,走一步。

但 Deep Think 会同时展开多条思考路径,就像人类头脑风暴时会从多个角度切入一样。

谷歌的说法是「探索多个假设」,然后综合出最优解。

多说一句,像这种多智能体协同(Multi-agent)的架构,马斯克的 Grok 4 Heavy 也是。

02|但是

入场券是每月 250 美元。

折合人民币大概 1800 块,这是谷歌 AI Ultra 的订阅费用。

小火箭shadowrocket

这个价格比 OpenAI 的 ChatGPT Pro(200 美元每月)还要贵一些。

算上新用户的前三个月半价优惠,也要 125 美元每月。

但说实话,这个订阅确实有点东西的。

30 TB 谷歌云盘、YouTube Premium 会员、视频生成工具 Flow 和 Veo 3.1 、 NotebookLM 最高权限。

然而核心卖点显然是这个 Deep Think 。

AI Ultra 的目标用户还是很明确的,面向专业开发者、研究人员和重度创作者。

03|Pro vs Ultra

对于大多数小可爱来说, Gemini 3 Pro 已经足够用了。

免费和谷歌 AI Pro 用户都能用。

Pro 的使用额度会高一些,100 次/天;Ultra 则更高,500 次/天。

相比于普通模型, Deep Think 更像是给特定场景准备的。

当你需要解决极其复杂的数学证明、多步骤的逻辑推演,或者需要反复验证的科学问题时,它才能发挥出价值。

并且,即使是 Ultra 用户,每天也只有 10 次的额度以及 192K 的上下文长度。

这里附上一张来自谷歌官方对于各个 Plan 的对比截图。

小火箭shadowrocket

结语

45.1% 的 ARC-AGI-2 成绩很好,但人类平均分是 60%。

41.0% 的 Humanity's Last Exam 成绩也不错,但人类专家组的正确率差不多有 90%。

差距还在,但差距正在加速缩小。

我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/61.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>