Gemini3DeepThink谷歌最强模型来了月费1800值吗

小火箭shadowrocket • 2026年1月21日 am7:37 • 小火箭

谷歌继续发力。

Gemini 3 Deep Think ，这个基于 Gemini 3 Pro 、让谷歌的安全团队额外审查了半个多月的「深度思考」模型，昨天正式上线了。

这是谷歌迄今为止最强的 AI 模型。

然而，目前 Deep Think 仅对 250 美元/月的 AI Ultra 付费用户开放。

01｜Deep Think，它有多猛？

它是几乎所有最难基准测试的第一名。

Humanity's Last Exam （号称「人类最后一场考试」）准确率 41.0%，这是不借助任何工具的裸考成绩。

HLE 这个测试的设计初衷就是出一套题难倒所有 AI，而 Gemini 3 Deep Think 直接突破新高。

GPQA Diamond 得分高达 93.8%，这是博士级别的科学推理测试。

ARC-AGI-2 测试拿下 45.1%（开启工具调用），而当初的 Gemini 2.5 Pro 仅得分 4.9%。

这是一个今年 3 月刚推出的新基准测试，由 Keras 之父 François Chollet 主导研发。

它专门用来检验 AI 解决新问题的能力，45.1% 同样是目前公开的最高分。

更值得一提的是它的工作原理：「并行推理」。

普通 AI 思考问题是线性的，想一步，走一步。

但 Deep Think 会同时展开多条思考路径，就像人类头脑风暴时会从多个角度切入一样。

谷歌的说法是「探索多个假设」，然后综合出最优解。

多说一句，像这种多智能体协同（Multi-agent）的架构，马斯克的 Grok 4 Heavy 也是。

02｜但是

入场券是每月 250 美元。

折合人民币大概 1800 块，这是谷歌 AI Ultra 的订阅费用。

这个价格比 OpenAI 的 ChatGPT Pro（200 美元每月）还要贵一些。

算上新用户的前三个月半价优惠，也要 125 美元每月。

但说实话，这个订阅确实有点东西的。

30 TB 谷歌云盘、YouTube Premium 会员、视频生成工具 Flow 和 Veo 3.1 、 NotebookLM 最高权限。

然而核心卖点显然是这个 Deep Think 。

AI Ultra 的目标用户还是很明确的，面向专业开发者、研究人员和重度创作者。

03｜Pro vs Ultra

对于大多数小可爱来说， Gemini 3 Pro 已经足够用了。

免费和谷歌 AI Pro 用户都能用。

Pro 的使用额度会高一些，100 次/天；Ultra 则更高，500 次/天。

相比于普通模型， Deep Think 更像是给特定场景准备的。

当你需要解决极其复杂的数学证明、多步骤的逻辑推演，或者需要反复验证的科学问题时，它才能发挥出价值。

并且，即使是 Ultra 用户，每天也只有 10 次的额度以及 192K 的上下文长度。

这里附上一张来自谷歌官方对于各个 Plan 的对比截图。

结语

45.1% 的 ARC-AGI-2 成绩很好，但人类平均分是 60%。

41.0% 的 Humanity's Last Exam 成绩也不错，但人类专家组的正确率差不多有 90%。

差距还在，但差距正在加速缩小。

我是木易，一个专注 AI 领域的技术产品经理，国内 Top2 本科 + 美国 Top10 CS 硕士。

版权声明：
作者：小火箭shadowrocket
链接：https://www.shadowrocket888.vip/61.html
来源：小火箭官网
文章版权归作者所有，未经允许请勿转载。

THE END

小火箭小火箭下载小火箭加速小火箭加速器小火箭官网小火箭节点

二维码

Anthropic悄悄放大招Claude上线全局记忆越聊越聪明

< <上一篇

Gemini3撤了但我们看到了AI模型炸裂的下一站

下一篇>>

搜索内容

Gemini3DeepThink谷歌最强模型来了月费1800值吗

取消回复

共有 0 条评论

小火箭高速节点推荐

标签

热门文章