谷歌刚刚更新新版Gemini25Pro顶级推理百万上下文还免费

谷歌的 Gemini 2.5 Pro 又更新了,就在几小时前!

Gemini 模型这更新速度没谁了,几乎是一个月一次。

上个版本,是 5 月 6 日发布的 I/O 版。

今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05 ,已正式在 AI Studio、Vertex AI、Gemini App 全面开放试用。

小火箭shadowrocket

尽管新模型还是 Preview,但它很可能就是几周后正式发布的长期稳定版本(GA,General Availability)。

也就是说,这是谷歌接下来一段时间里押注最重的旗舰模型。

01|版本信息小抄:上线时间、上下文、接入方式

版本代号 : gemini-2.5-pro-preview-06-05

上线时间 :2025 年 6 月 5 日

当前阶段 :Public Preview,预计数周内升级为 GA 稳定版

上下文窗口 :

输入上限:1,048,576 tokens(真 100 万)

输出上限:65,536 tokens(64 K)

接入方式 :Google AI Studio、Vertex AI、Gemini App

新增特性 :支持“thinking budget”(推理预算)—— 可以控制思考成本/响应时长

小火箭shadowrocket

02|这次真有提升?几个值得注意的性能指标

推理能力:更强了!

这版 Gemini 模型在三个极难的基准测试上表现非常强:

HLE(高难度智力综合测试)

AIDER(代码与推理基准测试)

GPQA(研究生难度的问答测试)

在这些近乎 "竞赛级推理" 的测试中, 06-05 版 Gemini 2.5 Pro 跑赢了 o3 、 Claude Opus 4 、 Grok 3 以及 DeepSeek R1 。

用谷歌官方的话说:重回巅峰(回归 SOTA 水平)。

SOTA,“State of the Art”的缩写,意思是“当前最强水平”。

小火箭shadowrocket

编码能力:WebDevArena 继续第一!

WebDevArena 榜单 Elo 分数从上一个版本的 1408 提升到了 1443 ,继续占据榜首。

AIDER Polyglot 等多语言代码基准中也稳居第一。

特别适合构建 Web App、自动化 UI、写前端动效、动画播放器等。

支持长代码上下文输入(100 万 tokens),能一口气跑完一整个项目文件。

小火箭shadowrocket

响应质量:格式更整洁,回答更像“人话”

Google 官方在文档里明确提到,他们修复了 03-25 版本在非编码任务上的“回退问题”。

同时,在响应风格和结构上做了优化,回答格式更规整;更有创意。

除此之外, 06-05 版本引入了一个新功能:“thinking budget”(思考预算)。

它允许你在每次使用模型时设定一个“预算范围”,来控制模型在推理阶段的资源(token)消耗。

预算越高,模型的推理就越深入全面;预算低时,它则倾向于给出更快速但可能浅显的结果。这就像给模型加了一个“思维深度的调节钮”,既照顾成本,也给用户更大灵活性。

小火箭shadowrocket

03|怎么用?

和之前一样,新版 Gemini 2.5 Pro Preview 06-05 目前已经可以在谷歌 AI Studio 中免费体验。

百万上下文,多模态(甚至支持解析视频),顶级推理能力,再考虑到能免费用, Gemini 2.5 Pro 简直香到爆!

小火箭shadowrocket

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/227.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>