刚刚谷歌杀疯了Gemini3横扫全榜马斯克喜提一天体验卡
几小时前,谷歌扔下一枚核弹。
没错,是你们心心念念的 Gemini 3 。
当看到 LMArena 排行榜时,我直接惊呆了。
1501 分,有点离谱。
要知道,就在昨天,老马还在为 Grok 4.1 以 1483 分登顶而沾沾自喜。
然而,快乐不过 24 小时,就转移了。
真不愧是你啊,谷歌大王。
01|Gemini 3 到底有多强?横扫!
和上周 OpenAI 的 GPT-5.1 ,以及昨天马斯克的 Grok 4.1 不同,谷歌直接掏出了 Gemini 3 Pro 全套基准测试结果。
这才是大版本更新应该有的底气。
同时,也说明谷歌是有多自信。
看完下面这张基准测试对比表,你就明白这份自信从何而来:
先说结论:
除了编程测试 SWE-Bench Verified,其他所有指标, Gemini 3 Pro 横扫全场。
在“人类最后一场考试”(Humanity's Last Exam,HLE)这个博士级难度测试中, Gemini 3 Pro 拿下了 37.5%。
感觉还好?
要知道这是不使用任何外部工具的纯推理成绩。
同样的条件下, GPT-5.1 准确率 26.5%,而 Claude Sonnet 4.5 更是只有 13.7%,太偏科了这个小老弟。
更夸张的是数学。
MathArena Apex 包含 12 道从 2025 年全球顶级数学竞赛中精选的“地狱级”难题,难度堪比国际数学奥赛(IMO)的压轴题。
Gemini 3 Pro 砍下 23.4% 的新纪录。
在这之前,其他模型基本都在 2% 以下挣扎。
Gemini 3 Pro 其他碾压式的测试结果已经数不胜数。
即便在唯一“失利”的 SWE-Bench Verified 上,它也有 76.2%,仅比第一名 Claude Sonnet 4.5 (77.2%)低 1%。
02|疯狂的 Gemini 3
老粉应该还记得我之前的爆料:
Gemini 3 在憋一个大招,专攻前端开发。
这次,它真的来了。
在 WebDev Arena 这个专门测试一句话生成网页能力的排行榜上, Gemini 3 Pro 直接拿下 1487 的 Elo 综合分,再次碾压所有其他模型。
第二名是 GPT-5 ,仅得 1395 分。
整整超出了快 100 分!
更疯狂的是,谷歌同时发布了一个叫 Google Antigravity 的开发平台。
这不是普通的 AI IDE,而是一个多智能体协作的编程环境。
想象一下,你提需求,多个 AI Agents 同时在编辑器、终端和浏览器里协同工作,一个负责写代码,一个负责测试,一个负责优化。
这就像你突然有了一个完整的、24 小时待命的开发团队。
基于 Gemini 3 Pro ,支持 MacOS、Windows 和 Linux,目前处于免费的预览阶段。
感兴趣的小可爱可以试试。
可能遇到登录不上的情况,多试几次。
03|秒杀级的多模态理解
聊回 Gemini 3 Pro 模型本身。
谷歌 Gemini 系列一直有两个王牌能力:超长上下文和原生多模态。
Gemini 3 Pro 延续了 2.5 Pro 的 100 万 tokens 上下文。
依然是最大的上下文窗口。
多模态也依旧无敌。
文本、图片、PDF、甚至是视频, Gemini 3 Pro 都能直接解析,无需任何预处理。
在 ScreenSpot Pro 这个测试理解屏幕界面的基准上, Gemini 3 Pro 拿下 72.7% 的准确率。
GPT 5.1 ?3.5%(你没有看错)。
Claude 4.5 稍微好一点,36.2%。
另一个小惊喜,谷歌为 Gemini 3 Pro 增加了一个很实用的 API 参数: media_resolution 。
你现在可以根据任务需要,动态调整它处理图片、文档或视频的精细度。
比如处理一份普通的 PDF 合同,用中等分辨率就够,560 个 tokens 搞定。
最后是小可爱们都关心的 API 价格。
很遗憾,谷歌这次没有对免费用户开放 Gemini 3 Pro API 使用权限。
但你仍然可以在 AI Studio 免费体验(只是不能调用 API 了)。
Gemini 3 Pro API 价格比 2.5 Pro 稍贵一丢丢:20 万上下文以内,每百万输入 tokens 2 美元,输出 12 美元;20 万上下文以上,每百万输入 tokens 4 美元,输出 18 美元。
这个价格比 Claude 4.5 Sonnet 的 3 和 15 美元更有性价比。
物有所值。
04|还有高手?!
看到这里,你是不是觉得 Gemini 3 Pro 很强。
No no no,还有比它更强的:
Gemini 3 Deep Think 。
就是那个拿下国际数学奥赛金牌的 Gemini 2.5 Deep Think 的升级版。
性能更强,但还没有发布。
谷歌官方说要进行更多安全评估,再等几周才对 Ultra 订阅用户优先开放。
结语
截至写这篇文章, Gemini 3 Pro 已经在谷歌 AI Studio、Gemini 网页端、Gemini App(慢于网页端)同步上线。
免费可用。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/79.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论