号外号外谷歌CEO实锤暗示Gemini3下周发布AIWeekly11101
📢 本周 AI 快讯 | 1 分钟速览🚀
1️⃣ 🤖 谷歌 Gemini 3 即将发布 :谷歌 CEO Sundar Pichai 暗示 11 月 22 日前后推出,配套图像模型 Nano Banana Pro 支持 4K 输出,预测市场押注额达 1140 万美元。
2️⃣ 🎨 谷歌 Nano Banana 2 意外泄露 :采用多阶段自我纠错机制,支持 2K 原生分辨率与 4K 升频,文字渲染和图表生成能力突出。
3️⃣ ⚡ OpenAI 发布 GPT 5.1 系列 :自适应推理能力显著提升,简单任务响应速度快 2-5 倍,token 使用量减半,新增三种语气预设。
4️⃣ 👥 ChatGPT 试点群聊功能 :支持最多 20 人协作,由 GPT 5.1 驱动,日本、新西兰、韩国和台湾四地率先开放。
5️⃣ 🚀 xAI 推迟 Grok 5 至 2026 Q1 :6 万亿参数规模,性能预计提升 1.4-1.6 倍,马斯克称有 10% 概率实现 AGI。
6️⃣ 💰 Cursor 完成 23 亿美元融资 :估值达 293 亿美元,一年飙升近 12 倍,年化营收突破 10 亿美元,黄仁勋称其为“最喜欢的企业 AI 服务”。
7️⃣ 🔄 阿里通义 App 更名“千问” :版本号跳至 5.0.0,定位“阿里最强大模型官方 AI 助手”,全面对标 ChatGPT。
8️⃣ 💻 火山引擎发布 Doubao Seed Code :SWE Bench 刷新 78.80% SOTA,综合成本降低 62.7%,首个支持视觉理解的国产编程模型。
9️⃣ 🧠 百度发布文心大模型 5.0 :参数达 2.4 万亿,业界最大规模,采用原生全模态统一建模技术,从训练阶段融入多模态数据。
1️⃣0️⃣ 🛠️ 字节 TRAE SOLO 正式版发布 :升级为“响应式编程智能体”,新增 SOLO Coder 和 SOLO Builder 两大内置智能体,限时免费至 11 月 26 日。
01|谷歌 CEO 暗示 Gemini 3 下周发布,Nano Banana Pro 曝光
多个信号正在交叉验证,谷歌 Gemini 3 很可能在下周(11 月 22 日前后)发布。加密预测市场 Polymarket 上,这一押注已经吸引了 1140 万美元的交易量。其中 84% 的参与者认为会在 11 月 30 日前发布,69% 认为会在 11 月 22 日当天发布。
更关键的是,谷歌 CEO Sundar Pichai 在 11 月 14 日以两个思考表情 🤔 🤔 回应了这一预测。他曾在 8 月用三个香蕉表情提前暗示 Nano Banana 的到来,因此这次被外界普遍解读为一种默认暗示。
此外,VertexAI 代码中已经出现 gemini-3-pro-preview-11-2025 字样,标签明确指向 11 月。Google Vids 的产品页面也直接泄露了配套图像模型的名称 —— Nano Banana Pro (而非此前预期的 Nano Banana 2 )。“Pro” 的命名说明该模型由 Gemini 3 Pro 而不是 Flash 版本驱动,面向专业创作者,承诺 4K 输出以及更快的生成速度。这完全与 Pichai 年初承诺的“将在 2025 年内发布”时间表一致。
下周见分晓。
02|谷歌 Nano Banana 2 意外泄露,多阶段生成流程提升图像质量
谷歌新一代图像模型 Nano Banana 2 (内部代号 GEMPIX 2 )在 11 月 8 日短暂出现在第三方平台 Media.io,上线仅数小时后即被撤下,但泄露图像样本已在社交媒体广泛传播。测试者展示的样本显示,该模型采用多阶段生成流程:先规划图像结构,再检测错误并修复,经过多轮迭代后输出最终结果。这种“自我纠错”机制在 Google 的图像工具中属首次。技术上支持 2K 原生分辨率与 4K 升频,在文字渲染、图表生成、物理相关视觉任务(如准确绘制球体运动轨迹)等方面表现突出。
泄露的样本还证实模型在低质量图片修复与复杂色彩编辑指令上的能力显著增强。有分析指出, Nano Banana 2 可能基于 Gemini 3.0 Pro 作为推理核心,结合扩散模型执行视觉合成,使其具备“理解意图”而非仅“服从提示”的能力。例如提示“展示科学家意识到实验失败的瞬间”,模型能渲染紧张氛围与情绪细节。代码泄露显示其可能更名为 Nano Banana Pro ,支持多种宽高比与最高 4K 输出,预计将在 11 月中下旬正式发布。
03|OpenAI 发布 GPT 5.1 系列模型,简单任务响应速度提升 5 倍
11 月 12 日,OpenAI 正式发布 GPT 5.1 系列旗舰模型,包括 GPT 5.1 Instant 和 GPT 5.1 Thinking 两个版本。核心升级是“自适应推理”能力——模型能根据任务复杂度动态调整思考时间,简单任务响应速度提升 2 到 5 倍(从 10 秒降至 2 秒),复杂任务则能更持久深入。合作伙伴 Balyasny 资产管理的测试显示, GPT 5.1 比 GPT 5 快 2 到 3 倍,token 使用量减半。新模型在 AIME 2025 数学竞赛和 Codeforces 编程测试中表现显著提升。
OpenAI 面向开发者推出两项新工具: apply_patch 用于可靠编辑代码, shell 工具允许模型运行 shell 指令,并提供 24 小时扩展提示缓存。对话体验方面,新增 Professional、Candid、Quirky 三种语气预设,默认语调“更温暖、更对话式”,用于改善 GPT 5 发布后的用户反馈问题。新模型从本周起向付费用户(Pro、Plus、Go、Business)推送,企业与教育用户享有 7 天早期访问期, GPT 5 将在 3 个月后完全退役。
04|ChatGPT 试点群聊功能,支持最多 20 人协作
11 月 14 日,OpenAI 宣布在日本、新西兰、韩国和台湾四个市场试点 ChatGPT 群聊功能,这是 ChatGPT 首次支持多人协作场景。该功能向 Free、Go、Plus 和 Pro 的所有订阅层级开放,支持移动端与网页端,每个群聊最多可容纳 20 人。群聊由 GPT 5.1 驱动,能根据提示自动选择最合适的模型响应,并支持搜索、图片上传、图片生成和语音输入等完整功能。
ChatGPT 在群聊中具备“社交智能”,能够根据上下文判断何时应回应、何时保持安静,用户也可以通过 @ChatGPT 主动召唤。速率限制仅在 ChatGPT 回应时生效,用户之间的交流不受限制。OpenAI 强调隐私保护机制——个人 ChatGPT 记忆不会在群聊中使用或创建,所有设置在私人对话与群聊之间完全独立。该功能可用于旅行规划、项目协作、活动组织等场景。OpenAI 将根据早期用户反馈进行优化,并逐步扩展到更多市场。
05|xAI 推迟 Grok 5 至 2026 年 Q1,6 万亿参数模型冲击 AGI
11 月 14 日,科技媒体 The Information 报道称马斯克在 Baron 投资大会上宣布, Grok 5 推迟至 2026 年第一季度发布,相比此前承诺的 2025 年底延期约 3 个月。新模型拥有 6 万亿参数,是 Grok 3 和 Grok 4 (3 万亿参数)的两倍,预计性能提升 1.4 到 1.6 倍。马斯克表示该模型“在每项指标上都将成为世界上最智能的 AI”,并估计有 10% 的概率实现 AGI。模型将集成 X 平台的实时数据和 Tesla 自动驾驶系统的训练数据,并支持实时视频生成。
推迟的原因是 xAI 需要更多时间“清除宣传内容”并确保事实准确性。这一延后给了 OpenAI 和谷歌更长的竞争窗口:OpenAI 的 GPT 5 已在今年 8 月发布,而谷歌的 Gemini 3 预计在本月发布。目前 xAI 的月度开支达到 10 亿美元,预计 2026 年收入将达到 20 亿美元,但频繁的时间表调整可能削弱投资者信心。
06|Cursor 完成 23 亿美元融资,估值 293 亿美元,一年飙升近 12 倍
11 月 13 日,AI 编程工具 Cursor 宣布完成 23 亿美元 D 轮融资,估值达到 293 亿美元,较今年 1 月的 25 亿美元暴涨近 12 倍。本轮由 Accel 和 Coatue 领投,谷歌、Nvidia、Thrive Capital、a16z 和 DST Global 参与。Cursor 披露其年化营收已突破 10 亿美元,企业营收在 2025 年增长 100 倍,团队从不到 20 人扩张至超过 300 人。Nvidia CEO 黄仁勋在 10 月接受 CNBC 采访时称 Cursor 为“我最喜欢的企业 AI 服务”。
这家 2022 年由 4 名 MIT 学生创立的公司,通过将 AI 直接集成到代码编辑器中快速崛起。10 月底推出的自研模型 Composer 采用混合专家架构,速度比同等质量的模型快 4 倍。OpenAI、Midjourney、Perplexity、Shopify 等公司的开发者都在使用 Cursor,且多由开发者自发采用并推动团队购买。据知情人士透露,Cursor 已拒绝多家大型 AI 公司的收购要约,CEO Michael Truell 表示短期内不考虑 IPO。
07|阿里通义 App 更名为“千问”,版本号跳至 5.0.0 对标 ChatGPT
11 月 14 日,阿里将旗下“通义”App 正式更名为“千问”,版本号从 3.60.0 直接跳至 5.0.0,已经同步上线苹果 App Store 和各大安卓应用商店。应用商店页面显示,“千问”被定位为“阿里最强大模型官方 AI 助手”,核心功能包括对话问答、智能写作与多模态全能相机。就在前一天,11 月 13 日有外媒报道称阿里已秘密启动“千问”项目,基于 Qwen 最强模型打造同名 AI 助手,全面对标 ChatGPT。
阿里核心管理层将该项目视为“AI 时代的未来之战”,已抽调上百名工程师,在杭州总部园区划定两层办公楼作为专属区域。面向全球市场的国际版也在同步推进,计划借助 Qwen 模型的海外影响力直接争夺国际用户。 Qwen 模型自 2023 年开源以来,已开源超过 300 个模型,全球下载量突破 6 亿次,衍生模型数量超过 17 万个。调研机构沙利文数据显示,2025 年上半年阿里通义是中国企业选择最多的大模型。
08|火山引擎发布豆包编程模型,SWE Bench 刷新 78.80% SOTA
11 月 11 日,字节火山引擎正式推出 Doubao Seed Code 豆包编程模型,专为 Agentic 编程任务深度优化。该模型在 SWE Bench Verified 榜单取得 78.80% 成绩,刷新 SOTA 记录,并在 Terminal Bench、Multi SWE Bench 等多项基准测试中领先国内同类模型。技术上支持 256K 长上下文,可处理长代码文件与多模块依赖,全栈开发能力突出。作为国内首个支持视觉理解的编程模型,它能根据 UI 设计稿、截图或手绘草图生成代码,对生成页面进行视觉比对并自主修复 Bug。
成本优势同样显著——综合使用成本较业界平均水平降低 62.7%,达到国内最低价。0 到 32K 输入区间仅 1.20 元每百万 tokens,输出 8 元。以创建交互式英语学习网站为例,同等任务中, Claude Sonnet 4.5 需 4.05 元, GLM 4.6 需 0.77 元, Doubao Seed Code 仅需 0.34 元。模型依托覆盖 10 万容器镜像的大规模 Agent 强化学习训练系统,完全依靠端到端 RL 达到顶尖水平。已兼容 Anthropic API、Claude Code 等主流生态,个人开发者 Coding Plan 首月 9.9 元,TRAE 中国版同步接入。
09|百度发布文心大模型 5.0,参数超 2.4 万亿,原生全模态
11 月 13 日,百度在 2025 世界大会上正式发布 文心大模型 5.0 ,其参数量达到 2.4 万亿,成为业界已公开参数规模最大的模型。该模型采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出。不同于多数多模态模型采用后期融合方式, 文心 5.0 使用统一的自回归架构,从训练阶段起即融入多模态数据,实现理解与生成的一体化。在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出。
李彦宏在大会上提出 AI 产业“倒金字塔”结构理念:模型应创造芯片 10 倍的价值,AI 应用能进一步创造 100 倍价值。他强调“当 AI 能力被内化为原生能力,智能就不再是成本,而是生产力”。本届大会主题为“效果涌现”,关注 AI 从实验室走向产业实践。 文心 5.0 已通过文心 App 和千帆大模型平台向用户与开发者全面开放。百度同时发布新一代昆仑芯片 M100/M300 与天池超节点,天池 512 单节点即可完成万亿参数模型训练,预计在 2026 至 2027 年期间上市。
10|字节 TRAE SOLO 正式版发布,响应式编程智能体,限时免费
11 月 12 日,字节 TRAE 团队正式发布 TRAE SOLO 正式版,面向全球 TRAE 国际版用户全面开放,并开启限时免费体验活动(截至 11 月 26 日)。该版本从 Beta 版的“上下文工程师”升级为 “The Responsive Coding Agent”(响应式编程智能体),新增两大内置智能体 SOLO Coder 和 SOLO Builder ,前者擅长处理复杂任务开发,后者专注从 0 到 1 快速搭建端到端应用。核心能力包括多任务并行、上下文压缩、代码变更与可视化工具调用,支持从 PRD 文档生成、前后端开发到部署上线的完整流程。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.vip/82.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论