官宣来了DeepSeekV31深夜王炸不是R2胜似R2

小火箭shadowrocket • 2026年1月25日 am7:35 • 小火箭

8 月 19 日， DeepSeek 悄悄发布了新模型。

没吆喝、没预热，只有一句低调更新。

两天后，官宣终于来了。

新模型自然不是 R2 。

单从名字看， DeepSeek-V3.1 像是一次小版本迭代。

如果你也这么想，那就真的，低估它了。

从技术选型到能力表现， V3.1 处处都透着“下一代模型”的味道。

说一句胜似 R2 ，也不为过。

01｜V3.1 亮点，一句话总结

一句话总结：

DeepSeek-V3.1 = 更聪明 + 更高效 + 更能干。

三句话拆解开来就是：

混合推理：一个模型，两种模式；

更高的推理效率：用更少 token，干更多事，推理效率提高；

更强的 Agent 能力：工具调用、智能体任务处理能力提升。

混合推理架构是本次更新的核心。 DeepSeek-V3.1 现在提供两种模式。

模式

接口名称

特点

非思考模式

deepseek-chat

输出快，成本低，适合日常问答

思考模式

deepseek-reasoner

深度推理，思维链，适合复杂任务

一句话区分两者：前者“秒回消息”，后者“认真思考”。

和此前的爆料一致，DeepSeek 网页端和 App 的“深度思考”已由 DeepSeek-V3.1-Think 提供支持。

换句话说， DeepSeek-R1-0528 下岗了。

02｜V3.1-Think 到底有多强？

DeepSeek-V3.1 模型隐藏着一个高能选项： V3.1-Think 。

这个模式有点像 Claude 4/4.1，以及此前的 Qwen 模型。

根据官方的说法， V3.1-Think 相较于 R1-0528 ，token 用量下降 20%-50%，性能还持平！

基准测试

R1-0528

V3.1-Think

AIME 2025

87.5

88.4

GPQA

80.1

liveCodeBench

73.3

74.8

在基准测试结果基本持平的情况下， V3.1-Think 的 token 消耗量显著降低。

模型的推理能力没降，使用成本却直接打折。

此外， V3.1 在非思考模式下的输出长度也得到控制，避免了 V3-0324 的“话唠”问题。更短、更准，才是生产力。

03｜智能体能力升级，Agent 真能跑了

这可能是 V3.1 最被低估的部分。

DeepSeek 官方称这次更新是 “迈向 Agent 时代的第一步 our first step toward the agent era”。

官宣中包含两个核心 Agent 测试场景：编程智能体（SWE 修复任务、命令行终端）和搜索智能体（复杂问题检索 + 多步 reasoning）。

在编程智能体测评 SWE-bench 及 Terminal-Bench 中， V3.1 的准确率几乎是成倍提升。

而在搜索相关的测评中，尤其是 browsecomp， V3.1 （30%）实现了碾压式的领先（ R1-0528 8.9%）。

04｜模型开源，API 接口升级

和前代模型一样， DeepSeek-V3.1 已全面开源。

Base 模型 + 后训练模型

外扩训练量：新增 840B tokens，比原始 V3 更饱满

模型链接：

Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-V3.1

ModelScope：https://huggingface.co/deepseek-ai/DeepSeek-V3.1

划重点： DeepSeek-V3.1 使用 UE8M0 FP8 Scale 的参数精度，这意味着它采用了高效、极致压缩的模型量化策略，追求最低推理成本、接近 FP16 的性能表现。

并且， V3.1 分词器 + chat template 发生变更，不兼容老版本，部署前需查看最新文档。

V3.1 API 新特性包括：

支持 128K 上下文（原 64K）

Function Calling 加入 strict schema 检查

新增 Anthropic API 格式支持（可接 Claude Code）

除此之外， V3.1 API 的价格又又又降低了！

由以前推理、非推理单独定价的模式，改为了统一定价：每百万输入 tokens 4 元，每百万输出 tokens 12 元（在这之前分别是 4 元和 16 元）。

同时，DeepSeek 官宣取消夜间优惠。

新定价将于北京时间 2025 年 9 月 6 日零点起执行。

结语

DeepSeek-V3.1 是那种“表面平静，实则杀招”型的版本更新。

它不是 R2 ，但大概率是 R2 的先行版。

某种意义上，它是 DeepSeek 在 Agent Ready 这条路上先迈出的一步。

版权声明：
作者：小火箭shadowrocket
链接：https://www.shadowrocket888.vip/161.html
来源：小火箭官网
文章版权归作者所有，未经允许请勿转载。

THE END

小火箭小火箭下载小火箭加速小火箭加速器小火箭官网小火箭节点

二维码

OpenAI冲刺万亿美元IPOAI巨头打响印度免费大战AIWeekly102

< <上一篇

2025OpenAI急着给AIAgent上大菜

下一篇>>

搜索内容

官宣来了DeepSeekV31深夜王炸不是R2胜似R2

取消回复

共有 0 条评论

小火箭高速节点推荐

标签

热门文章