DeepSeek-V3.1震撼发布:混合推理架构引领AI新纪元
DeepSeek-V3.1正式发布,带来混合推理架构、思考效率提升和智能体能力增强等多项突破性改进,API同步升级至128K上下文,模型全面开源。
今天,我们正式发布DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.,这是DeepSeek系列模型的又一次重大升级!本次更新带来了多项突破性改进,让我们一起来看看这次升级的核心亮点。
🚀 核心升级亮点
1. 混合推理架构
DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.首次实现了一个模型同时支持思考模式与非思考模式的混合推理架构。用户现在可以根据任务需求,在两种模式间自由切换,获得更灵活的AI体验。
2. 思考效率大幅提升
相比之前的DeepSeek-R1-0528Previous DeepSeek model version used as performance benchmark for V3.1.,DeepSeek-V3.1-ThinkThe thinking mode variant of DeepSeek-V3.1 with compressed reasoning chains for faster responses.在更短时间内就能给出高质量答案。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平,真正实现了“又快又好”。
3. 智能体能力全面增强
通过Post-Training优化,新模型在工具使用与智能体任务中的表现有显著提升:
- 编程智能体:在代码修复测评SWESoftware engineering evaluation benchmark for testing code repair capabilities.与命令行终端环境下的复杂任务测试中表现优异
- 搜索智能体:在多项搜索评测指标上取得较大提升,特别是在需要多步推理的复杂搜索测试中性能大幅领先
💻 平台同步升级
官方应用升级
官方App与网页端模型已同步升级为DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.。用户可以通过“深度思考”按钮,轻松实现思考模式与非思考模式的自由切换,体验更加智能的交互方式。
API全面升级
DeepSeek API也已同步升级:
deepseek-chat对应非思考模式deepseek-reasoner对应思考模式- 上下文长度扩展至128K
- 支持strict模式的Function CallingAPI feature with strict mode support to ensure function outputs meet schema definitions.,确保输出的Function满足schema定义
- 新增对Anthropic APIAPI format supported by DeepSeek for compatibility with Claude Code framework.格式的支持,可轻松接入Claude Code框架
🔓 模型开源
DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.的Base模型在V3的基础上重新进行了外扩训练,共增加训练了840B tokens。所有模型均已开源:
Base模型
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
重要提示:DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.使用了UE8M0 FP8 ScaleParameter precision format used in DeepSeek-V3.1 for efficient computation.的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3The third-generation DeepSeek model released in December 2024, featuring strong performance, 128K context length, and 60 TPS generation speed.存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。
💰 价格调整通知
我们将于北京时间2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行调整:
- 执行新版价格表
- 取消夜间时段优惠
在9月6日前,所有API服务仍按原价格政策计费,用户可继续享受当前优惠。同时,为更好地满足用户的调用需求,我们已进一步扩容API服务资源,欢迎使用!
🌟 总结
DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.的发布标志着AI大模型技术又向前迈进了一大步。无论是混合推理架构的创新,还是智能体能力的全面提升,都展现了DeepSeek团队在AI技术研发上的深厚实力。现在就去体验DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.带来的智能革命吧!
Data Analysis
| 特性/方面 | DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities. (新版本) | DeepSeek-R1-0528Previous DeepSeek model version used as performance benchmark for V3.1. / V3 (先前版本) |
|---|---|---|
| 推理架构 | 混合推理架构,支持思考模式与非思考模式自由切换 | 思考模式与非思考模式为独立模型 |
| 思考效率 | 思考模式(V3.1-Think)输出token减少20%-50%,性能持平,速度更快 | 思考模式(R1-0528)需要更多token输出 |
| 智能体能力 | 通过Post-Training优化,编程与搜索智能体表现显著提升,复杂任务领先 | 智能体能力相对较弱 |
| API 模式 | deepseek-chat (非思考)、deepseek-reasoner (思考) |
旧版API接口 |
| API 上下文长度 | 128K | 未明确提及,推断为旧有限制 |
| API 功能 | 支持strict模式Function CallingAPI feature with strict mode support to ensure function outputs meet schema definitions.、新增Anthropic APIAPI format supported by DeepSeek for compatibility with Claude Code framework.格式支持 | 功能相对较少 |
| 模型开源 | Base模型在V3基础上新增840B tokens训练,提供Base与后训练模型 | V3 Base模型 |
| 技术细节 | 使用UE8M0 FP8 ScaleParameter precision format used in DeepSeek-V3.1 for efficient computation.参数精度,分词器及chat template有较大调整 | 与V3.1存在差异 |
| 价格政策 | 自2025年9月6日起执行新版价格表,取消夜间优惠 | 2025年9月6日前按原价格与优惠计费 |
Source/Note: 根据提供的DeepSeek-V3.1A version of the DeepSeek model released in August 2025 with extended context length and enhanced agent capabilities.发布文本内容整理与对比。
版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。
文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。
若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。