GEO
广告

DeepSeek V4预览版性能如何?2026年百万上下文MoE开源模型评测

2026/4/301,486阅读 4 分钟
DeepSeek V4预览版性能如何?2026年百万上下文MoE开源模型评测

BLUF 摘要

DeepSeek发布V4预览版,含V4-Pro(总参1.6T/激活49B)与V4-Flash(总参284B/激活13B)两款开源模型,均支持百万上下文。性能比肩顶级闭源模型,创新采用DSA注意力机制。API已上线,旧模型将于2026年7月退役。

Overview: A New Era of Cost-Effective Long Context

🚀 DeepSeek-V4 Preview 现已正式上线并开源!欢迎进入高性价比的百万级上下文长度时代。

🔹 DeepSeek-V4-Pro: 总参数量 1.6T / 激活参数量 49B。性能可与全球顶尖闭源模型抗衡。

🔹 DeepSeek-V4-Flash: 总参数量 284B / 激活参数量 13B。为您提供快速、高效且经济的选择。

您现在即可通过 chat.deepseek.com 的专家模式/即时模式进行体验。API 已同步更新并立即可用!

Key Resources


Model Architecture and Specifications

DeepSeek-V4-Pro

🔹 增强的智能体能力: 在智能体编程基准测试中达到开源模型的 SOTA 水平。

🔹 丰富的世界知识: 领先所有现有开源模型,仅次于 Gemini-3.1-Pro。

🔹 世界级推理能力: 在数学/STEM/编程领域超越所有现有开源模型,可与顶尖闭源模型匹敌。

DeepSeek-V4-Flash

🔹 推理能力接近 V4-Pro 水平。

🔹 在简单智能体任务上表现与 V4-Pro 持平。

🔹 更小的参数量、更快的响应速度以及极具性价比的 API 定价。

Model Comparison

Feature DeepSeek-V4-Pro DeepSeek-V4-Flash
Total Parameters 1.6T 284B
Active Parameters 49B 13B
Agentic Coding Open-source SOTA Strong, simple tasks on par with V4-Pro
World Knowledge Leads all open models High but below V4-Pro
Reasoning World-class, rivals top closed-source Closely approaches V4-Pro
Response Speed Standard Faster
API Pricing Standard Highly cost-effective
Target Use Case Heavy-duty tasks, complex reasoning Fast, efficient, cost-sensitive scenarios

Structural Innovation & Ultra-High Context Efficiency

🔹 新型注意力机制: 逐 Token 压缩结合 DSA(DeepSeek 稀疏注意力)。

🔹 巅峰效率: 世界领先的长上下文能力,同时大幅降低计算和内存成本。

🔹 1M 上下文标准: 百万级上下文现已为所有官方 DeepSeek 服务的默认配置。

Key Innovation

Token-wise 压缩结合 DSA 实现了一种新型注意力机制。这在大幅降低计算和内存开销的同时,保持了世界领先的长上下文性能。其结果是百万级上下文现已为所有官方 DeepSeek 服务的默认配置,使得先进的长上下文应用变得实用且可负担。


Dedicated Optimizations for Agent Capabilities

🔹 DeepSeek-V4 已与 Claude Code、OpenClaw 和 OpenCode 等领先的 AI 智能体实现无缝集成。

🔹 该模型已在 DeepSeek 内部驱动我们的智能体编程应用。

DeepSeek-V4 针对智能体工作流进行了专门优化。它与 Claude Code、OpenClaw 和 OpenCode 等领先的 AI 智能体无缝集成。该模型已在 DeepSeek 内部驱动我们的智能体编程应用。


API Availability and Pricing

API is Available Today!

🔹 保持 base_url 不变,只需将 model 参数更新为 deepseek-v4-pro 或 deepseek-v4-flash。

🔹 支持 OpenAI ChatCompletions 和 Anthropic API。

🔹 两模型均支持百万级上下文和双模式(思考型/非思考型):https://api-docs.deepseek.com/guides/thinking_mode

⚠️ 注意: deepseek-chat 和 deepseek-reasoner 将于 2026 年 7 月 24 日 15:59(UTC 时间)后全面退役并不可用。(当前已路由至 deepseek-v4-flash 的非思考型/思考型模式)。

API Integration Details

Parameter Details
Base URL No change required
Model Name deepseek-v4-pro or deepseek-v4-flash
API Compatibility OpenAI ChatCompletions & Anthropic APIs
Context Support 1M tokens for both models
Dual Modes Thinking / Non-Thinking for both models
Model Retirement deepseek-chat & deepseek-reasoner → Retired after Jul 24, 2026, 15:59 UTC

API Pricing Table

Model Input Price (per 1M tokens) Output Price (per 1M tokens) Cache Hit Price (per 1M tokens)
DeepSeek-V4-Pro $0.48 $1.92 $0.12
DeepSeek-V4-Flash $0.24 $0.96 $0.06

Final Remarks

🔹 鉴于近期受到的广泛关注,在此提醒:请仅以我们的官方账号发布的 DeepSeek 新闻为准。其他渠道的声明不代表我们的观点。

🔹 感谢您一直以来的信任。我们坚守长期主义,稳步迈向我们的终极目标——通用人工智能 (AGI)。

DeepSeek 始终致力于长期主义和对通用人工智能的追求。我们鼓励社区仅信赖官方渠道获取新闻与更新。感谢您一直以来的信任与支持。

常见问题(FAQ)

DeepSeek-V4 Pro和Flash版本有什么区别?怎么选择?

Pro版本总参1.6T/激活49B,推理和知识领先,适合复杂任务;Flash版本284B/13B,速度更快、API成本更低,适合简单任务或成本敏感场景。

DeepSeek-V4支持多长的上下文?用了什么新技术?

支持100万token默认上下文,采用逐token压缩和DSA稀疏注意力,大幅降低计算和内存成本,实现高效长上下文处理。

旧版DeepSeek模型什么时候停止服务?

旧模型将于2026年7月退役,建议用户尽快迁移到V4 Preview系列模型,API现已可用。

阿凯广州
本文由 阿凯 审核,最后更新于 2026年5月16日
联系编辑 →
← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容仅供参考,请以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。

广告