📖 产品简介
DeepSeek V4 是深度求索(DeepSeek)于 2026 年 4 月 24 日正式发布的新一代旗舰 MoE 大模型预览版,同步在 Hugging Face 与 ModelScope 开源,附 58 页技术报告。一次发布两档版本:DeepSeek-V4-Pro(总参数 1.6 万亿 / 激活 490 亿,61 层 / 384 路由专家 + 1 共享 / 每 token 激活 6 个)与 DeepSeek-V4-Flash(总参数 2840 亿 / 激活 130 亿,43 层 / 256 路由专家)。
V4 全系原生标配 100 万 Token 上下文(非付费层级独享),通过 DSA(DeepSeek Sparse Attention)稀疏注意力将长上下文计算量与 KV cache 大幅压缩。API 接口同时兼容 OpenAI ChatCompletions 与 Anthropic 规范,针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 工具链做了原生适配,是首个在发布当日即完成华为昇腾零日推理适配的前沿开源大模型。
⚡ 核心功能
- 1.6T MoE + 百万上下文:Pro 总参 1.6T / 激活 49B,Flash 284B / 激活 13B,全系原生 1M 上下文不加价
- DSA 稀疏注意力:在 1M 上下文场景下 Pro 计算量降至 27%、KV cache 压缩 9.5×,Flash 压缩 13.7×
- 思考 / 非思考双模式:支持 reasoning_effort=high/max 切换,HLE 从非思考 7.7 提升至 max 37.7
- Agent 框架原生适配:开箱对接 Claude Code、OpenClaw、OpenCode、CodeBuddy,API 同时兼容 OpenAI 与 Anthropic 接口
- 开源编码天花板:LiveCodeBench 93.5、Codeforces 3206(人类第 23 名)、Putnam-2025 满分 120/120
- 昇腾零日适配:同时支持 NVIDIA GPU 与华为昇腾 NPU,原生适配昇腾 950,可纯国产算力私有化部署
🎯 适合谁用
以下类型的用户会特别受益于 DeepSeek V4:
- 需要私有化部署前沿级模型的企业
- 预算敏感、追求极致性价比的 API 调用场景
- 代码生成、数学竞赛、长代码库理解等高难度任务
- 长文档 / 完整代码库分析(原生 1M 上下文)
- 替换 Claude Code / CodeBuddy 后端以降低成本
✅ 优点亮点
- Pro 输出价 ¥24/M token,约为 GPT-5.5 的 1/10、Opus 4.7 的 1/7
- 编码与数学成绩达到开源天花板,部分超过闭源旗舰
- 原生 1M 上下文全系标配,非付费层级独享
- API 同时兼容 OpenAI 与 Anthropic 接口,迁移成本极低
- 首个零日适配华为昇腾的前沿开源模型,可纯国产算力部署
- 权重完全开源,可商用、可私有部署
- 缓存命中输入价低至 ¥0.2~¥1 / M token
💰 价格与方案
V4-Pro:输入 ¥12/M(命中缓存 ¥1)、输出 ¥24/M;V4-Flash:输入 ¥1/M(命中缓存 ¥0.2)、输出 ¥2/M。美元参考 Pro $1.74/$3.48、Flash $0.14/$0.28。chat.deepseek.com 与官方 App 仍可免费使用。官方表示昇腾 950 超节点批量上市后 Pro 价格将进一步下调。
📝 总结与建议
DeepSeek V4 是 2026 年 4 月国产开源大模型的里程碑:1.6T MoE + 原生 1M 上下文 + 开源权重 + 昇腾零日适配 + 编码数学开源天花板,四大标签共同把开源模型的价格与能力推到新档位。官方坦承整体水平仍落后前沿 3~6 个月(Agent 长任务、通用知识尤为明显),但在"代码 / 数学 / 批量 API"场景下是当前性价比最高的旗舰选择。