产品简介

DeepSeek V4 是深度求索 2026/4/24 正式发布的新一代旗舰 MoE 大模型，同步在 Hugging Face 与 ModelScope 开源，附 58 页技术报告。一次发布两档：**V4-Pro**（总参 1.6T / 激活 49B / 384 路由专家 + 1 共享）与 **V4-Flash**（总参 284B / 激活 13B / 256 路由专家）。

**全系原生 1M Token 上下文**（非付费层级独享），通过 **DSA（DeepSeek Sparse Attention）**稀疏注意力大幅压缩长上下文计算量与 KV cache。API 同时兼容 OpenAI ChatCompletions 与 Anthropic 规范，原生适配 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 工具链。

**关键里程碑节奏**：

- **2026/4/24** 发布开源 + 昇腾零日适配

- **2026/5/22** V4-Pro 永久降价 75%（输入 ¥3.1/M、输出 ¥6.2/M），比 GPT-5.5 便宜约 98%；同期成立 **Harness 团队**（梁文锋亲自挂帅）攻关 Code 智能体对标 Claude Code

- **2026/6/16** 完成中国 AI 史最大单轮融资 **~70 亿美元（约 500 亿人民币）**、投后估值 500 亿美元（腾讯 100 亿 + 宁德时代 50 亿 + 梁文锋个人 200 亿）

- **2026/6/20 全球首发跑通华为昇腾 AI 算力芯片**——纯国产算力部署前沿模型不再是 PPT

- **2026/7/15 V4 正式版全量上线**：Pro / Flash 双架构，**首创峰谷分时定价 + 缓存命中优惠**——工作日 9:00-12:00、14:00-18:00 算力高峰时段 API 调用价格翻倍，其余平峰时段及周末全天维持超低普惠定价，缓存命中再砍 90%，错峰调度可将调用成本直接腰斩，打破国内大模型「单一低价内卷」的定价范式

LiveCodeBench 93.5、Codeforces 3206（人类第 23 名）、Putnam-2025 满分 120/120——是当前开源编码与数学的天花板。

核心功能

1.6T MoE + 原生 1M 上下文：Pro 总参 1.6T / 激活 49B，Flash 284B / 激活 13B，全系原生 1M 上下文不加价
DSA 稀疏注意力：1M 上下文场景 Pro 计算量降至 27%、KV cache 压缩 9.5×，Flash 压缩 13.7×
思考 / 非思考双模式：支持 reasoning_effort=high/max 切换，HLE 从非思考 7.7 提升至 max 37.7
Agent 框架原生适配：开箱对接 Claude Code、OpenClaw、OpenCode、CodeBuddy；API 同时兼容 OpenAI 与 Anthropic 接口
开源编码天花板：LiveCodeBench 93.5、Codeforces 3206（人类第 23 名）、Putnam-2025 满分 120/120
全球首发跑通昇腾：2026/6/20 全球首发跑通华为昇腾 AI 算力芯片，纯国产算力部署前沿开源模型成为现实
Harness 团队主攻 Code Agent：5/22 起梁文锋亲自挂帅成立 Harness 团队，攻关 Code 智能体对标 Claude Code
永久降价 75% + 峰谷分时定价（已上线）：5/22 起 V4-Pro 永久降价 75%（比 GPT-5.5 便宜 98%）；7/15 正式版全量上线峰谷分时定价——工作日高峰时段(9-12点/14-18点)价格翻倍，其余平峰及周末维持普惠价，错峰调度可省一半以上开销

适合谁用

以下类型的用户会特别受益于 DeepSeek V4：

需要私有化部署前沿级模型的企业（含纯国产算力栈）
预算敏感、追求极致性价比的 API 调用场景
代码生成、数学竞赛、长代码库理解等高难度任务
长文档 / 完整代码库分析（原生 1M 上下文）
替换 Claude Code / CodeBuddy 后端以降低成本
国央企 / 信创场景下的模型选型（昇腾全栈适配）

优点亮点

Pro 输出价 ¥6.2/M token（永久降价后），约为 GPT-5.5 的 1/50
编码与数学开源天花板，部分超过闭源旗舰
原生 1M 上下文全系标配，非付费层级独享
API 同时兼容 OpenAI 与 Anthropic 接口，迁移成本极低
全球首发跑通华为昇腾，纯国产算力栈打通
权重完全开源，可商用、可私有部署
缓存命中输入价低至 ¥0.2~¥1 / M token

价格与方案

**V4-Pro**（5/22 永久降价后）：输入 ¥3.1/M（命中缓存 ¥0.31）、输出 ¥6.2/M。**V4-Flash**：输入 ¥1/M（命中缓存 ¥0.2）、输出 ¥2/M。**2026/7/15 正式版全量上线峰谷分时定价**：工作日 9:00-12:00、14:00-18:00 算力高峰时段 API 调用价格翻倍，其余 17 小时平峰时段 + 周末全天维持超低普惠定价，配合缓存命中优惠，错峰调度可将调用成本直接腰斩。chat.deepseek.com 与官方 App 仍可免费使用。**昇腾私有部署**：6/20 起官方支持昇腾 950 集群批量部署，价格按节点计。

总结与建议

DeepSeek V4 在 2026 上半年完成了五步走：4/24 开源发布 + 昇腾零日适配 → 5/22 永久降价 75% + 成立 Harness 团队攻 Code Agent → 6/16 完成 ~70 亿美元融资估值破 500 亿美元 → 6/20 全球首发跑通华为昇腾 → **7/15 正式版全量上线峰谷分时定价**。这套组合把「前沿能力 + 极致性价比 + 纯国产算力 + 弹性定价」全部打通，是 2026 年中国 AI 全栈国产化最具代表性的产品。如果你要纯国产栈做企业 AI、或者就是要 API 性价比最高的前沿模型，DeepSeek V4 几乎没有同类替代；错峰调度（避开工作日9-12点/14-18点）任务的团队用峰谷定价能省一半以上。Agent 长任务和通用知识仍可搭配 Claude Code / GPT-5.6 互补使用。

版本演进

V4 正式版全量上线 · 峰谷分时定价 （2026-07-15）：Pro / Flash 双架构正式版全量上线；首创峰谷分时定价（工作日9-12点/14-18点高峰翻倍，其余平峰+周末普惠价）+ 缓存命中优惠，打破国内大模型单一低价内卷范式
V4 全球首发跑通昇腾 （2026-06-20）：全球首发跑通华为昇腾 AI 算力芯片，纯国产算力部署前沿模型，标志中国 AI 全栈国产化里程碑
500 亿美元估值融资 （2026-06-16）：完成 ~70 亿美元首轮融资、投后估值 500 亿美元；腾讯 100 亿 + 宁德时代 50 亿 + 梁文锋个人 200 亿
V4-Pro 永久降价 75% + Harness 团队 （2026-05-22）：Pro 永久降价 75%（比 GPT-5.5 便宜 98%）；梁文锋挂帅成立 Harness 团队对标 Claude Code
V4 开源发布 （2026-04-24）：1.6T MoE + 1M 上下文 + 昇腾零日适配，编码数学开源天花板，58 页技术报告

DeepSeek V4 热门 新增