DeepSeek V4 Flash 是 Agent 最佳标配，百万 Token 仅 2 分钱，龙虾自由，请随便玩耍

2026-04-27

4 月 25 日晚，DeepSeek 宣布 V4-Pro API 限时 2.5 折优惠。

隔了一天，26 日晚，再来一刀：全系列 API 输入缓存命中价格降至原价的十分之一。

两天，两次降价。

最新的数字是这样的：DeepSeek-V4-Flash，输入缓存命中，每百万 Token 0.02 元。

两分钱。

这个数字意味着什么

先做个对比。

同样处理百万 Token，GPT-5.5 的输入输出合计成本是 35 美元，Claude Opus 4.7 是 30 美元。

DeepSeek-V4-Flash 缓存命中后：0.0029 美元。

不是便宜一倍，不是便宜十倍。是便宜了一万倍。

V4-Pro 缓存命中限时价 0.025 元/百万 Token，叠加 5 折优惠后约 0.0037 美元——也是 GPT-5.5 的百分之一量级。

DeepSeek 这次真正打穿的，不是「所有模型的绝对最低价」，而是「高性能 Agent 模型的价格锚」。

普通对话，一次问答消耗几千 Token，价格差异感知不强。

Agent 不一样。

长上下文、多轮推理、代码调用、自动化工作流——每一个循环都在持续燃烧 Token。一个复杂任务跑下来，轻松消耗几百万 Token，缓存命中率越高，成本差距越被放大。

DeepSeek V4 发布时就明确标注了方向：针对 Claude Code、OpenClaw、CodeBuddy 等主流 Agent 框架专项优化。这不是普通的聊天模型，是冲着「干活」去的。

V4-Flash 智能指数 47 分，对标 Claude Sonnet 4.6 全力版，介于顶尖闭源模型与主流中端模型之间。够用，而且极快。

用 OpenClaw 跑 Agent 任务的人，这两天应该感受到了。

以前跑一个稍微复杂的任务，脑子里总有一根弦：这次消耗了多少？缓存命中了吗？要不要换个更便宜的模型凑合一下？

现在这根弦可以松掉了。

百万 Token 两分钱，让「随便跑」变得真实可行。

调用量数据直接反映了市场反应。

4 月 25 日，V4-Pro 单日调用量 136 亿 Token，比前一天涨了将近四倍。26 日，V4-Flash 单日调用量 814 亿 Token，环比再涨 62%。

价格压力已经传导过去了。

国产模型里，Kimi K2.6、GLM-5.1、Qwen 系列，定价预期都会被这个数字重新校准。对 GPT-5.5 和 Opus 4.7 这类顶尖闭源模型，短期冲击有限——它们卖的是能力天花板，不是价格地板。

但对于大多数 Agent 开发者和企业用户来说，这道算术题已经很清楚了。

相同性能水平下，你愿意付一万倍的差价，还是愿意换个模型？