deepseek在战略上仍然输 anthropic 一个段位：前者是「越来越高的杆」，后者是「越来越厚的墙」

2026-04-28

DeepSeek V4 打了三张牌。

第一张：切断昇腾死结。阿里、字节、腾讯合计采购 46 万颗昇腾 950PR，占全年预计出货量的 60%+。关键词不是"更好"，是"够用被验证了"。这打破了一个存在多年的循环死结：无顶级模型迁移 → 无背书 → 云厂不敢采购 → 无顶级模型迁移。

第二张：打穿 Agent 价格锚。V4-Pro 缓存命中后降至原价 1/40，完整任务成本约 GPT-5.5 的 1/10。降价次日 OpenRouter 调用量涨近 4 倍——杰文斯悖论在实时发生。

第三张：做鲶鱼，不做冠军。DeepSeek 的历史使命从来不是超越 Opus，而是证明这条路走得通。Kimi K2.6 接第二棒，后面还会有更多人。

每张都打在关键位置。

但这三张牌打的是同一场比赛——跑分竞赛，一场可以被下一个版本完全重置的比赛。

Anthropic 在玩另一场。

杆和墙是两种不同的护城河逻辑

跑分的逻辑是：我比你高，所以你要用我。

这是"杆"——可见、可测量、可追赶。DeepSeek 今天的 KV cache 压缩 99.7%，是杆；定价是 GPT-5.5 的 1/10，是杆；SWE-bench 每提一个百分点，是杆。

杆有一个结构性弱点：它是完全可重置的。下一个版本可以把上一个版本的优势清零。

墙的逻辑不同：我嵌进了你的工作流，所以你换不掉我。

墙不靠性能，靠的是切换成本随时间单调递增。它不和跑分竞争，它绕过跑分竞争。

Anthropic 在建哪些墙

第一层：Managed Agents 托管状态

Anthropic 把 Agent 的 State、Memory、工作流历史全部托管在自己的基础设施上。Agent 定义、会话状态、跨任务记忆，全部在 Anthropic。切换成本不再是"改几行代码"，而是重建整个 AI workflow。

类比是 AWS：粘性从来不是 EC2 本身，是 IAM + VPC + S3 + Lambda 等织成的一张状态网。一旦把工作流的状态层迁进去，出来的代价不是技术代价，是业务连续性代价。

第二层：Memory 就是数据飞轮

模型本身锁定能力弱——API 接口相似，Prompt 可以迁移。但 Memory 不一样。

Agent 用得越久，越懂你的偏好、你的工作方式、你的历史决策。这个积累不可移植。切换的成本，是失去所有这些个性化积累，从零重来。

DeepSeek 没有这个。黄东旭把 Hermes 工作流全面迁移到 V4，成本接近零——但迁走的是"执行引擎"，记忆、技能文件、历史轨迹全留在 Hermes 本地。DeepSeek 什么都没得到。

第三层：Harness 和模型共同进化

Claude Code 每天积累的执行轨迹——哪些路径成功、失败、工具调用序列——反馈回训练，让下一代模型更适配这个工作环境。

这是一条咬住自己尾巴的蛇：Harness 喂养模型，模型吃掉 Harness，飞轮越转越快。

DeepSeek 开源，调用在任何 Harness 里发生，训练信号碎片化在全球各处。Anthropic 的训练信号全部在自己的产品生态里积累。

第四层：IDE 和通讯工具的深度集成

Claude Code 延伸进 VS Code、JetBrains、Discord、Telegram，每一个触点都是一个企业工作流的锚点。换模型，意味着这些触点全部要重建，工程师的肌肉记忆要重建，团队的协作习惯要重建。

这不是性能差距，这是组织摩擦力。

为什么 DeepSeek 解不了这道题

三个原因。

开源的 Android 困境。 V4 接口兼容 OpenAI 和 Anthropic API，降低了迁移门槛——但也意味着每次调用都可能绕过 DeepSeek 的收入表。Android 提供了基础层，基础层上方的城市被别人施工。DeepSeek 越成功，越可能是在给整个行业证明路走得通，而不是拥有这条路。

梁文锋的组织局限。 幻方科技是财务母体，不是中国 AI 的公共财政。贝尔实验室的故事成立，是因为背后有 AT&T 的垄断利润支撑纯研究。DeepSeek 已有 200 亿美元估值叙事，一旦融资，“不需要向任何人解释的研究组织"身份就消失了，要变成对云厂、芯片厂、股东全面解释自己的基础设施公司——这两种身份需要完全不同的产品战略。

没有 Harness 就没有数据飞轮。 DeepSeek 做模型，不做 Harness。它的护城河是算法效率，但算法效率是可以追赶的；Anthropic 积累的是使用数据和企业工作流绑定——这个随时间单调增长，不会被下一代模型清零。

小米 MiMo 的情况更微妙

小米发布的 MiMo-V2.5-Pro 有一个独特能力，叫 Harness Awareness——模型被专门训练到能感知自己运行在哪种 Harness 中，主动管理记忆，维持跨千次工具调用的一致性。

这个能力很真实。4.3 小时 672 次工具调用完成 Rust 编译器，11.5 小时 1868 次工具调用完成视频编辑器，是可复现的实测数据，不是跑分。

但问题在于：MiMo-V2.5-Pro 的 Harness Awareness 是高度适配 Claude Code 和 OpenClaw 的。

小米把 Harness Awareness 这个能力，建在了 Anthropic 和第三方的 Harness 上。

小米没有自己的 Harness。如果 Anthropic 或 OpenClaw 的策略变动，MiMo 需要重新调整模型去适应别人。这和墙的逻辑方向是反的——不是在加厚自己的墙，是在适配别人的墙。

小米的"人车家"生态数据飞轮是消费级的，在企业 AI 工作流这个战场上没有对应积累。

最后

DeepSeek 每次发布都在重置跑分。Anthropic 每天都在加厚墙。

这两件事在不同的时间维度上发生。正因为如此，墙的进展经常被低估——跑分是可见的，墙是看不到在长的。

V4 是一次真正意义上的技术突破，三张牌每张都打在关键位置。但它解决的是"国产算力 + 开源模型这条路走不走得通"的问题，不是"谁拥有 Agent 时代的企业工作流入口"的问题。

这是两场不同的比赛。

前者 DeepSeek 正在赢，后者 Anthropic 跑在前面，而且跑的方向不一样。