AI 应用层会不会重演移动互联网时代工具软件的命运，最终被平台全部吸收？最近，a16z 合伙人 Joe Schmidt 在《Avoiding Death on the Yellow Brick Road》一文中，对这个问题给出了迄今为止最系统的回答

2026-06-01

这个问题过去一年被反复讨论，却从未被系统回答过。

当 OpenAI 周活用户逼近 10 亿、Anthropic 年化收入突破 40 亿美元，当 Deep Research、Operator、Codex 一个接一个落地，一个越来越现实的焦虑开始蔓延：

AI 应用层，会不会重演移动互联网时代工具软件的命运？

最终被平台全部吸收？

a16z 合伙人 Joe Schmidt 在《Avoiding Death on the Yellow Brick Road》里，给出了迄今为止最系统的回答。

黄砖路是什么

Joe Schmidt 借《绿野仙踪》里通向奥兹国中心的黄砖路，来描述模型公司正在全力推进的产品方向。

这些方向有一个共同特征：产品价值高度依赖模型能力本身。

编程助手、写作助手、图像生成、搜索、通用 Agent、办公协作——模型越强，产品越强。竞争优势来自模型，而非应用层设计。

这意味着 OpenAI 和 Anthropic 拥有天然优势：最强模型、最低推理成本、最大流量入口、最强品牌认知，全部集中在同一家公司。

沿着黄砖路创业，竞争的对象不是其他创业公司，而是模型提供商本身。

这不是焦虑，这是结构性问题。

OpenAI 自己证明了应用层不会消失

有趣的是，证明应用层价值存在的，恰恰是 OpenAI 自己。

过去一年，OpenAI 和 Anthropic 都在持续扩大企业交付团队，招募大量来自 Palantir、麦肯锡、BCG 和大型企业软件公司的人。

他们的工作不是训练模型，是帮助企业部署模型。

这背后暴露出一个事实：企业问题从来不是单纯的智能问题，而是系统问题。

一家保险公司的核保流程可能涉及十几个系统。一家银行的风险审批横跨多个部门。一家律所的合同审查需要调用几十年的历史案例。

这些复杂性不会因为模型变得更聪明而消失。相反，模型越强，企业越需要一套可靠的系统来约束和管理这种能力。

推理能力不等于执行能力

Agent 热潮最容易产生的误解，是把推理能力等同于执行能力。

Joe Schmidt 引用 11x 创始人的经验：一个销售 Agent 看起来只是帮助销售找客户发邮件，但真实流程是——客户发现、数据补全、CRM 同步、企业研究、邮件生成、电话外呼、回复分析、商机评分、线索流转。

其中超过一半环节根本不需要 AI。

它们需要的是稳定的软件工程能力、数据治理能力和复杂系统协调能力。

很多创业者以为 Agent 是产品。实际上 Agent 只是工作流中的一个组件。真正的产品，是围绕 Agent 建立起来的整套系统。

Harvey 的护城河不是法律知识

很多人第一次看到 Harvey 时的反应：这不就是 GPT 套壳吗？

真正进入大型律所之后会发现，事情完全不是这样。

一次并购合同审查，律师需要同时处理当前合同版本、客户历史协议、判例数据库、地方法规、合伙人修改意见、企业内部合规规则。模型可以帮助分析，但真正复杂的是如何把这些信息组织成完整工作流。

随着时间推移，Harvey 积累的不只是法律知识。更重要的是，它开始掌握律所如何工作——律师如何协作、合伙人如何审批、风险如何被管理、客户如何完成交付。

律所购买的不是聊天机器人，而是一套法律生产系统。

这才是 Harvey 估值数十亿美元的真实原因。

Sierra 的逻辑：客服从来不是沟通业务

由前 Salesforce 联席 CEO Bret Taylor 创办的 Sierra，是近两年最受关注的 Agent 公司之一。

很多人认为客服最容易被通用模型取代，因为它看起来只是聊天。

但企业客服本质上从来不是沟通业务，而是执行系统。

当用户说"我要取消保险"，系统背后需要完成：身份验证、查询保单、判断违约责任、计算退款金额、更新 CRM、更新财务系统、生成审计记录。

用户看到的是一句回复。企业看到的是一整套运营流程。

模型负责沟通，系统负责执行。执行才是真正创造价值的部分。

医疗行业的护城河：责任

Abridge 帮助医生自动生成诊疗记录，从产品表面看和 ChatGPT 没有本质区别。

但医院采购 Abridge 不是因为它会总结，而是因为它能够进入医院体系：满足 HIPAA 监管、符合医疗记录标准、对接 EHR 系统、留下完整审计追踪。

在医疗行业，一次错误记录可能引发真实责任。

医院购买的不是摘要工具，而是一套能够承担责任的生产系统。

责任本身，就是护城河。

工作流飞轮

Joe Schmidt 特别提到 FurtherAI——一家做保险核保的 AI 公司。

保险行业大量决策依据散落在 SOP 流程、历史案例、核保员经验、经理审批意见、企业风险偏好体系。很多情况下，两份几乎相同的风险报告会得到完全不同的结果。

原因就在于那些长期沉淀下来的隐性知识。

这些知识不会出现在互联网，不会进入公开训练集，也无法通过一次模型升级获得。

FurtherAI 真正积累的不是模型能力，而是保险公司的运营记忆。每一次人工修正、每一次异常处理、每一次例外审批，都会成为系统的新知识。

这是工作流飞轮：使用越深，积累越厚，越难替换。

下一代企业软件的权力转移

过去二十年，企业软件最重要的价值是记录工作。Salesforce 记录销售，Workday 记录人力资源，ServiceNow 记录服务流程。它们本质上都是 System of Record。

AI 时代正在出现新的变化：软件开始从记录工作走向执行工作。系统不再只是保存数据，而是直接参与业务流程。

谁掌握工作流，谁掌握数据产生过程，谁掌握治理规则，谁就掌握未来企业 AI 的入口。

这也是 a16z 的判断：市场真正被高估的不是 AI 应用层本身，而是那些建立在模型能力之上的薄封装产品。真正被低估的，是那些深入企业流程、承担业务责任、持续积累行业知识的系统型公司。

模型是基础设施，不是终局

过去三年，整个行业几乎围绕同一个中心旋转：更强的模型、更低的推理成本、更长的上下文窗口。这没有错，但它是基础设施逻辑。

就像数据库、云计算、电力——重要性持续提升，但价值捕获的位置正在迁移。

OpenAI、Anthropic 和 Google 会继续扩张黄砖路，编程、搜索、写作、办公协作都将逐渐被纳入平台体系。

但企业世界的大部分价值，从来不在黄砖路上。

它存在于复杂的审批链路里，存在于监管规则里，存在于组织协同里，也存在于那些需要数十个步骤、多个系统和多个角色共同参与的真实业务流程之中。

如果说过去三年的关键词是 Model，那么未来三年的关键词，很可能是 Workflow。

下一批千亿美元公司，大概率不会诞生于又一个 ChatGPT 套壳产品。它们更有可能诞生于那些深入行业腹地、最终成为企业实际生产系统的新一代软件公司。