云技术栈用了大约 15 年时间，才从硬件主导演变为软件主导，AI 技术栈可能会遵循类似的时间表。自研芯片的进展是关键变量。如果 TPU、Trainium 和其他 ASIC 能在大规模应用上取得成功，它们可能会挤压英伟达的利润空间，并使利润向技术栈上游转移

2026-05-08

两年前，有人分析了AI价值链的经济结构，发现了一个奇特的倒置：整个生态系统83%的营收和87%的毛利，集中在最底层的算力层。

今天重新做这个统计，结论几乎没变。

AI生态系统年化营收从900亿美元增长到4350亿，增幅5倍。但半导体层仍然占据AI总毛利的79%。传统云技术栈的格局是完全相反的：应用层占70%毛利，硬件层只占6%。

现在的AI技术栈，是那个格局的镜像。

这笔利润都去哪了

英伟达数据中心业务年化约2500亿美元，毛利率73%。

一家公司，吃掉了AI硬件层80%的份额，也吃掉了整个AI生态系统约一半以上的总毛利。与此同时，OpenAI和Anthropic合计年化营收450亿美元，占应用层75%的份额，毛利率约33%。

做AI应用，打折扣的生意。做AI芯片，才是暴利。

这不是偶然，这是结构性差异。算力层有规模效应、有技术护城河、有先发优势，应用层则面临激烈竞争和持续降价压力——模型越便宜，用模型做的产品越难提价。

这是个有参照系的问题，参照系来自于云计算。

AWS在2006年上线S3，到2020年代初，SaaS公司的估值倍数远超硬件公司。这段时间大约是15年。期间的机制是：越来越多的企业应用依赖云基础设施，数据和工作流形成护城河，软件层的定价权和利润率逐步超过硬件层。

AI技术栈目前每年从半导体层向其他层转移约4个百分点的毛利。按这个速度，达到云时代软件主导的格局，需要10年以上。

这不是悲观预测，是云计算走过的路用的时间刻度。

打破这个时间表的可能性只有一个：大规模自研ASIC成功。

逻辑不复杂。如果主要客户——谷歌、亚马逊、Meta、微软、OpenAI——把相当比例的工作负载从Nvidia GPU迁移到自研芯片，Nvidia的定价权就会动摇，利润就会被压缩，流向应用层和基础设施层。

自研芯片进展中，谷歌TPU是目前最成熟的案例：第七代Ironwood已开始外部商业化销售，据报Anthropic订购了100万颗；谷歌还在部分客户中对Nvidia GPU进行约30%的价格压制。亚马逊Trainium2已部署140万颗，年化运营率突破100亿美元。

但有一个关键区分：到目前为止，没有任何自研ASIC被证明能在训练工作负载上与Nvidia大规模抗衡。

推理可以分散在各种芯片上，训练不行。训练需要极高的芯片间通信带宽，这正是Nvidia NVLink生态系统的核心护城河。推理成功不等于训练能替代。

黄仁勋对这个问题心知肚明。他把自研ASIC评价为"缺乏竞争力"，历史记录也支持他：绝大多数自研芯片项目最终都夭折了。

一个反直觉的结论：这种慢不是失败，是结构在展开。

云计算用15年从硬件转向软件，这段时间里Oracle、Sun、IBM相对衰退，Salesforce、Workday、AWS自己的SaaS部分崛起。这是必然发生的历史，只是需要时间来走完。

AI价值链的重心也会转移。应用层的毛利率会提高，算力层的相对占比会下降。

只是可能需要同样长的时间。

对当下的几个推论：在AI上层做应用的公司，利润空间在短期内不会显著改善；押ASIC颠覆Nvidia的逻辑成立，但缺口在训练而非推理，需要在训练工作负载上找到可复制的规模证明；那些在"AI经济格局迟迟不反转"上感到困惑的人，只是对时间刻度的估计不对——15年是正常值，不是失败。

在那之前，算力层继续吃到撑。