云技术栈用了大约 15 年时间,才从硬件主导演变为软件主导,AI 技术栈可能会遵循类似的时间表。自研芯片的进展是关键变量。如果 TPU、Trainium 和其他 ASIC 能在大规模应用上取得成功,它们可能会挤压英伟达的利润空间,并使利润向技术栈上游转移
两年前,有人分析了AI价值链的经济结构,发现了一个奇特的倒置:整个生态系统83%的营收和87%的毛利,集中在最底层的算力层。
今天重新做这个统计,结论几乎没变。
AI生态系统年化营收从900亿美元增长到4350亿,增幅5倍。但半导体层仍然占据AI总毛利的79%。传统云技术栈的格局是完全相反的:应用层占70%毛利,硬件层只占6%。
现在的AI技术栈,是那个格局的镜像。
这笔利润都去哪了
英伟达数据中心业务年化约2500亿美元,毛利率73%。
一家公司,吃掉了AI硬件层80%的份额,也吃掉了整个AI生态系统约一半以上的总毛利。与此同时,OpenAI和Anthropic合计年化营收450亿美元,占应用层75%的份额,毛利率约33%。
做AI应用,打折扣的生意。做AI芯片,才是暴利。
这不是偶然,这是结构性差异。算力层有规模效应、有技术护城河、有先发优势,应用层则面临激烈竞争和持续降价压力——模型越便宜,用模型做的产品越难提价。
反转需要多久
这是个有参照系的问题,参照系来自于云计算。
AWS在2006年上线S3,到2020年代初,SaaS公司的估值倍数远超硬件公司。这段时间大约是15年。期间的机制是:越来越多的企业应用依赖云基础设施,数据和工作流形成护城河,软件层的定价权和利润率逐步超过硬件层。
AI技术栈目前每年从半导体层向其他层转移约4个百分点的毛利。按这个速度,达到云时代软件主导的格局,需要10年以上。
这不是悲观预测,是云计算走过的路用的时间刻度。
能加速的唯一变量
打破这个时间表的可能性只有一个:大规模自研ASIC成功。
逻辑不复杂。如果主要客户——谷歌、亚马逊、Meta、微软、OpenAI——把相当比例的工作负载从Nvidia GPU迁移到自研芯片,Nvidia的定价权就会动摇,利润就会被压缩,流向应用层和基础设施层。
自研芯片进展中,谷歌TPU是目前最成熟的案例:第七代Ironwood已开始外部商业化销售,据报Anthropic订购了100万颗;谷歌还在部分客户中对Nvidia GPU进行约30%的价格压制。亚马逊Trainium2已部署140万颗,年化运营率突破100亿美元。
但有一个关键区分:到目前为止,没有任何自研ASIC被证明能在训练工作负载上与Nvidia大规模抗衡。
推理可以分散在各种芯片上,训练不行。训练需要极高的芯片间通信带宽,这正是Nvidia NVLink生态系统的核心护城河。推理成功不等于训练能替代。
黄仁勋对这个问题心知肚明。他把自研ASIC评价为"缺乏竞争力",历史记录也支持他:绝大多数自研芯片项目最终都夭折了。
慢的意义
一个反直觉的结论:这种慢不是失败,是结构在展开。
云计算用15年从硬件转向软件,这段时间里Oracle、Sun、IBM相对衰退,Salesforce、Workday、AWS自己的SaaS部分崛起。这是必然发生的历史,只是需要时间来走完。
AI价值链的重心也会转移。应用层的毛利率会提高,算力层的相对占比会下降。
只是可能需要同样长的时间。
对当下的几个推论:在AI上层做应用的公司,利润空间在短期内不会显著改善;押ASIC颠覆Nvidia的逻辑成立,但缺口在训练而非推理,需要在训练工作负载上找到可复制的规模证明;那些在"AI经济格局迟迟不反转"上感到困惑的人,只是对时间刻度的估计不对——15年是正常值,不是失败。
在那之前,算力层继续吃到撑。