Token是高价值的,它正在重塑编程、医疗、教育、金融等一切知识密集型行业,但很多高价值的东西未必是好生意,就像电力的出现塑造了整个人类工业文明,但全球电力公司的平均净利润率也不过是个位数
巴菲特在2008年的股东信里开了一个地狱笑话:
假如一位有远见的资本家当年能把莱特兄弟在基蒂霍克的试飞飞机打下来,显然是在为他的继任者造了大福。
他想说的是:最糟糕的生意,是那种增长很快、需要大量资本来维持增长、最后却几乎赚不到钱的生意。
航空业就是这样一门生意。它改变了人类的出行方式,但从莱特兄弟首飞到今天,消灭的资本比创造的利润还要多。
现在,那架从基蒂霍克起飞的飞机,以另一种形式重新升空了。
豆包收费:成本撑不住了
2026年5月4日,五一假期最后一天,豆包在苹果App Store挂出付费版:标准版68元/月,加强版200元,专业版500元。
这不只是一次正常的商业化动作。
豆包月活3.45亿,月人均使用55次。3.45亿人×55次×每次背后的GPU算力,是一个任何"印钞机"也烧不起的数字。字节2025年净利润同比下滑超70%,全年资本开支约1500亿,其中900亿砸向算力采购。2026年预算继续提高到1600亿。
免费午餐不是被收走了,是成本端真的撑不住了。
Anthropic:地表最强也只有40%毛利
如果说豆包的困境是"用户太多、成本太高",那么看Anthropic的数字更有说明力。
Anthropic年化收入约300亿美元,同比增长14倍。500家企业客户年消费超过100万美元。财富10强中8家是Claude的客户。
这是人类商业史上罕见的增长曲线。
然而毛利率只有40%,远低于传统SaaS行业75%到85%的基准。公司预计到2028年毛利率才能到77%——而那只是SaaS行业的下限。
达里奥·阿莫迪说过:如果AI进展延迟12个月,他就会破产。一家年收入300亿美元的公司说这种话,说明Token生意的现金流压力是真实的、结构性的,不是早期的暂时状态。
成本为什么存在刚性底线
SaaS的美好之处在于边际成本趋零。WPS多卖一份订阅,增量成本微乎其微。游戏皮肤、数字音乐,同理。
Token不是这样的。
每一次推理请求,都需要GPU运算、消耗电力、占用芯片寿命。不能把上一次推理的结果复用给下一个用户,每一个回答都是一次全新的计算。
KV Cache、模型蒸馏、量化压缩……这些技术确实在持续降低成本,DeepSeek V4把百万上下文推理的计算量降到V3.2的27%。但无论怎么优化,Token成本曲线有一个永远无法触及零的刚性底线。
这和航空业无论怎么优化燃油效率,每飞一趟都要烧掉实打实的航油,本质上是同一件事。
更糟的是,短期内这条成本曲线不是在下降,而是在上翘:DRAM价格二季度预估跳升63%,NAND闪存涨75%,华为昇腾服务器单台上涨16万元,阿里云AI算力全线涨价最高34%。
定价权是个幻觉
2024年下半年,中国大模型打了一场惨烈的价格战。字节豆包报价0.0008元/千tokens,阿里千问降价97%,智谱降价90%。
2026年,风向急转。智谱率先涨价,三次累计涨幅83%。结果是:涨价前,GLM系列在OpenRouter排名全球第三;涨价后,跌至第17位。
这个教训很直接:AI Token行业用户价格敏感度极高,产品差异化壁垒不足,厂商很难脱离价格战独立提价而不丢失市场份额。
一年前比谁降得狠,一年后比谁涨得快。这种180度急转弯本身就说明了这个行业没有定价权。
没有定价权的行业,很难成为好生意。
Token搬运工的出现,是一个症状
当一门生意的终端定价低到连"二道贩子"都能分到一杯羹时,说明生产者大概率是在贴着成本甚至亏本在卖。
EasyRouter、WorldClaw这类Token中转站相继上线,聚合40到300个大模型API,统一封装后转售,声称比官方定价低30%。启动资金2000到5000元人民币,一套开源代码就能开张。
这类生意的存在,映射了Token定价机制的深层矛盾:上游利润薄到中间商都能活得不错。
利润流向了谁
沿价值链看一眼就清楚了。
字节、谷歌、Meta把利润表上的数字大规模搬到资产负债表,最终都流向了英伟达和台积电。英伟达2026财年营收2159亿美元,GAAP毛利率71.1%。台积电一季度净利润同比增长58.3%。
大模型公司烧钱买显卡、付电费、打Token价格战,英伟达和台积电赚走了超额利润。
这和航空业的百年格局如出一辙:航空公司烧钱买飞机、付航油费、打票价战,波音和空客赚走了利润。
Token不像石油,更像电力
有人把Token比作AI时代的石油。这个比喻传播度很高,但方向用错了。
石油是资源品。供给侧存在天然约束,OPEC可以联手限产,一口油井的开采成本是价格的硬底。正因为供给有约束,资源品生产商在需求旺盛时可以享有定价权。
Token没有这种属性。服务器、机房、电力、显卡,这些生产Token的物理母体在理论上无限可扩张,只要愿意投资,就可以无限放大产出。没有自然规则约束这个过程。
这是一个典型的"高利润吸引资本、资本消灭利润"的循环。短期可能出现算力荒,但中期来看,只要利润率足够高,更多资本就会涌入建设产能,再次把价格打下来。
Token更像电力:每一度电需要即时生产,无法大规模储存,高度同质化,通过管网输送。全球电力行业的平均净利润率,正是个位数。
不同之处在于,电力起码有输配网络构成的区域性垄断,Token连这一层保护都没有。算力服务器在廊坊,请求可以从东南亚发过来,中间没有任何物理壁垒。
升维到Agent,能逃出这个结构吗
行业内不乏乐观者。他们说:原始Token不赚钱,但卖Agent服务可以赚"智能溢价",就像律所按小时收费而不是按打字数收费一样。
这个逻辑有道理,但不完整。
一是底层Token成本仍然刚性。一个Agent执行一次复杂任务,Token消耗量可以达到普通对话的15倍以上。服务做得越多,成本随之线性增长。
二是溢价受制于竞争。只要服务本身不具备独占性的数据壁垒或网络效应,竞争对手可以用同样的底层模型、搭建类似的Agent工作流,以更低的价格抢走客户。从Token到Agent,是从一个红海游到另一个红海。
真正能在升维中赚到钱的,是在Token消耗之上叠加了不可替代价值的人:独占性的行业数据、根深蒂固的客户关系、竞争对手难以复制的业务嵌入深度。
但这种护城河不是Token本身赋予的。它要在Token之外独立构建。
站在Token之上,而不是站在Token之中
好生意需要几个条件:边际成本可控且能持续降至低位;供给端存在约束或壁垒;竞争格局相对集中;拥有定价权;能持续向股东返还超额回报。
这些条件,Token经济一个都不完全满足。
边际成本虽然在降,但存在无法触零的刚性底线;供给端没有任何自然约束;竞争格局极度红海,开源势力持续搅局;定价权在涨价和降价之间剧烈摇摆;利润大头流向上游芯片供应商。
巴菲特还有一句话:“投资者总被增长吸引,虽然他们本应被增长吓退。”
把"航空业"替换成"大模型",把"莱特兄弟首飞"替换成"ChatGPT 3.5出圈",这句话恐怕依然成立。
未来真正能赚到钱的,不是卖Token本身的人,而是那些站在Token之上、建立起独占性壁垒的人。他们拥有不可替代的行业数据,把AI深度嵌入业务流程,使客户迁移成本高到无法离开。
这类玩家存在,但他们的护城河来自行业,不来自Token。