OpenClaw 核心团队:随着模型能力变强,Skill 并不再是一个非常值得被看重的层级。因为每个人的上下文、解决问题的背景和隐性知识都不一样,很多 Skill 的价值会随着模型能力和智能体架构的进一步升级而变薄,并逐步被淘汰
5月11日,上海 ClawCon 闭门交流会。一个参会者向 OpenClaw 核心成员抛出了关于 Skill 和自进化能力集成的问题,得到了一个我认为值得认真对待的判断:
“随着模型能力变强,Skill 并不再是一个非常值得被看重的层级。因为每个人的上下文、解决问题的背景和隐性知识都不一样,很多 Skill 的价值会随着模型能力和智能体架构的进一步升级而变薄,并逐步被淘汰。”
这个判断和几个月前社区里流行的"Thin Harness, Fat Skills"框架形成了正面张力。值得拆开看。
Skill 解决的是什么问题
Skill 本质上是一种预设的通用化经验打包。
在模型能力有限的阶段,Skill 很有价值:模型不知道"发博客"应该走哪些步骤,不知道"查爱分析数据"需要调用哪个接口,不知道"做 lint 检查"需要哪些命令序列——你把这些流程打包成一个可召唤的工具,模型就能按图索骥,完成原本会出错的事情。
这个逻辑成立的前提是:模型理解不够,流程需要提前写死。
什么让它开始变薄
但模型在快速变好。
当模型本身的推理能力、工具调用能力、对任务意图的理解能力上升到一定程度,预设 Skill 的意义就开始松动——不是因为 Skill 的内容过时了,而是因为模型自己越来越能从上下文中推断出该怎么做。
更根本的问题在于:Skill 是面向"通用用户"设计的,但每个真实用户的上下文是独特的。
- 你的数据源结构和别人不同
- 你的工作流假设和别人不同
- 你的隐性判断标准和别人不同
- 你认为"完成"的标准和别人不同
一个面向所有人的通用 Skill,在每个具体场景里都只是一个低精度的近似。模型能力越强,它越能从你自己的上下文中提取出更高精度的做法——这时通用 Skill 反而成了精度的天花板,而不是底线。
替代品不是更多 Skill,而是你自己的上下文
这个判断的另一面更值得关注:如果 Skill 要被淘汰,它被什么替代?
答案是:Memory、上下文积累、以及你自己沉淀的隐性知识。
模型知道你怎么工作、你的文档结构、你的判断偏好、你历史上的决策记录——这些东西比任何通用 Skill 都更能驱动高精度的输出。OpenClaw 核心团队后续投入精力的方向,也明确指向了这里:Agent Memory 设计、任务编排的数据反馈、进程管理——而不是继续扩充 Skill 库。
这与他们"每个人上下文非常不同"的判断完全一致。真正有壁垒的不是谁的 Skill 写得好,而是谁把自己的上下文管理得更清晰、更持久、更能被模型调用。
对建造者的含义
这个判断对正在做 AI 工具的人有一个直接的含义:
不要在 Skill 层建护城河。
Skill 可以作为产品起步阶段的交付物,但长期价值不在那里。随着基础模型能力的提升,任何可以被泛化描述的操作序列,都会逐渐进入模型的基础能力范围。今天作为差异化的 Skill,明天可能是标配。
真正的护城河在于:你帮用户积累了什么上下文,建立了什么记忆结构,沉淀了什么专属的隐性知识——这些是无法被模型能力提升直接替代的。
Gary Tan 几个月前说"Thin Harness, Fat Skills",逻辑是:Harness 不要自己造,把精力放在 Skill 上。OpenClaw 的核心成员现在说:Skill 本身也会变薄。
这不是矛盾,而是时间序列的不同截面。在今天,积累好的 Skill 仍然是生产力杠杆;但要清醒地知道这个层级的有效期,以及真正应该投入的地方在哪里。