林俊旸眼中的下一代模型:面向智能体训练,为了行动而思考——这样的模型会把 OpenClaw"龙虾"内含到模型或者一方应用中么?
如果把过去两年的大模型理解为“为了回答而思考”,那么林俊旸在原文里试图指出的变化是:下一代模型会越来越像“为了行动而思考”。
这不是一句漂亮话,而是训练目标、产品形态、以及产业分工都会随之改写的信号。也正因此,一个绕不过去的问题出现了:当模型被面向智能体(Agent)重新训练之后,它会不会把 OpenClaw(龙虾)这类 harness/编排层“吃掉”?未来我们还需要龙虾吗?
我的判断是:**会吃掉一部分,但吃不完;会内含“思考与编排”,但很难内含“执行与治理”。**龙虾不会消失,它会换一种位置存在。
1. “为了行动而思考”到底改变了什么?
“为了回答而思考”的模型,终点是把文字说顺、把题做对。 “为了行动而思考”的模型,终点是把事办成:完成一次跨工具、跨应用、跨环境的任务闭环。
这会迫使训练目标发生变化。模型不再只被奖励“答案像人”,而更可能被奖励:
- 能否把目标拆成可执行步骤
- 能否选择合适工具并正确填参数
- 能否在失败后自我修正并继续推进
- 能否把状态保持一致、不中途失忆
- 能否在不确定处主动澄清、在风险处主动刹车
你会发现,这些能力并不是“加一个提示词模板”就能补齐的,它更像模型的基本功:一种新的“认知结构”。而这正是 OpenClaw 这类 harness 一直在做的事——把模型拉进现实世界,让它按步骤、按权限、按反馈去完成任务。
所以,下一代模型一旦以“行动成功”为训练目标,就天然会逼近龙虾。
2. 龙虾(harness)这层,本来就分成两半
讨论“模型会不会吃掉龙虾”,必须先把龙虾拆开。
OpenClaw 这样的 harness,本质上至少有两层:
A)认知层(策略与编排)
- 计划、分解、反思、纠错
- 工具选择与调用策略
- 状态追踪与多步任务管理
- 在不确定时的澄清与再规划
B)系统层(执行与治理)
- 权限、隔离、沙箱、最小授权
- 跨端运行、进程守护、升级与兼容
- 确定性执行(点击、输入、API 调用、超时与重试、幂等)
- 日志、审计、合规、风控策略
- 生态接入(插件、企业系统、第三方应用对接)
这两层今天被打包在一起,所以看起来像“龙虾是一整个东西”。但它们的技术属性差异极大:A 更像“模型应该学会的能力”,B 更像“系统工程必须做的能力”。
3. 下一代面向智能体训练的模型,会吃掉哪一半?
我认为:会强势内化 A(认知层),但很难彻底内化 B(系统层)。
3.1 会被吃掉的:认知层(策略与编排)
原因很简单:如果模型的训练目标就是行动成功,那么它必须学会“如何行动”。这会让许多今天依赖 harness 的能力,变成模型的默认能力,例如:
- 一上来就能给出结构化计划(而不是散文式建议)
- 能自发选择工具并生成工具调用参数
- 能把失败当作反馈信号,自动修正路线
- 能持续维护任务状态,知道自己做到哪一步了
- 能把“下一步动作”输出成更可执行的中间表示(而非纯自然语言)
换句话说:下一代模型会越来越“像一个自带 OpenClaw 思维方式的模型”。
这就是“把龙虾内含到模型里”的核心依据:模型训练目标一变,harness 的认知价值就会被模型吸收。
3.2 不容易被吃掉的:系统层(执行与治理)
但系统层之所以存在,并不是因为模型不够聪明,而是因为它解决的是另一类问题:安全、确定性、边界与成本。
哪怕模型再强,你也很难把下面这些完全交给“概率模型”:
- “哪些目录能读、哪些能写、哪些永远不能碰”
- “能不能访问网络、能不能调用支付、能不能代发消息”
- “如何保证每一步可追溯、可审计、可回滚”
- “如何保证不同操作系统、不同软件版本下仍稳定执行”
- “如何把风险控制规则固化成系统策略,而不是一段提示词”
所以更可能发生的不是“龙虾消失”,而是 龙虾的系统层变得更重要:它从“补模型短板”变成“约束模型、托底模型、规模化部署模型”的底座。
4. “内含”会以什么形态发生?三种可能的未来
在“面向智能体训练”的趋势下,龙虾能力被内含,大概率有三种落点。
路径一:模型厂内含(模型 + 自家运行时一体化)
模型厂会把常见的 agent 使用形态做成原生:你和模型对话,它背后就有一套官方的工具调用、任务会话、执行环境与日志体系。对用户而言,感觉像“模型自带龙虾”。
这条路的优势是体验一致、迭代快;劣势是生态封闭、可控性与可迁移性往往较弱。
路径二:一方应用内含(超级 App / OS / 办公套件)
拥有入口与场景的一方,会把“行动闭环”内建在自己的应用/系统里:消息、文件、日程、内容、设备、支付、IoT……这些都属于它天然能接的执行面。对用户而言,龙虾不是一个单独的产品,而是你日常软件里的一项能力。
这条路的优势是场景强、权限天然;劣势是跨生态能力弱,且容易变成“只在自家花园里强”。
路径三:中立 harness 继续存在(龙虾像 Linux 一样活下去)
当模型能力越来越强,反而会出现一个需求:我希望在不同模型之间切换,我希望更强的可控与审计,我希望更广的插件生态,我希望在本地/私有化环境稳定运行。
这会让开源/中立 harness 获得新的价值:成为“执行层的通用底座”。模型负责更聪明地编排,harness 负责更可靠地执行与治理。
这条路的优势是中立与可控;劣势是需要长期工程投入,且在“原生一体化体验”面前会显得不够丝滑。
5. 所以答案是什么:会把 OpenClaw 龙虾内含吗?
如果你问的是“会不会把 OpenClaw 的全部替代掉”,我的答案是:不会。
如果你问的是“会不会把 OpenClaw 的核心方法论内化到模型/一方应用里”,我的答案是:会,而且正在发生。
更准确的一句话是:
- 模型会把龙虾的“认知层”吃进去,让自己天生更像一个能做事的智能体;
- 系统会把龙虾的“系统层”做厚,用权限、审计、可靠性把行动落地;
- 未来的分水岭不是“有没有龙虾”,而是“谁把行动闭环做成了可规模化的系统能力”。
结语:从“会说”到“会做”,从“模型”到“系统”
林俊旸的命题最重要的价值,是把注意力从“更像人地回答”引向“更像人地完成任务”。一旦训练目标锚定“行动成功”,今天看起来像外挂的 harness,就会有一部分被内含为模型的默认能力;但行动真正落地仍需要系统工程去兜底、约束、审计与规模化。
下一代竞赛的真正对手,不是某个模型参数,也不是某个开源项目,而是一个更大的东西:把推理变成行动的完整系统。