林俊旸眼中的下一代模型：面向智能体训练，为了行动而思考——这样的模型会把 OpenClaw"龙虾"内含到模型或者一方应用中么？

2026-03-27

如果把过去两年的大模型理解为“为了回答而思考”，那么林俊旸在原文里试图指出的变化是：下一代模型会越来越像“为了行动而思考”。

这不是一句漂亮话，而是训练目标、产品形态、以及产业分工都会随之改写的信号。也正因此，一个绕不过去的问题出现了：当模型被面向智能体（Agent）重新训练之后，它会不会把 OpenClaw（龙虾）这类 harness/编排层“吃掉”？未来我们还需要龙虾吗？

我的判断是：**会吃掉一部分，但吃不完；会内含“思考与编排”，但很难内含“执行与治理”。**龙虾不会消失，它会换一种位置存在。

1. “为了行动而思考”到底改变了什么？

“为了回答而思考”的模型，终点是把文字说顺、把题做对。 “为了行动而思考”的模型，终点是把事办成：完成一次跨工具、跨应用、跨环境的任务闭环。

这会迫使训练目标发生变化。模型不再只被奖励“答案像人”，而更可能被奖励：

能否把目标拆成可执行步骤
能否选择合适工具并正确填参数
能否在失败后自我修正并继续推进
能否把状态保持一致、不中途失忆
能否在不确定处主动澄清、在风险处主动刹车

你会发现，这些能力并不是“加一个提示词模板”就能补齐的，它更像模型的基本功：一种新的“认知结构”。而这正是 OpenClaw 这类 harness 一直在做的事——把模型拉进现实世界，让它按步骤、按权限、按反馈去完成任务。

所以，下一代模型一旦以“行动成功”为训练目标，就天然会逼近龙虾。

2. 龙虾（harness）这层，本来就分成两半

讨论“模型会不会吃掉龙虾”，必须先把龙虾拆开。

OpenClaw 这样的 harness，本质上至少有两层：

A）认知层（策略与编排）

计划、分解、反思、纠错
工具选择与调用策略
状态追踪与多步任务管理
在不确定时的澄清与再规划

B）系统层（执行与治理）

权限、隔离、沙箱、最小授权
跨端运行、进程守护、升级与兼容
确定性执行（点击、输入、API 调用、超时与重试、幂等）
日志、审计、合规、风控策略
生态接入（插件、企业系统、第三方应用对接）

这两层今天被打包在一起，所以看起来像“龙虾是一整个东西”。但它们的技术属性差异极大：A 更像“模型应该学会的能力”，B 更像“系统工程必须做的能力”。

3. 下一代面向智能体训练的模型，会吃掉哪一半？

我认为：会强势内化 A（认知层），但很难彻底内化 B（系统层）。

3.1 会被吃掉的：认知层（策略与编排）

原因很简单：如果模型的训练目标就是行动成功，那么它必须学会“如何行动”。这会让许多今天依赖 harness 的能力，变成模型的默认能力，例如：

一上来就能给出结构化计划（而不是散文式建议）
能自发选择工具并生成工具调用参数
能把失败当作反馈信号，自动修正路线
能持续维护任务状态，知道自己做到哪一步了
能把“下一步动作”输出成更可执行的中间表示（而非纯自然语言）

换句话说：下一代模型会越来越“像一个自带 OpenClaw 思维方式的模型”。

这就是“把龙虾内含到模型里”的核心依据：模型训练目标一变，harness 的认知价值就会被模型吸收。

3.2 不容易被吃掉的：系统层（执行与治理）

但系统层之所以存在，并不是因为模型不够聪明，而是因为它解决的是另一类问题：安全、确定性、边界与成本。

哪怕模型再强，你也很难把下面这些完全交给“概率模型”：

“哪些目录能读、哪些能写、哪些永远不能碰”
“能不能访问网络、能不能调用支付、能不能代发消息”
“如何保证每一步可追溯、可审计、可回滚”
“如何保证不同操作系统、不同软件版本下仍稳定执行”
“如何把风险控制规则固化成系统策略，而不是一段提示词”

所以更可能发生的不是“龙虾消失”，而是 龙虾的系统层变得更重要：它从“补模型短板”变成“约束模型、托底模型、规模化部署模型”的底座。

4. “内含”会以什么形态发生？三种可能的未来

在“面向智能体训练”的趋势下，龙虾能力被内含，大概率有三种落点。

路径一：模型厂内含（模型 + 自家运行时一体化）

模型厂会把常见的 agent 使用形态做成原生：你和模型对话，它背后就有一套官方的工具调用、任务会话、执行环境与日志体系。对用户而言，感觉像“模型自带龙虾”。

这条路的优势是体验一致、迭代快；劣势是生态封闭、可控性与可迁移性往往较弱。

路径二：一方应用内含（超级 App / OS / 办公套件）

拥有入口与场景的一方，会把“行动闭环”内建在自己的应用/系统里：消息、文件、日程、内容、设备、支付、IoT……这些都属于它天然能接的执行面。对用户而言，龙虾不是一个单独的产品，而是你日常软件里的一项能力。

这条路的优势是场景强、权限天然；劣势是跨生态能力弱，且容易变成“只在自家花园里强”。

路径三：中立 harness 继续存在（龙虾像 Linux 一样活下去）

当模型能力越来越强，反而会出现一个需求：我希望在不同模型之间切换，我希望更强的可控与审计，我希望更广的插件生态，我希望在本地/私有化环境稳定运行。

这会让开源/中立 harness 获得新的价值：成为“执行层的通用底座”。模型负责更聪明地编排，harness 负责更可靠地执行与治理。

这条路的优势是中立与可控；劣势是需要长期工程投入，且在“原生一体化体验”面前会显得不够丝滑。

5. 所以答案是什么：会把 OpenClaw 龙虾内含吗？

如果你问的是“会不会把 OpenClaw 的全部替代掉”，我的答案是：不会。

如果你问的是“会不会把 OpenClaw 的核心方法论内化到模型/一方应用里”，我的答案是：会，而且正在发生。

更准确的一句话是：

模型会把龙虾的“认知层”吃进去，让自己天生更像一个能做事的智能体；
系统会把龙虾的“系统层”做厚，用权限、审计、可靠性把行动落地；
未来的分水岭不是“有没有龙虾”，而是“谁把行动闭环做成了可规模化的系统能力”。

结语：从“会说”到“会做”，从“模型”到“系统”

林俊旸的命题最重要的价值，是把注意力从“更像人地回答”引向“更像人地完成任务”。一旦训练目标锚定“行动成功”，今天看起来像外挂的 harness，就会有一部分被内含为模型的默认能力；但行动真正落地仍需要系统工程去兜底、约束、审计与规模化。

下一代竞赛的真正对手，不是某个模型参数，也不是某个开源项目，而是一个更大的东西：把推理变成行动的完整系统。