Mike Krieger 指出，需要在三个方向上演进：第一，将执行工作的地点与探讨工作的地点解耦；第二，针对复杂内容进行渐进式呈现，而非给出大量文本消耗认知精力；第三，多人协作模式仍是尚未被充分探索的前沿

2026-06-11

Mike Krieger 这次访谈里，最值得抓住的不是 Fable 又强了多少。

强，是结果。

真正发生变化的，是工作界面开始不够用了。

当一个模型已经可以被委派一个复杂任务，自己跑几个小时，遇到服务宕机还能先搭脚手架继续推进，等人醒来时已经在待命，问题就不再是“模型会不会做”。

问题变成了：

人类该在哪里讨论工作？

模型该在哪里执行工作？

复杂判断该如何被人理解？

多个 Claude 与多个人同时参与一件事时，团队上下文该住在哪里？

这已经不是聊天框能单独解决的问题。

聊天框没有错，但它太小了

Mike Krieger 没有否定聊天。

他说，发送消息、收到回复，这个基础模式并没有完全错。

但它需要演进。

原因很简单：过去的聊天，是问答界面。

今天的 Agent，更像委托界面。

问答界面的默认假设是：我问一句，你答一句；答案就在这一轮里完成。

委托界面的默认假设是：我给你一个目标，你在后台拆解、执行、验证、等待、回报；中间可能有多个子任务、多个工具、多个时间尺度。

当工作从“一轮回答”变成“长周期执行”，聊天框就开始显得太窄。

它能承载指令。

但很难承载状态。

它能承载文本。

但很难承载复杂度。

它能承载一个人与一个 Agent 的关系。

但很难承载一个团队与一组 Agent 的关系。

执行地点与讨论地点要分开

Mike Krieger 提到的第一个演进，是将执行工作的地点与探讨工作的地点解耦。

这句话很重要。

过去我们默认，工作发生在同一个终端里：你打开电脑，写代码，跑命令，看结果，继续追问。

但长任务 Agent 出现之后，这个前提变了。

执行可以发生在远程开发机里。

可以发生在一个持续运行的 Claude Code 会话里。

可以发生在夜里。

可以发生在人离开电脑之后。

人真正需要的，不再是一直盯着执行现场，而是随时能够进入讨论现场：在手机上追问进展，在会议中拉出关键判断，在另一个界面里接管下一步。

这就是“工作地点”的分裂。

执行在后台。

讨论在前台。

执行需要稳定、持续、可恢复。

讨论需要高上下文、低延迟、随时可介入。

如果产品还把两者绑在同一个聊天窗口里，就会出现一种很奇怪的体验：模型明明已经像团队成员一样能干活，但用户仍然被迫像操作工具一样守着它。

这不是模型能力的问题。

这是抽象机制的问题。

复杂内容不能一次性倒给人

第二个演进，是复杂内容的渐进式呈现。

这也是今天很多 AI 产品最容易犯的错误：把“完整”误以为“有用”。

模型确实可以生成很长的解释、计划、权衡、代码审查意见和架构文档。

但人类并不是因为拿不到文本而焦虑。

人类焦虑，是因为不知道该从哪里看起，不知道什么最重要，不知道哪些地方需要自己负责。

所以复杂内容不能只靠“大量文本”来交付。

它需要层次。

先给结论，再给理由。

先给风险，再给细节。

先给需要人类决策的分叉，再把背景材料收起来。

先让人理解系统状态，再允许人下钻到证据。

这和传统文档不同。

传统文档是写给阅读的。

Agent 交付物是写给判断的。

阅读追求完整。

判断追求抓手。

Mike Krieger 提到，他会要求 Fable 对复杂性做更多渐进式呈现，而不是把所有上下文一次性倾倒出来。这个方向背后的产品问题非常尖锐：未来的 AI 界面，不该只是更会写文本，而要更会安排注意力。

谁该先看什么。

谁只需要知道结论。

谁必须理解权衡。

谁需要进入细节承担责任。

这才是复杂协作里真正稀缺的资源。

多人协作才是还没打开的前沿

第三个演进，是多人协作。

这可能是最难的一点。

一个人带几个 Claude 做事，今天已经开始成立。

一个团队带一组 Claude 做同一个复杂项目，还远远没有被充分探索。

Mike Krieger 举的场景很典型：事件响应中，多个人都在思考同一个问题；一个项目横跨多个领域，需要不同负责人把上下文汇聚在一起；一个独立的 Claude 正在执行大量工作，它能不能跟上团队里其他地方正在发生的变化？

这里的问题不是“分享聊天记录”这么简单。

聊天记录只是结果的影子。

真正需要共享的是工作状态、责任边界、上下文演化、决策依据和验证进度。

Anthropic 内部现在仍然保留直接责任人机制，每个人对特定产品或领域负责。这说明人没有消失，责任也没有消失。

变化在于，每个人身边都多了许多 Claude。

于是新的管理工作出现了：

哪些 Claude 在做什么？

哪些任务在等人确认？

哪些 PR 需要处理？

哪些代码审查意见来自人类，哪些来自另一个模型？

哪些修改已经部署，哪些只是提交了？

这不是传统项目管理工具的简单升级。

这是团队工作台要重新设计。

人的价值从执行转向工艺把控

这篇访谈里还有一个很重要的判断：软件工程没有终结，但它变了。

Mike Krieger 说，整体的工艺把控仍然高度依赖人类。

你到底想要什么？

最终发布出来的是什么？

质量到底好不好？

这些问题不会因为代码由模型生成就消失。

甚至会变得更重要。

因为当执行成本下降，组织真正稀缺的东西就会前移：意图表达、目标对齐、品味判断、验证机制、责任承担。

以前，一个想法到产品，中间隔着四五个通宵的工程实现。

今天，这个鸿沟被大幅缩短。

但鸿沟缩短之后，并不意味着人类可以退出。

它意味着人类更早、更频繁、更直接地面对自己的判断质量。

模型把执行速度拉上来了。

于是人的模糊、组织的混乱、验证的缺失，也会更快暴露出来。

真正的新产品，不是更聪明的聊天机器人

所以，Mike Krieger 这三点其实指向同一个方向：AI 原生软件的下一代界面，不是一个更聪明的聊天框。

而是一个新的工作系统。

它要能把执行放到后台。

要能把复杂内容折叠成可理解、可下钻、可判断的层次。

要能让多人和多个 Agent 在同一个上下文里协作，而不是各自在聊天窗口里复制粘贴。

这也是为什么“模型已经像团队成员”这句话如此关键。

如果模型只是工具，聊天框够用。

如果模型是团队成员，组织界面就必须重做。

否则，真正拖后腿的就不再是模型能力。

而是我们给它提供的工作抽象太旧。

未来的竞争，可能不只是比谁的模型更强。

还会比谁更早把组织的工作流、验证流、协作流，重新设计成适合 Agent 参与的形态。

模型负责执行更多工作。

人负责定义更好的工作。

系统负责让两者在同一个上下文里闭环。

这才是聊天界面之后，真正值得关注的方向。

参考

数字开物：《Fable 重塑了什么？ | Anthropic 实验室负责人对话实录》：https://mp.weixin.qq.com/s/T5xRg9xpxt6n9x-NS4Df4A