Karpathy 昨天在推上回了 Python 之父 Guido 一句话:LLM = CPU,Agent = 操作系统内核
推上这段对话的表面很短。
Guido 在讲: agent = prompt + skills + tools。
Karpathy 回了一句更像“架构隐喻”的话: LLM = CPU,agent = OS kernel。
重点不在于谁更“贴切”,而在于:他们其实在指向两层不同的问题——“一个 agent 到底是什么”,以及 “真正决定能力上限的是什么”。
Guido 在说什么:把 agent 看成“能力拼装体”
Guido 的表达方式很工程师:他把 agent 拆成三个显性的可配置件:
- prompt:你怎么描述目标、约束、风格、边界
- skills:一组可复用的流程/模板/小策略(可调用、可组合)
- tools:可以对外界产生真实影响的接口(搜索、代码执行、浏览器、数据库、发消息……)
这句话的启发意义在于: agent 不是一个神秘的新物种,而是一个可组装的产品形态。 你要提升 agent 的表现,往往不是“换更大模型”就结束,而是要在 prompt、skills、tools 这三个旋钮上做工程化。
它把讨论从“模型有多聪明”拉回到“系统怎么搭”。
Karpathy 在说什么:把 agent 看成“运行时与调度系统”
Karpathy 的类比更像系统课:CPU 本身不等于能跑复杂软件,关键在 OS kernel——它解决的是:
- 调度:什么时候算、算什么、并行还是串行
- 内存/状态:怎么保存与恢复上下文(进程状态、缓存、文件系统)
- I/O:怎么跟外界交互(网络、磁盘、设备、权限)
- 中断与异常:失败了怎么办、如何重试、如何回滚
- 安全边界:权限、隔离、资源配额
映射回 AI:
- LLM 像 CPU:提供一步步“生成/推理”的算力(下一 token / 下一动作的建议)
- Agent 像 kernel:把推理变成“可持续执行”的过程,把工具、记忆、反馈、错误处理、停止条件组织成一个闭环
这句话真正要强调的,不是“agent 很底层”,而是: 决定 agent 能不能干长活、能不能稳定交付的,不是 LLM 那一瞬间的聪明,而是运行时的控制与治理。
两句话合起来:一个是“组件观”,一个是“系统观”
把 Guido 和 Karpathy 放在一起,会发现他们并不矛盾,而是在同一张图的两侧:
- Guido 在讲 agent 的“静态构成”:有哪些零件可拼装(prompt/skills/tools)
- Karpathy 在讲 agent 的“动态机制”:拼好之后怎么跑起来、怎么持续跑、怎么不跑偏(kernel/控制循环)
这带来的启发是: 今天很多“agent 做不好”的问题,本质不是零件缺,而是没有 kernel 级的运行机制。
你给了 prompt、给了 tools、也有一堆 skills,仍然会出现:
- 任务做到一半就“自我感觉完成”(错误完成感)
- 反复走同一条失败路线(无外置记忆/无失败档案)
- 能跑 demo,跑不进生产(无验收标准、无回滚、无权限治理)
- 看起来很忙,但方向漂(无反馈回路、无评测/无 oracle)
这些问题都更像“操作系统问题”,而不是“CPU 问题”。
这个类比对做产品/做组织的价值:把焦点从“模型能力”移到“执行基础设施”
如果你把 agent 当成“更聪明的聊天机器人”,你会天然把资源押在:
- 提示词
- 更大模型
- 更多知识注入
但如果你接受 Karpathy 的类比,你会把资源押在另一套东西上:
- 任务如何被拆成可调度的工作单元
- 状态如何被外置化(记忆、日志、里程碑、失败路线)
- 工具如何被安全地暴露(权限、审计、沙箱)
- 验收如何被制度化(eval、测试、指标、回归)
- 失败如何被处理(重试策略、回滚、降级、人工接管)
这其实就是:从“买 CPU”走向“造 OS”。
而这也解释了为什么真正的壁垒越来越不在模型,而在工程与组织:
- 你能不能把 agent 放进一个能长期运转的系统里
- 你能不能把“人类判断”固化成可复用的 skills 和可执行的 eval
- 你能不能用制度与工具把风险收住,让它敢进生产
一句收束:agent 的竞争,越来越像“操作系统之争”
Guido 给了一个“可组装”视角:agent 是 prompt/skills/tools 的组合体。 Karpathy 给了一个“可运行”视角:agent 的本质是一个 kernel,把推理变成执行,把执行变成可控。
如果把这段对话当成一个信号,它指向的不是“又一个术语”,而是下一阶段的竞赛焦点:
LLM 让生成变便宜;agent kernel 让交付变可靠。 真正拉开差距的,会越来越像操作系统之争:谁的调度、记忆、I/O、权限与验收体系更成熟,谁就能把模型能力变成持续生产力。