Karpathy 昨天在推上回了 Python 之父 Guido 一句话：LLM = CPU，Agent = 操作系统内核

2026-04-01

推上这段对话的表面很短。

Guido 在讲： agent = prompt + skills + tools。

Karpathy 回了一句更像“架构隐喻”的话： LLM = CPU，agent = OS kernel。

重点不在于谁更“贴切”，而在于：他们其实在指向两层不同的问题——“一个 agent 到底是什么”，以及 “真正决定能力上限的是什么”。

Guido 在说什么：把 agent 看成“能力拼装体”

Guido 的表达方式很工程师：他把 agent 拆成三个显性的可配置件：

这句话的启发意义在于： agent 不是一个神秘的新物种，而是一个可组装的产品形态。 你要提升 agent 的表现，往往不是“换更大模型”就结束，而是要在 prompt、skills、tools 这三个旋钮上做工程化。

它把讨论从“模型有多聪明”拉回到“系统怎么搭”。

Karpathy 的类比更像系统课：CPU 本身不等于能跑复杂软件，关键在 OS kernel——它解决的是：

映射回 AI：

这句话真正要强调的，不是“agent 很底层”，而是： 决定 agent 能不能干长活、能不能稳定交付的，不是 LLM 那一瞬间的聪明，而是运行时的控制与治理。

把 Guido 和 Karpathy 放在一起，会发现他们并不矛盾，而是在同一张图的两侧：

这带来的启发是： 今天很多“agent 做不好”的问题，本质不是零件缺，而是没有 kernel 级的运行机制。

你给了 prompt、给了 tools、也有一堆 skills，仍然会出现：

这些问题都更像“操作系统问题”，而不是“CPU 问题”。

如果你把 agent 当成“更聪明的聊天机器人”，你会天然把资源押在：

但如果你接受 Karpathy 的类比，你会把资源押在另一套东西上：

这其实就是：从“买 CPU”走向“造 OS”。

而这也解释了为什么真正的壁垒越来越不在模型，而在工程与组织：

Guido 给了一个“可组装”视角：agent 是 prompt/skills/tools 的组合体。 Karpathy 给了一个“可运行”视角：agent 的本质是一个 kernel，把推理变成执行，把执行变成可控。

如果把这段对话当成一个信号，它指向的不是“又一个术语”，而是下一阶段的竞赛焦点：

LLM 让生成变便宜；agent kernel 让交付变可靠。 真正拉开差距的，会越来越像操作系统之争：谁的调度、记忆、I/O、权限与验收体系更成熟，谁就能把模型能力变成持续生产力。