从 Vibe Coding 到 Agent Swarm:人类退出实时控制之后,工程会变成什么
有一张图把这两年的变化画得很干脆:
- Vibe coding:人写所有代码,AI 只当“更聪明的补全”。
- Agentic engineering:人像现场导演,AI 像执行团队;你盯着它写、随时纠偏。
- Autoresearch(当下):人写
program.md(目标、边界、验收),然后离场;回来只看结果。 - Agent swarm(下一步):人只设目标,剩下交给一群自治 agent 互相分工、互相校验、互相交付。
这不是“更强的模型”那么简单,而是控制结构的迁移:
人类从“实时操纵”退到“事先设定 + 事后验收”。
当你接受这一点,很多争论会自动结束:
- “AI 会不会写代码”不再关键。
- “AI 写的代码能不能维护”也不再是第一问题。
第一问题变成:你能不能把目标写清楚,并用机制约束它。
一条主线:人类的带宽不够了
软件工程的瓶颈,长期不在 CPU,而在人的注意力。
Vibe coding 时代,人的注意力花在“每行代码是否正确”。
Agentic engineering 时代,人的注意力花在“这一步是否偏航”。
Autoresearch 时代,人的注意力开始花在“任务定义是否可验收”。
这条线很残酷:
- 模型越强,能做的事越多。
- 但人的带宽没变。
于是系统必须把“控制”从人手里拿走。
不是因为人不重要,而是因为人没法当实时操作系统。
阶段差异:你到底在控制什么?
1)Vibe coding:控制代码
你让 AI 写一个函数,改一个 Bug。
控制粒度是“代码块”。
这时最有效的技能是:
- 写清楚函数意图
- 看懂 diff
- 快速跑通测试
2)Agentic engineering:控制过程
你让 AI 按步骤做事:先读仓库、再列计划、再写实现。
控制粒度是“步骤”。
这时最有效的技能是:
- 设计 workflow
- 在关键节点插入检查点
- 及时打断、重定向
3)Autoresearch:控制目标
你写一个 program.md:
- 目标是什么
- 不做什么
- 数据从哪来
- 输出长什么样
- 验收标准是什么
控制粒度变成“任务定义”。
这时最有效的技能变成:
- 把模糊愿望压成可验收的 spec
- 把风险写成明确的边界
- 把评价写成可执行的 tests / rubric
4)Agent swarm:控制生态
当多个 agent 互相分工、互相调用,人的控制进一步后退。
你不再控制某个 agent 的行为,而是控制一个生态:
- 谁负责生成?
- 谁负责验证?
- 谁负责对抗?
- 谁负责回滚?
控制粒度变成“治理结构”。
这时最有效的技能是:
- 设计角色与权限
- 设计对抗与审计
- 设计成本与截止
真正的新工程学:把“验收”写成系统的一部分
很多人担心 agent swarm 的失控。
但失控不是因为 agent 变强,而是因为我们仍用旧时代的方法管理它:
- 让它自由发挥
- 然后祈祷它做对
孢子式系统的正确管理方式只有一个:
把验收写进系统里。
你不需要让 AI “更听话”。
你需要让它“即使不听话,也出不了圈”。
具体来说,未来的工程会更像三件事:
- 目标语言:把意图表达成机器可执行的约束。
- 评估装置:自动化的 tests、rubric、对抗样本、审计日志。
- 资源边界:预算、时间、权限、数据隔离。
当这三件事齐了,你就敢把实时控制交出去。
给个人的建议:把自己训练成“产品经理 + QA + 安全官”
在 agent swarm 时代,最值钱的人不一定是写代码最快的人。
更值钱的是能把系统跑起来的人:
- 能写清目标(产品)
- 能设计验收(QA)
- 能设定边界(安全)
这三者合一,就是未来的“工程导演”。
结语:人类不会消失,但会换位置
从 vibe coding 到 agent swarm,不是人类被替代。
而是人类换了位置:
- 从“手”变成“规则”
- 从“实时操作”变成“设计验收”
- 从“写代码”变成“写目标与边界”
当你开始用这种方式理解 AI,下一步就很明确了:
你要练的不是提示词。
你要练的是:把世界写成可以被验收的目标。