Google 创始人布林要求DeepMind员工“必须果断转向，追赶Agent技术”，他写道，“要赢得最终冲刺，我们必须迅速弥补Agent执行能力的差距，让我们的模型成为代码的核心开发者。”

2026-04-21

这句话把很多遮羞布直接掀开了。

不是“我们要做更聪明的模型”。

而是：我们落后了。我们必须追。并且要追的是 Agent 的执行能力。

布林写道，要赢得最终冲刺，必须迅速弥补 Agent 执行能力的差距，让模型成为代码的核心开发者。

“核心开发者”这四个字很重。

它不是“辅助你写”。

它是“你围着它转”。

这不是一句口号，是一次组织结构的倒置

你可以把 AI Coding 理解成两条路。

一条路是“工具”：

自动补全
生成片段
帮你写函数

另一条路是“主体”：

读懂工程
拆解任务
改代码、跑测试、修 bug
提 PR、过 CI、上线

前者提升效率。

后者改变权力结构。

当布林要求工程师在“复杂多步骤任务中强制使用内部智能体工具”，意思就变成了：

谷歌不再把 Agent 当成可选工具，而是把它当成开发流程的默认入口。

这不是模型团队的 KPI，这是管理层在改工作方式。

谷歌为什么“也急了”：因为参照系变了

在参考报道里，有一个对比很刺眼：

谷歌 CFO 说：公司大约一半代码由 AI 生成
Anthropic 侧公开讲：近乎全部代码由 AI 生成

“一半”和“近乎全部”的差距，不是 50% 的差距。

它更像是两种操作系统的差距。

当你到“近乎全部”这个区间时，AI 不可能只是一个 IDE 插件。

它必须已经是一个流程闭环：

上下文怎么喂
任务怎么拆
结果怎么验
失败怎么回滚
代码怎么评审

以及最难的：

责任怎么归属。

当 AI 成为核心开发者，人类工程师到底负责什么？

负责“指令”，还是负责“审判”？

真正的差距不在“会不会写”，在“能不能交付”

今天的 coding 基准测试很容易让人误判。

你以为差距在“生成能力”。

但布林这段话明确指向的是：执行能力。

执行能力意味着：

在一个真实 repo 里，不迷路
能处理依赖、测试、构建、部署
能在多轮迭代里保持一致性
能把“做完”变成“上线”

也就是说：从“写得像”到“跑得通”。

从“输出代码”到“产出软件”。

Agent 的竞争，最终会落到一个很土的地方：

谁能把工程系统吃进去，谁就能把生产力吐出来。

所谓“内部代码库训练”，其实是在押注一个秘密武器

参考报道提到：谷歌的突击队会基于内部代码库训练，而不是公开代码。

这件事表面上看是隐私与安全。

更深一层是：公开语料只能教会模型“写代码”。

内部代码库才能教会模型“在谷歌写代码”。

这里面有工程世界最关键的东西：

代码评审风格
依赖管理习惯
测试框架与门槛
发布管线
事故复盘模板

这些才是大公司真正的护城河。

你可以开源语言，你很难开源流程。

所以谷歌的逻辑就变得清晰：

先把 Agent 做成自己的核心开发者，再谈对外。

如果让模型成为“核心开发者”，人类应该站在哪里

我更关心的不是谷歌会不会追上。

而是“核心开发者”这个设定，一旦成立，组织里的人类会被迫重新定位。

一个可能的分工是：

Agent：负责产出与迭代（写、改、跑、修）
人类：负责意图与边界（目标、约束、风险、验收）

听起来很美。

但现实会逼出三个问题：

验收谁来写？

如果验收还是人类随手写的几条 checklist，Agent 很快就会“优化”到让你误判。

事故谁担责？

当软件出事，老板不会去问“模型当时的 token 是多少”。

能力怎么培养？

如果初级工程师从第一天就围着 Agent 转，几年后他会不会变成一个只会提需求、不会下场的人？

这才是管理者真正焦虑的地方。

结尾：这场战争的单位不是模型，是流程

布林说“必须果断转向”。

我理解这句话的翻译是：

别再把 Agent 当 demo 了，必须把它塞进生产系统里。

你可以在实验室里赢基准。

你只能在工程系统里赢战争。

当模型要成为“代码的核心开发者”，最终比拼的不是谁写得更漂亮。

而是谁能让自己的组织，真的愿意把“近乎全部”交给它。

参考

36氪文章：谷歌也急了
- 链接：https://36kr.com/p/3776106127962885