Google 创始人布林要求DeepMind员工“必须果断转向,追赶Agent技术”,他写道,“要赢得最终冲刺,我们必须迅速弥补Agent执行能力的差距,让我们的模型成为代码的核心开发者。”
这句话把很多遮羞布直接掀开了。
不是“我们要做更聪明的模型”。
而是:我们落后了。我们必须追。并且要追的是 Agent 的执行能力。
布林写道,要赢得最终冲刺,必须迅速弥补 Agent 执行能力的差距,让模型成为代码的核心开发者。
“核心开发者”这四个字很重。
它不是“辅助你写”。
它是“你围着它转”。
这不是一句口号,是一次组织结构的倒置
你可以把 AI Coding 理解成两条路。
一条路是“工具”:
- 自动补全
- 生成片段
- 帮你写函数
另一条路是“主体”:
- 读懂工程
- 拆解任务
- 改代码、跑测试、修 bug
- 提 PR、过 CI、上线
前者提升效率。
后者改变权力结构。
当布林要求工程师在“复杂多步骤任务中强制使用内部智能体工具”,意思就变成了:
谷歌不再把 Agent 当成可选工具,而是把它当成开发流程的默认入口。
这不是模型团队的 KPI,这是管理层在改工作方式。
谷歌为什么“也急了”:因为参照系变了
在参考报道里,有一个对比很刺眼:
- 谷歌 CFO 说:公司大约一半代码由 AI 生成
- Anthropic 侧公开讲:近乎全部代码由 AI 生成
“一半”和“近乎全部”的差距,不是 50% 的差距。
它更像是两种操作系统的差距。
当你到“近乎全部”这个区间时,AI 不可能只是一个 IDE 插件。
它必须已经是一个流程闭环:
- 上下文怎么喂
- 任务怎么拆
- 结果怎么验
- 失败怎么回滚
- 代码怎么评审
以及最难的:
责任怎么归属。
当 AI 成为核心开发者,人类工程师到底负责什么?
负责“指令”,还是负责“审判”?
真正的差距不在“会不会写”,在“能不能交付”
今天的 coding 基准测试很容易让人误判。
你以为差距在“生成能力”。
但布林这段话明确指向的是:执行能力。
执行能力意味着:
- 在一个真实 repo 里,不迷路
- 能处理依赖、测试、构建、部署
- 能在多轮迭代里保持一致性
- 能把“做完”变成“上线”
也就是说:从“写得像”到“跑得通”。
从“输出代码”到“产出软件”。
Agent 的竞争,最终会落到一个很土的地方:
谁能把工程系统吃进去,谁就能把生产力吐出来。
所谓“内部代码库训练”,其实是在押注一个秘密武器
参考报道提到:谷歌的突击队会基于内部代码库训练,而不是公开代码。
这件事表面上看是隐私与安全。
更深一层是:公开语料只能教会模型“写代码”。
内部代码库才能教会模型“在谷歌写代码”。
这里面有工程世界最关键的东西:
- 代码评审风格
- 依赖管理习惯
- 测试框架与门槛
- 发布管线
- 事故复盘模板
这些才是大公司真正的护城河。
你可以开源语言,你很难开源流程。
所以谷歌的逻辑就变得清晰:
先把 Agent 做成自己的核心开发者,再谈对外。
如果让模型成为“核心开发者”,人类应该站在哪里
我更关心的不是谷歌会不会追上。
而是“核心开发者”这个设定,一旦成立,组织里的人类会被迫重新定位。
一个可能的分工是:
- Agent:负责产出与迭代(写、改、跑、修)
- 人类:负责意图与边界(目标、约束、风险、验收)
听起来很美。
但现实会逼出三个问题:
- 验收谁来写?
如果验收还是人类随手写的几条 checklist,Agent 很快就会“优化”到让你误判。
- 事故谁担责?
当软件出事,老板不会去问“模型当时的 token 是多少”。
- 能力怎么培养?
如果初级工程师从第一天就围着 Agent 转,几年后他会不会变成一个只会提需求、不会下场的人?
这才是管理者真正焦虑的地方。
结尾:这场战争的单位不是模型,是流程
布林说“必须果断转向”。
我理解这句话的翻译是:
别再把 Agent 当 demo 了,必须把它塞进生产系统里。
你可以在实验室里赢基准。
你只能在工程系统里赢战争。
当模型要成为“代码的核心开发者”,最终比拼的不是谁写得更漂亮。
而是谁能让自己的组织,真的愿意把“近乎全部”交给它。
参考
- 36氪文章:谷歌也急了
- 链接:https://36kr.com/p/3776106127962885