硅谷传来一种截然不同的声音——Harness 将死，未来属于 environment engineering，啥意思，为什么

2026-04-03

这篇文章的重量不在于“又一个新词”，而在于它把 Agent 工程里最容易自嗨的部分，硬生生拆成了两类工作：一类会被模型厂 API 吞掉；另一类不会。你站错位置，努力越多越像在给别人修路。

硅谷传来的那句狠话——“Harness 将死，未来属于 environment engineering”——如果只当口号听，会误导你把方向盘扔掉；但如果当成路线图，它其实是在说：别再把机制当壁垒，把环境当成你能撬动的长期杠杆。

先把三个词摆正：从咒语到控制层，再到改造世界

这两年 AI 圈的概念更新，像是一种通词膨胀。

最早我们迷信 prompt engineering：找一句咒语，让模型“点石成金”。
然后到了 context engineering：不是一句话，而是给它恰到好处的上下文。
再后来是 harness / harness engineering：不仅是上下文，还包括工具调用、进程管理、重试、验证、长任务运行机制——让 agent 真的能跑起来、跑得久一点、成功率高一点。
现在开始有人喊 environment engineering：别再训练司机了，先修路；把环境接口变成 agent 友好的结构化世界。

这不是学术争论。它在问一个更现实的问题：在 AI Native 时代，你到底该把团队的时间投在哪里，才不会被下一次 API 更新抹平？

为什么会有人说 “Harness 将死”：模型厂正在吞噬“机制”

对 harness 的唱衰并非空穴来风。原因很简单：底层模型正在基建化。

过去你要写几百行的编排逻辑来实现：

重试与容错
JSON 输出约束
长上下文压缩
工具调用循环
推理长度控制

今天很多都变成 API 的几个参数：结构化输出、上下文缓存、原生工具调用、推理控制……当这些能力被下沉成“水电煤”，那些只封装了 prompt 链与基础执行循环的套壳框架，会被降维打击，这是客观趋势。

于是你会看到一个危险的诱惑：既然机制会被吞掉，那我们干脆放弃自研控制层，把所有希望押在更强的模型上。

这就是那句“harness 将死”最容易被误读的地方。

Environment engineering 的诱惑：修路的杠杆，往往大于训练司机

environment engineering 的魅力在于杠杆率。

Anthropic 的实验直觉很强：把 Claude 放在一个高度结构化的数字环境里，工具 API 的边界清晰、输入输出严格定义，结果 agent 的表现显著好于在真实终端那种混乱环境中的发挥。

这揭示了一个常被忽略的事实：很多时候 agent 表现不佳，不是“脑子不够好”，而是“世界太难懂”。

你可以把它理解成两条投资路线：

harness engineering：训练司机、加装辅助驾驶、改驾驶习惯
environment engineering：修路、统一交通标识、把坑填平、让车道线可见

在很多数字化场景里，修路确实比训练司机更值钱。MCP、Claude Code 之类实践也在证明：只要环境接口足够结构化，模型不需要你写一堆复杂的编排逻辑，也能表现惊人。

于是“未来属于 environment engineering”听起来像一个更高维、更长期的答案。

但问题是：商业世界不按理想环境运行。

关键反转：API 会吞噬机制，但替代不了策略

把 harness 视为“终将被吞掉的中间件”，只对了一半。

现实世界有一条铁律：大语言模型是概率系统，而商业世界要确定性结果。

企业要的不只是“能跑”，而是：

可观测性与可审计：为什么这么决策？链路能否回溯？
成本与路由网关：如何在多个模型之间动态路由，既聪明又省钱？
系统级容错：当 API 不稳定、模型产生幻觉时，如何确定性干预并闭环？
合规与安全：在行业约束里如何保证输出可用、可控、可追责？

这些不是“机制”，是“策略”。

机制可以下沉为 API 参数：工具怎么调用、缓存怎么开、格式怎么约束、基础循环怎么跑。但策略无法外包：什么时候降级、如何切分任务、冲突时听谁的、在哪些环节必须验证、如何把风险锁在沙箱里。

所以 harness 的本质从来不只是“封装逻辑的中间件”，而是复杂系统的控制平面：方向盘、刹车、安全气囊。

它不会死，它只是在从“写机制”迁移到“写策略”。

那为什么环境工程又被吹成终局：因为环境会产出数据飞轮

如果把时间拉长，environment engineering 的确更像终局之战。

当你真正把模型与控制层嵌入到真实业务环境，并重构了交互接口，你会获得两样东西：

你拥有了环境：操作面、权限边界、事件流与反馈回路
你拥有了数据：每一次采纳、修改、纠错、失败轨迹，都会形成闭环数据

这些数据反过来不仅能优化 harness 的策略，还能优化模型与工具结构，从而形成自我进化的正循环。Microsoft 365 Copilot 这类例子之所以强，不是因为它“会总结”，而是它掌控了办公世界的环境接口与数据流。

这就是 environment engineering 真正的壁垒：不是接口优雅，而是“把真实世界变成可学习的环境”。

但别幻想捷径：环境工程撞上的，是遗留系统与隐性知识

环境工程在企业落地上有明显局限，它不是你想做就能做。

传统商业场景里，“环境”往往由三类东西组成：

运行了十几二十年、文档不全的遗留系统
散落在邮件、长文本、Excel 里的非结构化信息
人类专家的隐性知识与直觉判断

把这堆东西重构成 agent 友好的 API，成本高到足以劝退客户与工程师。更现实的是：绝大多数企业不会为了让 agent 跑得顺，就重构耗资千万、运行十年的核心系统。

所以环境工程更多是长期目标，而不是短期可走的捷径。大多数时候，不是世界适应 agent，而是 agent 必须学会在噪音、混乱与非结构化里生存。

这会把聚光灯重新拉回 harness：当环境不可改时，控制平面就是你唯一的杠杆。

三阶段世界观：你现在该押哪一段价值链

文章给了一个很有用的时间结构：

第一阶段（模型为王）：模型更新抹平应用层探索
第二阶段（harness 为王）：模型趋稳后，企业级可用的瓶颈转向成功率、成本与安全，控制层成为乘数
第三阶段（数据与环境为王）：当模型与 harness 都趋于标准化，终局壁垒来自环境接口 + 闭环数据

这套世界观的价值在于：它提醒你别在注定会下沉的地方建壁垒，但也别被“未来属于环境工程”的口号拖着跑偏——你得先在第二阶段站稳，才有资格撬动第三阶段。

终极拷问：你在写机制，还是在建控制平面；你在修路，还是在画概念图？

如果你的团队还在把大量时间耗在手写基础 prompt、基础记忆存储、基础重试机制上，你大概率是在给模型厂做义务劳动。把这些交给 API，把精力转向策略层。

如果你能深耕一个真实场景，把环境接口重构成可交互、可验证、可回滚的结构化世界，并让用户的采纳与修正形成数据闭环，那你才是在提前押注终局。

所以真正的问题不是“harness 会不会死”，而是：

当 API 吞噬机制之后，你剩下的是策略能力，还是空壳？当你谈环境工程时，你掌控的是环境，还是 PPT？