当数据库的主要用户从人类变成 Agent

2026-03-27

过去二十年，我们讨论数据库时默认了一个前提：数据库的主要用户是人类。所以我们发明了 DBA、容量规划、慢 SQL 优化、实例规格、固定的运维窗口、按月付费的最小实例——这些东西都围绕“人类如何使用数据库”建立。

但当主要用户变成 Agent，一切都要翻新。

不是因为 Agent 更聪明。恰恰相反：它更像一种高频、短命、不可预测、会乱写 SQL、但又极度依赖确定性系统来完成任务的“新物种”。

数据库不再是仓库，而是工作台；不再是后端组件，而是 Agent 的操作底座。

1）一个数字：90% 的数据库不是人建的

最能让人警醒的信号不是技术趋势，而是统计口径：在一些面向开发者的云数据库场景里，新创建的数据库集群中，绝大多数已经不是人类点出来的，而是 Agent 自动创建、自动建表、自动写 SQL、自动跑实验、自动销毁。

这意味着：数据库开始像“可编程资源”一样被调用，像临时容器一样被批量拉起与回收。

当调用者从人变成程序，数据库会遭遇四次“假设崩塌”。

2）Agent 工作负载的四个特征：为什么传统数据库会被打穿

2.1 海量短命实例：从“一个产品一个库”变成“一个会话一个库”

传统世界里，库是长期资产。 Agent 世界里，库更像一次性工作空间：一个会话一个隔离环境，用完即焚。

结果是：实例数会爆炸，而且大多数都是一次性。如果你仍沿用“最小实例按月付费”的定价习惯，账单会直接把产品逻辑打死——不是贵不贵的问题，而是商业模型根本算不过来。

2.2 数据库成了 Agent 的工作台，不是存储仓库

Agent 做事的流程更像“抓取—结构化—SQL 分析—产出结果”，而不是“把数据存进去就完事”。

决定性差异在于：

放在 Markdown/纯文本里，后续分析只能靠模型“泛读”，质量交给幻觉。
落到数据库里，SQL 是确定性的，过程可审计、可复现，任务才工程化。

进一步说：当 schema 也由 AI 动态生成，“一个会话一个库/一个隔离单元”就不仅是资源隔离，更是爆炸半径控制：写错了最多毁掉自己这一回合。

2.3 上下文即数据，而且越来越长

复杂 Agent 为了可恢复、可审计、跨会话检索，必须把关键上下文持久化。而一旦你需要结构化查询、跨任务关联，数据库就会重新成为更优的载体。

问题是：上下文本身开始长得离谱——不仅是文本，还有音频、多模态。这把很多传统 OLTP 的“舒适区”推到了边界之外。

2.4 流量不可预测，但成本必须可控

人类按作息用系统；Agent 不按。它可以凌晨三点突然冲一波，也可以沉默几小时。

如果你为这种间歇性活跃长期维持整套计算资源，服务方和客户都会双输。所以“弹性”不再是锦上添花，而是数据库能否服务 Agent 的前置条件。

3）数据库不再是性能优化项，而是“能不能上线”的前提

在 Agent 密度足够高的产品里，数据库方案不是“将来优化”，而是“今天能不能开放”的闸门。

因为你会遇到一个残酷事实：Demo 可以跑，但一规模化就崩盘——不是技术跑不动，而是成本模型跑不动。

要解决这个问题，思路通常是三层叠加：

1）一个物理集群承载海量逻辑租户：共享基础设施 + 逻辑隔离，而不是一会话一实例。

2）存算分离 + 更极致弹性：让计算尽可能接近按需唤起，甚至允许接近“闲时归零”。

3）承认合理 trade-off：冷启动带来百毫秒级延迟，但在 Agent 场景里往往可接受——因为模型推理本身就是秒级。

但别忘了第四件事：资源控制。海量租户共池，最怕的不是平均负载，而是某个 Agent 把资源打爆拖垮整池。没有清晰的边界，多租就会变成事故放大器。

4）“对象存储 + 元数据库 + 缓存 + 补偿一致性”这条链路，会在 Agent 时代变得不值得

在长上下文场景里，传统做法是：大对象进对象存储，数据库存元数据与索引。

这在纸面上合理，在工程上常常变成一条脆弱链路：一致性要自己补，缓存要自己建，穿透要自己扛，长尾延迟要自己解释。

于是你会得到一套能跑但难维护的系统：组件越来越多，故障面越来越大，迭代速度越来越慢。

Agent 时代有一个更务实的偏好：简化架构，比优化架构更有价值。

如果数据库本身能承载更大的字段、更长的上下文，并且仍保留事务与 SQL 语义，那么把一部分“长上下文”收回数据库，反而是更健康的演进。

这里的关键不只是“能存大”，而是“存大同时不丢掉确定性与查询能力”。否则你省掉的组件，最终会以更复杂的语义补偿回到你身上。

5）一个被低估的老能力：在线 DDL，会在 AI 应用里重新变贵

AI 原生应用的 schema 稳定性远不如传统业务：结构变更频率更高，发布节奏更快。

如果每次改表都要锁表、等停机窗口，研发会被迫“攒改动赶窗口”，质量反而更差。在线 DDL 这种传统数据库能力，会在 AI 时代重新变成硬通货——它直接决定迭代速度的上限。

6）更深的变化：数据库正在走向“记忆层”的底座

当 Agent 开始跨会话、跨任务、跨设备连续工作，问题就不再是“把数据存下来”，而是：如何把过去的信息，在合适的时候、以合适的形式，重新带回上下文。

数据库能保存偏好、历史决策、项目资料。但 Agent 还缺一层更“面向工作流”的能力：沉淀、索引、检索、筛选、注入——让恢复状态变得低成本、确定性、可治理。

这不是“数据库不够用了所以加一层”，更像是：把数据库的能力，以更符合 Agent 方式的 API 与机制暴露出来。

结语：当主要用户变成 Agent，数据库要从“系统组件”变成“可编程基底”

Agent 会创建、查询、分支、合并、销毁数据库资源，像使用一个可编程的基底。数据库不再是被动存储，而是工作台、隔离单元、确定性执行器、成本模型的一部分、以及未来记忆层的地基。

所以这不是一次“兼容新负载”的升级，而是一轮范式转换：

不要试图用旧架构去兼容新用户。要从 Agent 的工作方式出发，重新思考数据库应该是什么样子。