我们从 AI 的抽象层变化聊起，慢慢聊到 Agent 互联网、活的服务网络、小商贩如何用自然语言生成自己的服务，再聊到为什么 Agent 时代需要新的 runtime、workspace、tool set 和 serverless database

2026-05-22

这期访谈最有意思的地方，不是又出现了一个 Agent 产品。

而是讨论从一开始就没有停在产品层。

它从 AI 的抽象层变化聊起，慢慢聊到 Agent 互联网、活的服务网络、小商贩如何用自然语言生成自己的服务，再聊到为什么 Agent 时代需要新的 runtime、workspace、tool set 和 serverless database。

这条线很重要。

因为它把问题从“下一个 AI App 是什么”，推到了另一个层面：

当 Agent 成为新的使用者，互联网和基础设施要怎么重做？

抽象层又往上走了一层

参考文章里，东旭把这一轮 AI 变化和“编程语言的发明”放在同一个尺度上比较。

这个类比很大。

但它抓住了重点。

编程语言出现之前，人要让计算机做事，需要非常靠近机器本身。

编程语言出现之后，人可以用代码表达意图。

硬件被往下压了一层。

代码变成新的表达界面。

现在，Agent 可能把抽象层再往上推一层。

过去我们要先把代码想清楚。

现在我们开始用自然语言描述目标，让 Agent 去拆解、调用工具、写代码、执行流程。

代码不会消失。

但代码会变成更底层的东西。

就像编程语言出现之后，硬件没有消失，只是变成了更底层的东西。

这不是“多了一个聊天框”。

这是人和计算机协作方式的变化。

如果协作方式变了，下面的基础设施就不可能完全不变。

Agent 互联网不是网页互联网

今天的互联网，大部分服务是静态的。

网页在那里。

API 在那里。

数据库在那里。

应用逻辑在那里。

你访问它，它按照预先写好的方式返回结果。

这个网络可以很复杂，但多数节点不是“活”的。

Agent 互联网不一样。

它更像一个由活服务组成的网络。

一个 Agent 在线，它就能接电话、回答问题、调用工具、维护记忆、和别的 Agent 协商。

它不在线，就是真的不在线。

这听起来像一个小差别，其实是网络形态的变化。

网页互联网的基本单元是页面、账号、接口和应用。

Agent 互联网的基本单元，可能是一个个可对话、可执行、可组合的服务主体。

每个主体都有上下文。

都有工具集。

都有权限边界。

都有状态。

也都可能随时被创建、暂停、唤醒和销毁。

这就是“活的服务网络”。

小商贩也可以长出一个服务

这个变化最有想象力的地方，不在大公司。

而在小商贩、小店、个人创作者、独立服务者。

过去，一个小店想数字化，要做很多事。

做网站。

上地图。

维护点评。

发公众号。

写商品介绍。

接客服。

改营业时间。

很多信息最后都过时了。

因为维护成本太高。

但如果小店可以有一个自己的 Agent，事情就不一样了。

老板只需要用自然语言说：

我是谁。

我卖什么。

今天有什么新东西。

我的风格是什么。

哪些问题可以回答。

哪些事情不能承诺。

Agent 就可以把这些内容变成一个数字化服务。

消费者的 Agent 也可以去问它：今天有什么新鲜的？有没有适合小朋友的？现在排队多久？能不能预留？

这不是传统网页能很好完成的事情。

因为网页要求店主先结构化自己。

Agent 则允许店主先用自然语言表达自己。

这就是抽象层变化带来的普惠性。

不是每个小商贩都要变成开发者。

而是每个小商贩都可以用自然语言生成自己的服务。

Demo 之后，真正缺的是基础设施

但这里很快会遇到硬问题。

一个普通人怎么维护一个 24 小时在线的 Agent？

这个 Agent 的记忆放在哪里？

工具权限怎么管？

谁能调用它？

它怎么发现附近其他 Agent？

怎么知道对方是真的在线？

恶意用户能不能诱导它泄露隐私？

它能不能代表店主下承诺？

出了错算谁的？

这些问题听起来没有 demo 酷。

但它们决定 Agent 网络能不能成为基础设施。

今天很多 Agent demo 能跑，是因为背后站着开发者。

开发者知道怎么配环境、怎么调模型、怎么接 API、怎么修错误、怎么关权限。

普通人没有这些能力，也不应该被要求有这些能力。

所以 Agent 时代需要一整套新的底座。

不是只要一个模型。

而是 runtime、workspace、tool set、memory、permission、identity、billing、database、deployment 全部要重新产品化。

为什么需要新的 runtime

Agent 不是一次请求。

它更像一个会持续运行的工作主体。

它需要被唤醒。

需要执行任务。

需要等待外部事件。

需要定时跑 cron job。

需要调用工具。

需要在失败后恢复。

需要在不同模型和工具之间切换。

这就需要 runtime。

传统应用的 runtime，服务的是程序。

Agent 时代的 runtime，要服务的是任务流和意图流。

它要知道一个 Agent 当前处于什么状态，拿到了什么上下文，能使用哪些工具，哪些动作需要人类确认，哪些动作可以自动执行。

这不是简单把 API 包一层。

这是把“执行环境”从代码进程，升级成 Agent 进程。

为什么需要 workspace

Agent 还需要 workspace。

因为 Agent 做事不是只回答一句话。

它会产生文件、草稿、计划、日志、数据库、临时状态和长期记忆。

一个人如果有多个 Agent，每个 Agent 都需要自己的工作空间。

一个小店如果有客服 Agent、营销 Agent、库存 Agent，也需要各自边界清楚的工作空间。

workspace 不是文件夹那么简单。

它是 Agent 的上下文容器。

里面有数据。

有权限。

有历史。

有任务状态。

也有可以被其他 Agent 发现和协作的接口。

没有 workspace，Agent 就只能像一次性聊天工具。

有了 workspace，Agent 才能变成持续工作的服务主体。

为什么需要 tool set

Agent 的能力边界，不应该由模型自己乱猜。

它应该由 tool set 定义。

一个小店 Agent 能查库存、改营业时间、回答菜单问题。

但它不能随便退款、改价格、承诺无法履约的服务。

一个个人助理 Agent 能读日历、写邮件草稿、整理资料。

但它不能未经确认就转账、辞职、删除文件。

tool set 是 Agent 的手脚。

也是 Agent 的护栏。

未来每个 Agent 都需要一个受控工具集：哪些能用，哪些不能用，哪些只读，哪些需要确认，哪些只能在特定场景使用。

这件事做不好，Agent 互联网就会变成安全事故互联网。

这件事做好了，Agent 才能从玩具变成服务。

为什么需要 serverless database

参考文章后半段提到 DB9，核心问题非常具体：Agent 时代，数据库的使用者可能变了。

过去数据库主要服务开发者。

开发者规划应用，创建实例，设计表，连接服务，长期运行。

但 Agent 的使用方式可能完全不同。

一个 Agent 可能临时需要一个数据库。

用 5 分钟。

写一点状态。

完成任务以后销毁。

下次又创建一个新的。

人类开发者按月、按项目管理数据库。

Agent 可能按秒、按任务、按会话使用数据库。

这就要求数据库更轻、更快、更便宜。

招之即来。

挥之即去。

不用不付费。

每次对话、每次请求、每条数据都可以成为计量单位。

这就是 serverless database 在 Agent 时代的价值。

如果每个用户都可以有一个虚拟 Agent，每个 Agent 都可以有自己的 workspace 和临时数据库，那么底层成本必须低到近乎无感。

否则这个网络长不起来。

Agent 网络需要自己的发现机制

还有一个容易被低估的问题：发现。

今天的互联网，发现机制主要是搜索、链接、推荐、社交图谱和应用商店。

Agent 互联网需要新的发现机制。

我的 Agent 怎么知道附近有哪些商贩 Agent？

怎么知道哪个 Agent 现在在线？

怎么判断它可信？

怎么知道它能提供什么服务？

怎么和它协商协议、价格、时间和边界？

这有点像早期互联网的 DNS、搜索引擎和黄页混在一起。

但对象不是网页。

对象是活的服务主体。

所以参考文章里“电话号码本”的比喻很准确。

未来可能不是我去搜索网页，而是我的 Agent 去拨打另一个 Agent。

能接通，就开始协作。

不能接通，就找下一个。

to Agent 还需要一个 ChatGPT moment

为什么这一切还没有爆发？

不是因为方向不成立。

而是体验还没有到拐点。

技术圈已经默认很多事情会发生，但普通用户还没有感受到 10 倍、100 倍的体验提升。

ChatGPT 的爆发，不是因为语言模型那天才被发明。

而是模型能力、交互方式、可访问性和用户时机同时到了。

Claude Code 让很多开发者突然感到“这东西真的能干活”，也是类似原因。

Agent 互联网也需要这样的时刻。

它需要足够多的活服务节点。

足够低的部署成本。

足够安全的工具边界。

足够自然的发现机制。

还需要普通人第一次意识到：我不用学技术，也能拥有一个在线服务。

那一刻，Agent 才会从工具变成网络。

越 AI native，越要重新理解 human native

参考文章里还有一个很有意思的侧面：工作越 AI native，生活反而越 human native。

这个观察很真实。

当软件构建速度变得极快，想法到原型、原型到反馈的周期被压缩，效率会提高，但人的体验也会被压缩。

失败更快。

反馈更快。

兴奋也更短。

所以人会重新寻找慢的东西：音乐、木工、播客、面对面讲述、身体劳动、真实关系。

AI 让一个人能完成更完整的事情，这有反异化的一面。

但如果一切都变成即时生成、即时反馈、即时淘汰，人也会重新渴望那些不能被瞬间生成的东西。

这提醒我们：Agent 互联网不是为了让人消失。

它更应该让人从重复维护、低效数字化和工具摩擦中解放出来，回到更有意义的创造和关系里。

不要只预测未来，先实现未来

这期访谈最后的落点很创业。

不要只是预测未来。

先实现未来。

这句话适合 Agent 时代。

因为 Agent 互联网不会靠概念长出来。

它要靠一个个 runtime、workspace、tool set、serverless database、发现机制、安全边界、真实场景长出来。

它也不会一开始就完整。

它会先从开发者工具开始。

从个人 Agent 开始。

从小店服务开始。

从某个垂直领域的活服务网络开始。

然后慢慢把现有互联网之上的那一层新网络长出来。

这也是我觉得 DB9 这类基础设施值得关注的原因。

它讨论的不是“又一个数据库”。

而是当使用者从人类开发者变成 Agent，数据库、运行环境、工具集和工作空间都要怎么变化。

如果这个判断成立，未来的互联网不会只是更多网页、更多 App、更多 API。

它会多出一层活的服务网络。

而这层网络的第一批用户，可能不是人。

是 Agent。

参考

微信公众号后互联网：《从 PingCAP 到 DB9：AI Agent 会长出一层新的互联网》，2026-05-21。https://mp.weixin.qq.com/s/Y1QNH53LHr53-17_bTqEfw