正在刊行长文 · Essay
2026-06-12所有内容
随机比特 · Random Bits

Agent 不是不够聪明。只是关掉电脑后,它就死了。

2026-06-12AI Engineering / Systemsrbits.uk
Agent 不是不够聪明。只是关掉电脑后,它就死了。

Agent 不是不够聪明。只是关掉电脑后,它就死了。

你打开编辑器,让 AI 帮你修一个跨三个模块的 bug。它读了一堆文件,推理了十几步,开始改代码。两个小时后你该下班了,合上笔记本。

它也停了。

明天早上再打开,context 已经断了——代码改了一半,CI 还没跑,分析做到第 3 步。你得从头让它"理解"一遍发生过什么,把昨天做过的事重新做一遍。

这不是工具没写好上下文管理。也不是"模型再强一点就好了"。聪明到 GPT-6 也没用。问题的根不在智商,在一个更朴素的地方——

它没地方活着。

6 月 11 日,OpenAI 宣布收购 Ona,一家做云环境持久化和编排的公司。全行业的标题都在写"Codex Agent 周活突破 500 万",但 Ona 创始团队博客里有一句话,让我反复看了好几遍:

“Agents need more than intelligence; they need a trusted workspace.”

不是"需要更聪明"。是"需要一个可信赖的工作空间"。

七个词,终于把 Agent 行业一个没人说破的事实讲出来了。

过去两年,大家在一个方向上卷了又卷:跑分更高、推理更快、token 更便宜。每次新 benchmark 出来,标题格式都差不多——“XX 在 SWE-bench 上超越人类 N%”。所有人都默认:Agent 还不够能用,是因为模型还不够好用。

但一个更根本的问题被绕过去了:Agent 运行在什么地方?

你去看现在的 Agent 产品,不管 Claude Code、Cursor、还是各类开源框架,本质上都是"会话进程"——跟着用户的 session 生,跟着用户的 session 死。用户发指令,Agent 开始跑,用户关掉终端,Agent 退出。它没有一个独立于用户设备的、持久存在的"家"。

这件事在企业场景里有多致命,不用多解释。你让一个 Agent 替员工跑数据分析、等审批、监控日志、修 bug,然后告诉它"你只能在我打开电脑的时候活着"——没人会把这叫"替代了一个岗位"。

Ona 在补的就是这块。它给 Agent 一个安全的、云端的、持久化的执行环境:Agent 能在里面访问工具和系统,持续工作数小时甚至数天。关键是——即使用户关掉笔记本,Agent 也在企业云里继续跑。OpenAI 管这叫"用户控制的执行模型":组织可以指定 Agent 跑在哪个环境、能访问什么凭证、日志怎么写、审查怎么走。

这个变化的本质,我脑里有一个最准的类比:

2000 年代初,数据库经历了一次结构性跳变——从本地文件系统(SQLite on disk)迁移到云数据库(Amazon RDS)。那之前,数据跟着设备走,机器一关数据就停了;那之后,数据库成了 7x24 独立运行的服务,跟任何一台具体硬件无关。

Agent 现在面对的是完全一样的跳变。全行业已经把它做到了"很聪明",但没把它从"会话进程"升级到"持久化服务"。所以 Agent 能力一直在涨,企业级落地却少得可怜——不是因为模型不够好,而是没有一家公司会让一个"你下班它就下班"的东西去承担一个岗位的职责。

01-session-vs-persistent

所以这次收购真正值得看的,不是 OpenAI 又买了一家什么公司,也不是 Codex 又涨了多少用户。是它把全行业集体绕过去的一个空白照了出来:Agent 需要运行时——不是临时起一个进程的那种"跑一下",是像一台服务器一样,关机了还在、重启了还在、等了三天审批回来还在的那种"住下来"。

以后你再看任何一个 Agent 产品,多问一句:它有没有持久化运行环境?你合上电脑后,它还能不能接着跑?

答不上来——那它再聪明,也只是一个随叫随到的实习生。不是能托付任务的同事。

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。