你大概有过这样一个深夜。
你让 AI 改完那个折腾你三天的 bug,它很快回了你一段话:「已修复,我把空指针那里加了判空,并补充了边界处理。」你扫了一眼 diff,逻辑看着对;你跑了一下,没报错;CI 一路绿灯过了。你松了口气,合并,关机,睡觉。
然后第二天上午,那个你以为已经死掉的 bug,换了个姿势从生产环境爬了出来,带着一条用户投诉。
你的第一反应,几乎是条件反射:这模型是不是又降智了?
大家忙着找的,全是错的锅
出了这种事,工程师群里永远有现成的解释,而且每一条都听起来很有道理。
有人说是模型版本悄悄换了,「上周还好好的」;有人说是上下文太长被截断了,「它根本没看到下面那段」;有人说是 prompt 没写清楚,「你得把约束写得更死」;还有人甩出那句万能的——「AI 嘛,就是不靠谱,关键代码还得人来。」
这些话都不算错。但它们有一个共同的、很舒服的特点:锅都在 AI 身上,跟你没关系。 你只是个受害者,模型才是那个偷懒的乙方。
可如果你愿意往下再想一层,会撞见一个不太舒服的真相:
那天晚上让你放心去睡的,根本不是「AI 修好了 bug」这件事,而是那一片绿灯。CI 绿了、没报错、diff 看着对——是这三个信号哄你睡着的。而这三个信号,没有一个真正验证过「那个 bug 死了」。
这不是 AI 时代的新问题。运维圈早有一篇被反复传阅的文章,标题就叫《200 OK doesn’t mean everything is OK》:你的监控对着首页发一个请求,拿到 HTTP 200,绿灯,告警静默——而与此同时,你的结账按钮已经渲染成一个空 div,第三方支付脚本挂了,用户正在静悄悄地流失。监控说一切正常,因为它问的问题太廉价:「你还活着吗?」服务器回了「活着」。它从没问过「你还能干活吗?」
AI 把这件事,放大了一百倍。
AI 真正偷走的,不是你的代码,是你「验证」的那一下
过去你写完代码,会有一个几乎是肌肉记忆的动作:盯着它,问自己一句「我凭什么相信这玩意儿是对的?」然后去构造一个能戳穿它的场景。这个动作很烦,但它是你判断力的核心肌肉。
AI 来了之后,这块肌肉是第一个萎缩的。
因为 AI 太擅长生产「看起来完成了」的信号了。它会用完整的句子告诉你「已修复」,会主动补一段「我还顺手处理了边界情况」,会让 diff 读起来逻辑自洽、注释工整。这些都是完成的样子,不是完成本身。而人脑有个致命的偷懒倾向:看到足够多「完成的样子」,就自动把验证那一步省了。
于是死亡螺旋就这么转起来了:

注意这个环里最隐蔽的一点:每转一圈,出问题的不是 AI,是你。 模型的能力一直在那,波动也就那么大;真正在持续下滑的,是你把「返回了结果」当成「完成了任务」的那个判断阈值。绿灯越多,你越不验证;越不验证,绿灯就越像真相。
我后来给自己刻了一句照妖镜式的话,贴在心里:
如果我说不清「我怎么知道它真的成了」,那它大概率就是没成,只是它成功地让我以为成了。
一个今晚就能做的进攻性动作:先写「验收断言」,再让 AI 开工
道理讲到这没用,得给你一个能当场做的、反着来的动作。
下次你准备把一个任务丢给 AI——改 bug、写函数、跑一段重构——在敲下需求之前,先在一行字里写清楚:「我怎么知道它真的成了?」
注意,这一行不能是「跑起来不报错」「CI 绿了」「看着对」——这些全是系统替你给的廉价安慰,是 AI 能轻松伪造的「完成的样子」。它必须是一个AI 没法自己满足、只能靠外部事实兑现的信号。比如:
- 不是「修好了空指针」,而是「用那条会触发崩溃的输入再跑一遍,异常不再出现,且原有用例全绿」;
- 不是「接口能用了」,而是「真实走一遍加购→结账的完整路径,最后一屏出现订单号」(这正是 200 OK 那篇文章的解药:别 ping 首页,跑真实关键路径);
- 不是「重构完了」,而是「重构前后,这组黄金用例的输出逐字节一致」。
写不出这一行,说明你自己都还没想清楚这个任务「成」的标准是什么——那就先别让 AI 开工,因为你连它交活时该拿什么去验都没有,只能被它的措辞牵着走。
这件事最妙的地方在于,它把顺序掉了个个儿:不是 AI 先干、你事后挑刺(那时你已经被「完成的样子」催眠了),而是你先立下那道它伪造不了的闸,再放它进来。验收标准先于产出,判断力就重新回到了你手里。
写在最后
我们这一代工程师,正在经历一件很微妙的事:工具强到可以替我们写代码、替我们解释、替我们点亮一整片绿灯。它唯一替不了的,是替我们相信——相信这件事到底成没成,得有一个人,亲手把那盏灯按下去验过。
绿灯从来不是真相,它只是系统能给你的、最廉价的一句「别担心」。真正值钱的判断力,恰恰是在所有灯都绿了的那一刻,还愿意多问一句的那个人。
愿你做那个不被一片绿灯哄睡着的人。
写这篇的人是谁 · 我是「随机比特」,十年大厂工程师,在公众号写 AI 编程工程化的深度长文。如果这篇说中了你,你大概率也会想要那套「在一片绿灯里还能拎得清」的判断力——我把它系统化进了小报童专栏**《AI 编程工程判断力》**:从「怎么验」「怎么不被工具牵着走」到「把判断力重新长回自己身上」。
专栏开篇免费读,读完觉得值再 ¥49 买断全部。入口在我的网站 rbits.uk,或直接 xiaobot.net/p/rbits。
