← 随机比特 / 所有内容

Claude Code 最近"变笨了"——一位用户用 17000 条日志量化了退化的程度。

2026-04-07 · 随机比特

Claude Code 越来越好用,为什么最近突然变笨了?

一个程序员分析了 17000 条日志,发现 Claude Code 每次改代码前的"阅读量"从 6.6 次暴跌到 2.0 次。

不是你的错觉。它确实在变笨。

数据说了什么

这份分析来自 GitHub Issue #42796。作者从 6852 个 Claude Code 会话中提取了 17871 个 thinking block 和 234760 次工具调用,跨了三个月。

先看最直观的一组数字。

Read:Edit 比率——每改一个文件之前读多少个文件:

正常时候,它会读目标文件、读相关文件、grep 全项目引用、看测试和头文件,最后才动手。退化之后,读一个文件就开改。

<!-- diagram:regression-compare -->

全文件覆写率也很说明问题。正常期只有 4.9% 的修改是整文件重写,退化期飙到 11.1%。不再做精细手术了,直接覆盖整个文件。快是快了,上下文全丢了。

不只是变笨,是变懒了

作者还专门写了个 stop hook 脚本,抓甩锅、提前收工、反复要权限这些行为。

三月八号之前,触发次数:零。

三月八号之后 17 天,触发了 173 次

用户沮丧指标从 5.8% 涨到 9.8%。每个会话的平均交互轮数从 35.9 掉到 27.9。不是用户变懒了,是 Claude Code 更早地宣布"搞定了"——虽然活没干完。

为什么会这样

作者顺着数据往回挖,找到了关键线索:thinking depth

Claude Code 处理复杂任务需要"想一想"。正常期大约 2200 个字符。到二月底,缩到 720。降了 67%。

注意这条时间线:

这里有个刺眼的时间差。质量下降从二月就开始了。但 Anthropic 到三月才把思考内容隐藏起来。

先降了质量,再关掉了让用户看到质量下降的窗口。这个操作顺序,确实让人不太舒服。

Anthropic 怎么说

在 Issue 评论区,Anthropic 工程师 Boris 回应了。他承认一个问题:adaptive thinking 机制在 effort 设为 high 时,仍然可能分配零 token 给思考过程。

翻译一下:你手动要求它"认真想",系统也可能决定"不用想"。

Boris 没否认退化存在,但也没解释为什么 thinking depth 二月就开始下降。

这不只是 Claude Code 的问题

AI 编程工具有个结构性矛盾:厂商要控成本,用户要稳定输出。

thinking token 要花真金白银。模型想得越深,推理成本越高。用户量快速增长的时候,悄悄压缩 thinking 是最省事的降本手段。

问题是你付的钱没变,输出质量在静默下降。没有 changelog,没有公告。你只是隐约觉得"最近好像不太对"。

这不是 Claude Code 独有的。任何 AI 工具都可以在后端调参数,用户根本无从感知。

你能做什么

显式设 --effort max。虽然不保证 thinking 不被压缩,至少表达了诉求。

关注 Claude Code 的 GitHub Issue。官方在评论区的回应,有时比 release notes 更诚实。

做好工具退化的心理准备。AI 编程工具的输出质量不是单调递增的。今天很好用,下个月可能悄悄变差。

你最近用 Claude Code 感觉如何——变好了还是变差了?评论区聊聊。


数据来源:GitHub anthropics/claude-code Issue #42796