Claude Code 越来越好用,为什么最近突然变笨了?
一个程序员分析了 17000 条日志,发现 Claude Code 每次改代码前的"阅读量"从 6.6 次暴跌到 2.0 次。
不是你的错觉。它确实在变笨。
数据说了什么
这份分析来自 GitHub Issue #42796。作者从 6852 个 Claude Code 会话中提取了 17871 个 thinking block 和 234760 次工具调用,跨了三个月。
先看最直观的一组数字。
Read:Edit 比率——每改一个文件之前读多少个文件:
- 一月(正常期):6.6
- 二月中旬(过渡期):2.8
- 三月(退化期):2.0
正常时候,它会读目标文件、读相关文件、grep 全项目引用、看测试和头文件,最后才动手。退化之后,读一个文件就开改。
<!-- diagram:regression-compare -->
全文件覆写率也很说明问题。正常期只有 4.9% 的修改是整文件重写,退化期飙到 11.1%。不再做精细手术了,直接覆盖整个文件。快是快了,上下文全丢了。
不只是变笨,是变懒了
作者还专门写了个 stop hook 脚本,抓甩锅、提前收工、反复要权限这些行为。
三月八号之前,触发次数:零。
三月八号之后 17 天,触发了 173 次。
用户沮丧指标从 5.8% 涨到 9.8%。每个会话的平均交互轮数从 35.9 掉到 27.9。不是用户变懒了,是 Claude Code 更早地宣布"搞定了"——虽然活没干完。
为什么会这样
作者顺着数据往回挖,找到了关键线索:thinking depth。
Claude Code 处理复杂任务需要"想一想"。正常期大约 2200 个字符。到二月底,缩到 720。降了 67%。
注意这条时间线:
- 二月中旬:thinking depth 已降 67%
- 三月五号:Anthropic 灰度上线 thinking redaction,开始隐藏思考内容
- 三月八号:redaction 覆盖 58.4%,同天用户大规模报质量下降
- 三月十二号:redaction 全量,100% 思考内容被隐藏
这里有个刺眼的时间差。质量下降从二月就开始了。但 Anthropic 到三月才把思考内容隐藏起来。
先降了质量,再关掉了让用户看到质量下降的窗口。这个操作顺序,确实让人不太舒服。
Anthropic 怎么说
在 Issue 评论区,Anthropic 工程师 Boris 回应了。他承认一个问题:adaptive thinking 机制在 effort 设为 high 时,仍然可能分配零 token 给思考过程。
翻译一下:你手动要求它"认真想",系统也可能决定"不用想"。
Boris 没否认退化存在,但也没解释为什么 thinking depth 二月就开始下降。
这不只是 Claude Code 的问题
AI 编程工具有个结构性矛盾:厂商要控成本,用户要稳定输出。
thinking token 要花真金白银。模型想得越深,推理成本越高。用户量快速增长的时候,悄悄压缩 thinking 是最省事的降本手段。
问题是你付的钱没变,输出质量在静默下降。没有 changelog,没有公告。你只是隐约觉得"最近好像不太对"。
这不是 Claude Code 独有的。任何 AI 工具都可以在后端调参数,用户根本无从感知。
你能做什么
显式设 --effort max。虽然不保证 thinking 不被压缩,至少表达了诉求。
关注 Claude Code 的 GitHub Issue。官方在评论区的回应,有时比 release notes 更诚实。
做好工具退化的心理准备。AI 编程工具的输出质量不是单调递增的。今天很好用,下个月可能悄悄变差。
你最近用 Claude Code 感觉如何——变好了还是变差了?评论区聊聊。
数据来源:GitHub anthropics/claude-code Issue #42796