Claude Code 越来越好用，为什么最近突然变笨了？

一个程序员分析了 17000 条日志，发现 Claude Code 每次改代码前的"阅读量"从 6.6 次暴跌到 2.0 次。

不是你的错觉。它确实在变笨。

数据说了什么

这份分析来自 GitHub Issue #42796。作者从 6852 个 Claude Code 会话中提取了 17871 个 thinking block 和 234760 次工具调用，跨了三个月。

先看最直观的一组数字。

Read:Edit 比率——每改一个文件之前读多少个文件：

正常时候，它会读目标文件、读相关文件、grep 全项目引用、看测试和头文件，最后才动手。退化之后，读一个文件就开改。

全文件覆写率也很说明问题。正常期只有 4.9% 的修改是整文件重写，退化期飙到 11.1%。不再做精细手术了，直接覆盖整个文件。快是快了，上下文全丢了。

作者还专门写了个 stop hook 脚本，抓甩锅、提前收工、反复要权限这些行为。

三月八号之前，触发次数：零。

三月八号之后 17 天，触发了 173 次。

用户沮丧指标从 5.8% 涨到 9.8%。每个会话的平均交互轮数从 35.9 掉到 27.9。不是用户变懒了，是 Claude Code 更早地宣布"搞定了"——虽然活没干完。

作者顺着数据往回挖，找到了关键线索：thinking depth。

Claude Code 处理复杂任务需要"想一想"。正常期大约 2200 个字符。到二月底，缩到 720。降了 67%。

注意这条时间线：

这里有个刺眼的时间差。质量下降从二月就开始了。但 Anthropic 到三月才把思考内容隐藏起来。

先降了质量，再关掉了让用户看到质量下降的窗口。这个操作顺序，确实让人不太舒服。

在 Issue 评论区，Anthropic 工程师 Boris 回应了。他承认一个问题：adaptive thinking 机制在 effort 设为 high 时，仍然可能分配零 token 给思考过程。

翻译一下：你手动要求它"认真想"，系统也可能决定"不用想"。

Boris 没否认退化存在，但也没解释为什么 thinking depth 二月就开始下降。

AI 编程工具有个结构性矛盾：厂商要控成本，用户要稳定输出。

thinking token 要花真金白银。模型想得越深，推理成本越高。用户量快速增长的时候，悄悄压缩 thinking 是最省事的降本手段。

问题是你付的钱没变，输出质量在静默下降。没有 changelog，没有公告。你只是隐约觉得"最近好像不太对"。

这不是 Claude Code 独有的。任何 AI 工具都可以在后端调参数，用户根本无从感知。

显式设 --effort max。虽然不保证 thinking 不被压缩，至少表达了诉求。

关注 Claude Code 的 GitHub Issue。官方在评论区的回应，有时比 release notes 更诚实。

做好工具退化的心理准备。AI 编程工具的输出质量不是单调递增的。今天很好用，下个月可能悄悄变差。

你最近用 Claude Code 感觉如何——变好了还是变差了？评论区聊聊。

数据来源：GitHub anthropics/claude-code Issue #42796