← 随机比特 / 所有内容

Anthropic 发布 Claude Opus 4.7,标价没变但实际 token 消耗暴涨,开发者账单飙升——"没涨价"的隐形涨价。

2026-04-20 · 随机比特

没涨价但花更多钱,AI 公司学会了运营商的套路

上周五,一个用 Claude Code 写项目的开发者照常打开了 Anthropic 的用量面板。他没换任务,没改 prompt,甚至连代码仓库都没动——唯一的变化是 Anthropic 在 4 月 16 日把他的模型从 Opus 4.6 自动升级到了 4.7。

账单比上周涨了将近 40%。

他第一反应是去翻价格表。输入 15 美元/百万 token,输出 75 美元/百万 token——和上个月一模一样。价格确实没变。那钱去哪了?

这不是个例。Hacker News 上一个帖子拿到了 594 分、559 条评论,标题直白得像控诉:开发者们发现 Opus 4.7 在相同任务下消耗的 token 数量明显高于 4.6。有人做了个匿名对比工具,把真实请求的 token 消耗可视化了出来——结论一目了然:同样的活,4.7 就是比 4.6 费 token。

社区的共识用一句话概括:价格表没变,真实成本涨了。

价格没变,成本变了

<figure><img src=“images/token-cost-compare.png” alt=“token-cost-compare”></figure>

先说清楚这件事的机制。

成本分析机构 Finout 把问题拆得很直白:Opus 4.7 换了新的 tokenizer。同一段文本,新 tokenizer 切出来的 token 数量和旧版不一样。这意味着即使你的 prompt 一个字没改,送进去的 token 数就已经变了。

但这只是第一层。

更关键的是推理行为的变化。独立开发者 Simon Willison 对比了 4.6 和 4.7 的系统 prompt,发现了一个明显的策略转向:4.7 被要求"主动调用工具"、“把任务做完”、“减少向用户追问”。

说人话就是:以前 Claude 遇到不确定的地方会问你一句"你是要 A 还是 B?",现在它倾向于两个都试一遍,然后把结果给你。

这当然提升了"完成度"——你确实不用来回对话了。但代价是什么?每次对话的 token 轨迹变长了。你以为省了一轮对话,实际上模型在后台多跑了好几轮。

这不是 bug,是产品策略

<figure><img src=“images/hidden-inflation-mechanism.png” alt=“hidden-inflation-mechanism”></figure>

把三条线串起来看:

  1. 新 tokenizer:同样的文本,token 数变了
  2. 新系统 prompt:模型更主动,轨迹更长
  3. 价格表不变:名义上没涨价

这三件事加在一起,效果等于:Anthropic 在不改价格表的情况下,让你的实际支出上升了。

我的判断是:这不是 bug,是有意为之的产品策略。

Anthropic 面临的困境很现实:跑分要赢(marketing 需要),成本要覆盖(商业需要),用户体验要好(留存需要)。三个目标不可能同时最优。他们选择了"让模型做更多事"来提升体验和跑分,代价是 token 消耗上升——但因为价格表没变,这个代价被转嫁给了用户,而且是悄悄转嫁的。

这套路熟悉吗?

运营商的"不限量套餐":月费没变,但达量降速。视频平台的"会员免广告":会员费没涨,但多了个"超前点播"。

真正让人不舒服的从来不是涨价本身,而是"你没涨价,但我还是花得更多"。

下次模型升级,你该看什么

这件事给所有 AI 付费用户一个教训:不要只看价格表,要看单位有效输出的成本。

具体怎么做?

第一,跑自己的任务对比。 模型升级后,别急着切。拿你最常用的 3-5 个真实任务,在新旧版本各跑一遍,对比 token 消耗和输出质量。如果 token 涨了 30% 但输出质量没有明显提升——那就是隐形涨价。

第二,关注"有效 token"而不是"总 token"。 模型多说了 500 个 token 的废话,对你没有价值。真正的指标是:完成你的任务需要多少 token?这个数字在版本间是涨还是降?

第三,不要默认追新。 大模型不是手机系统,不是每次升级都值得第一时间切换。等社区跑完对比数据再决定,通常只需要等 3-5 天。

大模型竞争正在进入下半场。上半场比的是"谁最强",下半场比的是"谁的单位有效输出最便宜"。Opus 4.7 的争议可能是这个转折点的标志——开发者开始用钱包投票了。

你用 Claude 吗?升级 4.7 之后,你的账单有变化吗?评论区聊聊。