你下个月的 AI 账单可以砍 14 倍,但这不是它今天最该看的事
今天 DeepSeek 把 V4 砸出来了。
但比 384K 输出和 Flash 替 Haiku 更值得看的,是它选的这一天。
我昨晚十一点半还在算一笔账:上个月把一条数据清洗的批量任务从 Claude Haiku 切到 DeepSeek V3.x,月账单从 480 美金降到 112 美金——降了 4 倍多。我以为这种活已经做完了,今天起来翻了一眼 V4-Flash 的价目表,输出 0.28 美金 / 1M tokens。Haiku 的输出价是 4 美金 / 1M 量级。
不是便宜一点,是直接低一个数量级。
而我看着这个数字时心里冒出来的不是"卧槽真便宜",是另一句话:这家公司发布的从来不是模型,是发布会日历。
下面是我看到的 8 件事,散开摆,最后收一个判断。
<figure><img src=“images/01-timing-wars.png” alt=“01-timing-wars”></figure>
一、V4 凌晨上 HuggingFace,阿里云百炼半天上架。
这两个动作之间不到 12 小时。我做过模型供应链对接,知道半天上架阿里云这种动作不是"我们好巧也准备好了"——这是事先把 SKU、文档、定价、配额都报备好了,等一个发车信号。
我的判断:这种"国产基建跟手"的速度,本身就是 DeepSeek 的一张牌。它不是单兵作战,它是带着阿里云一起卡时机。
二、HN 上 V4 主帖 1736 分,今日断层第一。第二名是 GPT-5.5 上 API 的 1515 分。
注意这个排序。GPT-5.5 上 API 应该是 24 小时内最大的开发者新闻——结果被 V4 压了 200 多分。Reddit r/LocalLLaMA 当天 50 条主题里 8 条直接在聊 V4。
我看到的是:HN 这一天的头部叙事被 DeepSeek 抢走了。OpenAI 把 GPT-5.5 API 全部放出来这件事,本来够当三天的头条,今天被压到第二位还要谢一下排名算法。
三、Flash 直奔"取代 Haiku 工具调用准度"的市场缝隙。
Reddit 上有一句被反复转的原话——“Tested Deepseek v4 flash with some large code change evals. It absolutely kills with tool use accuracy.”
“absolutely kills” 在 r/LocalLLaMA 不是常用词。这个社区被 Claude 训出了挑剔——一般小模型工具调用准度的评价是"还行"、“勉强能用”、“在 Sonnet 之下两档”。这次直接是"杀疯了"。
我的判断:Flash 不是来打 Sonnet 的,是来抢 Haiku 现有客户群的。它瞄准的不是模型对决,是"按月烧 Haiku 跑批量任务"的那个具体场景。如果你团队里有这种批量活,下个月的 review 该开了。
四、同一个钟头,OpenAI 把 GPT-5.5 + GPT-5.5 Pro 全开 API。
24 小时之内,OpenAI 把面向 ChatGPT 的 GPT-5.5 转成 API,按理说应该是今天唯一的开发者头条。
我看到的是:DeepSeek 卡的就是这一刻——开发者群体注意力被 GPT-5.5 拉过去的那一瞬间,给你递一个"输出便宜 14 倍、上下文 1M、最大输出 384K"的替代品。注意力争夺战里,对手最累的时候,是你最该出现的时候。
五、同一个钟头,Google 公布最高 400 亿美金押 Anthropic。
TechCrunch 把这条新闻的发布时间敲在 PDT 2026-04-24 上午 11 点——换算到北京时间是 04-25 凌晨 2 点。V4 上 HuggingFace 也在那前后几个钟头内。
数字摊开看:
- 即时现金 100 亿美金,估值 3500 亿美金
- 后续 300 亿美金,绑业绩
- 5 GW TPU 算力,5 年期
5 GW 是什么概念?大约等于五座核反应堆的额定输出。这种规模的承诺一公布,本应吃掉今天 24 小时的头条。结果 DeepSeek 在同一个钟头把 V4 摆出来。
我看到的是:这是节奏战的精确刻度。Google 那边为 Anthropic 打了一笔"可以跑五个核电站"的弹药,DeepSeek 这边不打钱仗,打时间仗——把对方的弹药新闻从头条上挤掉一半。
六、《I Cancelled Claude》在 HN 627 分。
同一天,一个叫 Nicky Reinert 的德国开发者写了一篇博客,说自己取消了 Claude 订阅。文章里最戳的一句是——“看起来 Anthropic 招呼不过来这么多新客户,所以我把这份负担替它取消了——退订了我的账号。”
这句话登 HN 627 分不是因为它愤怒,是因为它冷静、工整、像在写一封感谢信。讽刺到极致就是这种克制的礼貌。
我看到的是:用户在退订、Anthropic 自己刚承认 Claude routing + context window + 工具调用三处 bug 实锤降智、Google 用 400 亿把它捞起来——这家公司今天三个口子同时在出血。DeepSeek 在另一个口子上递替换钥匙:Flash 价格表加上"absolutely kills with tool use accuracy",组合起来正好是 Haiku 用户的逃生通道。
<figure><img src=“images/02-flash-vs-haiku.png” alt=“02-flash-vs-haiku”></figure>
七、V4-Flash 和 V4-Pro 的价目表,我重新核了一遍:
- V4-Flash:cache miss 输入 0.14 / 1M,输出 0.28 / 1M,最大输出 384K,上下文 1M
- V4-Pro:cache miss 输入 1.74 / 1M,输出 3.48 / 1M,最大输出 384K,上下文 1M
我做了个简单算术:如果你团队有一条用 Haiku 跑代码批量改写的脚本,每天 5000 万输出 token,月成本 ≈ 4 × 50 × 30 = 6000 美金。换 V4-Flash:0.28 × 50 × 30 = 420 美金。
省下来的 5580 美金够你雇半个工程师做一周的迁移和 eval。
这个账,每个还在烧 Haiku 的团队都会自己算。
八、不是第一次了。
我翻了一下过去半年,DeepSeek 至少卡了三次时机:
- V3.x:撞在 Anthropic Sonnet 大版本前一周
- R1 蒸馏:撞在 OpenAI o3-mini 当周
- V4:今天,撞在 GPT-5.5 上 API + Google→Anthropic 400 亿同一钟头
三次的概率叠在一起,不能用"运气"解释。这家公司有人在专门看竞争对手的发布日历。
<figure><img src=“images/03-deepseek-timing-history.png” alt=“03-deepseek-timing-history”></figure>
收一句:
DeepSeek 现在最值钱的资产不是模型团队,是发布时机决策小组。
这是大多数中文媒体今天没看到的角度。所有人都在拆 V4 的 model card,36kr 那篇所谓"5 道主观题"其实在讲国产 AI 行业的战略命题,里面有一句话特别戳——“非盈利的黄金时代结束了。”
但我想加一句:节奏战的黄金时代刚开始。
模型现在已经卷到没差了——Flash、Haiku、Gemini Nano、Qwen 27B,技术差距在收敛。下半场比的不是谁的模型更强,是谁能在对手出血的瞬间把替代品摆到桌上。DeepSeek 已经把这门生意打磨到第三第四次了。它不是开源模型供应商,它是"在巨头新闻出血时往伤口上撒盐"的节奏战玩家。模型,只是它在节奏战里顺手用的弹药。
那么留一个问题:
下一次国产开源会撞在谁的哪个新闻上?
如果你能从 OpenAI、Google、Anthropic、Meta 接下来三个月的产品 roadmap 里挑出一个时间窗,你就比 99% 的中文 AI 媒体早一步看到下一篇 1736 分的 HN 主帖。
参考来源:HN “DeepSeek v4” 主帖 1736 分(今日断层第一)/HN “GPT-5.5” 主帖 1515 分/HN “I Cancelled Claude” 627 分(原博客 nickyreinert.de)/DeepSeek 官方 API 文档与价目表(api-docs.deepseek.com)/36kr《DeepSeek V4 终于发布,但它留下的5道主观题还没有答案》/36kr 快讯《阿里云百炼上线 DeepSeek-V4》/TechCrunch《Google to invest up to $40B in Anthropic in cash and compute》/Reddit r/LocalLLaMA “Takeaways & discussion about V4 architecture”