第 4 秒才出图还是第 4 秒已经跑完 50 张变体

千张图 0.034 美元。每张 0.0034 美分。

AI 模型降价的消息隔几天就有一条——大部分看了就忘了。但这回值得停下来算一下：它跌到了一条有意思的线以下。

01-cost-threshold

算一笔账。千张 0.034 美元意味着什么？意味着你可以在一个 for 循环里跑 1000 张图，账单增加不到三毛五人民币。意味着产品里给用户出 10 个候选封面，成本不到半分钱。意味着做图像 A/B 测试的时候，你连成本那栏都不用填。

成本一旦低过决策阈值，行为就会变。

文本模型已经演过一遍了。最早大家拿 GPT-4 做一切，最好的模型是唯一选项。后来 Gemini Flash、Claude Haiku 这些便宜货上来，一开始被嫌不够聪明，但很快所有人都发现：绝大多数场景用金字塔尖的推理能力纯属浪费——够用、便宜、不用想，三个条件凑齐就可以切。分类、摘要、翻译、情感分析——全切到了轻量模型。API 账单降了两个数量级，产品形态跟着变了：从用户触发了才调一次，变成后台默默跑五十次推断再汇总。

图像生成正在踩进同一条河。

过去图像 API 的隐含逻辑是省着用：出 3 张让用户挑，挑完手动微调。这个逻辑的前提是多跑一张图有可感知的成本。现在这个前提碎了。4 秒一张、单价 0.0034 美分——多跑 50 张变体，延迟仍然可控，成本仍然可以忽略。产品逻辑会从生成一张好图变成生成一堆让另一个模型筛——用户挑不过来的数量，交给算法自己投票。

实时生成式界面已经在逼这条线了：画面跟着用户输入变，每一帧都需要即时出图，延迟方差一旦抖起来用户就出戏。这类场景的考核指标很直接——用户能不能察觉到画面是生成的，比样图好不好看要紧得多。

这恰好是 Lite 的切入点：在延迟和成本的象限里，它蹲在最左下角——最低延迟、最低成本。而图像质量跟上一档标准版的差距，落在专业摄影师才分辨得出来的级别。大多数产品对图像的诉求——商品图、插画占位、风格化头像、搜索结果配图——根本没到这个精度门槛。

这个信号该怎么读。

Nano Banana 2 Lite 值得看的点，在定价结构上：Lite、标准、Pro 三档，分别对应速度优先、均衡、质量优先。这是成熟品类的定价策略，实验性产品用不着分档分得这么细。图像模型正在从技术 demo 变成按需采购的基础设施。

对开发者来说，有一个够用的判断框架：

把图像 API 当成 pipeline 的一个组件来处理——算产品每千次调用要花多少钱、要等多久。如果这两个数字低到你再也不用在代码里写 if budget_left > threshold: generate_variants() 这种条件判断，就该切了。

这次 Lite 的价格和延迟，把很多犹豫直接变成了行动。接下来的悬念是谁先把图像生成做成跟数据库查询一样随手可调的东西。那个时刻一到，今天看起来激进的设计——实时生成式 UI、个性化视觉流、全量 A/B 图像测试——会变成默认配置。

而那个时刻可能比所有人想的都近。千张 0.034 美元，每张 4 秒——这个数字摆在这里，你下次写图像生成的代码时，心里已经有答案了。