正在刊行长文 · Essay
2026-06-23所有内容
随机比特 · Random Bits

美光投资 Anthropic H 轮 + 签多年内存供应协议 + 联合优化 AI 工作负载所需的内存与存储方案——这是 AI 模型第一次反向定义内存该长什么样。

2026-06-23AI Engineering / Systemsrbits.uk
美光投资 Anthropic H 轮 + 签多年内存供应协议 + 联合优化 AI 工作负载所需的内存与存储方案——这是 AI 模型第一次反向定义内存该长什么样。

别只看美光涨了十倍:AI 正在改写硬件优化目标

美光股票一年涨了十倍。批评者用一个词就定了性:循环投资。美光投钱给 Anthropic 的 H 轮,Anthropic 回头签多年采购大单——左手出右手进,营收做进财报,估值轮子继续转。

逻辑自洽。但同一套事实还有另一个解释。

6 月 22 日,美光和 Anthropic 宣布了四件事:联合优化 AI 工作负载所需的内存与存储方案、多年供应协议(HBM / DRAM / SSD)、美光内部部署 Claude、美光参与 H 轮投资。前三个每一件都值得说。但工作负载联合优化这一条,改变了这份协议的性质。

过去十年,峰值带宽一直是 HBM 升级叙事里最显眼的指标。发布会和参数表最容易被记住的,往往都是 GB/s。训练大模型同时依赖本地内存带宽和跨卡互连:HBM 负责单卡内部的数据搬运,多卡同步还要看集群互连。

但现在的计算重心正在从训练滑向推理。推理会重新排列带宽、容量、延迟和能效的优先级。

训练更强调大规模并行下的带宽和吞吐;推理更贴近线上服务,要长期、稳定、可承受地运行。做过业务系统的人都知道:能力在变,工程约束一点没消失。

01-training-vs-inference

所以当 Anthropic 和美光的工程师坐在同一张设计桌前,这件事已经超出普通采购:美光过去只能猜 AI 公司大概需要多大带宽、什么功耗包络;现在 Anthropic 直接把生产环境的工作负载特征丢在设计桌上。Anthropic 联合创始人 Tom Brown 的 Title 叫 Chief Compute Officer——一个直接对计算架构负责的 C-level。这个岗位本身就说明:硬件已经从采购清单升格为核心能力。

这更像工作负载级联合优化,而非单纯采购。

AI 实验室和基础设施的关系,正在出现三种截然不同的绑定模式。

第一种是平台绑定:模型公司把算力扩张压在云平台上,优势是规模来得快,代价是平台关系很深。第二种是垂直整合:芯片、集群、模型一体化,效率最高但只适合少数巨头。第三种是硬件联合优化:不持芯片厂、不绑单一云,在内存和存储这一层把工作负载讲清楚,让供应商围绕真实请求优化。

02-binding-models

三种模式对应三种效率剖面。第三种最有意思:模型公司不一定持有硬件资产,却开始把自己的负载特征带进硬件优化环节。

过去 HBM 的叙事长期围绕标准、代际和峰值带宽展开。现在,AI 实验室未必真的进入标准组织,却正在把生产环境里的请求形态提前带到供应商面前。成本问题从采购表前移到了架构设计。

与传统软件相比,当前大模型推理的边际计算成本仍然显著。DeepSeek 这类低价 API 证明软件侧仍有降本空间;硬件侧也在说同一种语言:NVIDIA Blackwell Ultra 和美光 HBM4 的材料,都在强调每瓦 token、token cost 与推理吞吐。美光与 Anthropic 这次合作,正好把同一股压力落到内存和存储层。

但财务框架回答不了两个问题:如果这只是左手倒右手的记账游戏,为什么合作公告要把不同工作负载下的内存与存储优化写成重点?为什么 Anthropic 把管计算的人放在 C-level?

这三个问题能过滤三种误判:只看股价,会把周期当趋势;只看算力,会把训练扩张当应用落地;只看采购金额,会漏掉模型公司把真实 workload 带进硬件优化的信号。

美光股票涨了十倍,里面当然包含周期和泡沫预期。但 AI 基础设施的优化目标,已经从模型训练进一步延伸到长期运行。

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。