正在刊行长文 · Essay
2026-06-07所有内容
随机比特 · Random Bits

连谷歌都要向马斯克租显卡了:为什么大厂的算力焦虑可能跑错了方向?

2026-06-07AI Engineering / Systemsrbits.uk
连谷歌都要向马斯克租显卡了:为什么大厂的算力焦虑可能跑错了方向?

连谷歌都要向马斯克租显卡了:为什么大厂的算力焦虑可能跑错了方向?

前几天有一组数字传得很广:谷歌,全球最大的云计算巨头之一,居然向竞争对手 SpaceX 签了一份算力租赁合同。为了解燃眉之急,谷歌从今年 10 月起,每月要掏 9.2 亿美元租用 11 万张 GPU。

这看起来是“算力即权力”的又一次登峰造极。每天在 AI 圈算账的人,第一反应几乎都是同一句:Scaling Law(规模法则)的尽头就是砸钱,谁的卡多谁就能赢。

但我的判断不一样。

靠买显卡、堆参数的连续空间竞赛,正在撞上数据与算力的双重叹息之墙。真正的下一代大模型破局点,已经悄然向“离散空间”转移:也就是让 AI 启动架构级的 RSI(递归自我改进,Recursive Self-Improvement)。

过去几年,所有的大模型训练都是人类工程师写好一套固定的深度学习架构图纸,写好 CUDA 算子,然后把海量数据倒进去,让模型在这个给定的参数空间里去拟合。这就好比你在一个固定大小的迷宫里,试图用更大的马力穷举出一条最快的路线。

而 RSI 彻底掀翻了这个逻辑。既然 AI 已经懂写代码了,为什么还要人类去画这张迷宫图纸?

近期 Sakana AI 宣布全面转向 RSI 路线,Anthropic 内部也已经开始让 AI 深度参与模型架构设计。他们跑通的模式演示了一个非常暴力的科研闭环:系统不再是被动地回答问题,而是自动在后台生成新的、变异的底层代码,自己编译、运行、在测试集上验证效果。

如果变异出来的损失函数或模型拓扑比人类写的更高效,它就把自己的核心代码替换掉,然后进入下一轮进化。

这不是科幻,这就是代码层面的遗传突变。它意味着开发者和架构师的日常正在被重新定义:我们未来的核心价值,不再是绞尽脑汁去手搓一个新的算法架构,而是为 AI 设定好一个“存活与进化”的评价环境(Reward 函数)。只要业务意图和物理边界定义清楚了,剩下的底层实现完全交由机器去试错。

与之同频的,是打破数据的重力。当人类互联网产生的高质量语料快被榨干时,单纯买更多显卡已经解决不了“没有好书可读”的困境。OpenAI 正在内部推行的 “Dreaming”(做梦)机制,实质上是让模型在极度专注的后台 Lockdown(闭关)状态下,自己和自己对弈。利用蒙特卡洛树搜索(MCTS)和离线强化学习,AI 可以反复推演逻辑,合成出比人类原生语料质量高得多的新数据,实现“左脚踩右脚上天”。

<!-- diagram:架构级RSI闭环演化模型 -->

这其实就是 AlphaGo Zero 曾经走过的路。当年 AlphaGo Lee 靠学习人类几千年的棋谱击败了李世石;但真正无敌的 AlphaGo Zero 抛弃了所有人类语料,纯靠自我对弈从零摸索,不仅超越了前代,还发现了人类从未见过的定式。

现在,这种剥离“人类经验束缚”的自我演化,正在降临到大模型本身的设计和训练上。

未来的软件工程将不可避免地分裂成两派:一派还在拼命攒钱买显卡,试图在人类写好的那张旧图纸上把参数堆到十万亿;另一派,已经关起门来,让 AI 自动去搜索那张人类根本想象不出来的新图纸。

大厂花近百亿美金买算力,只是在填补当下的产能缺口,不要把它误认为是通向超级智能的唯一解法。下一个 10 年真正能建立绝对壁垒的,不是手握最多显卡的人,而是最早学会设计演化规则、敢于把底层建筑权彻底交给机器的人。

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。