随机比特 · Random Bits

1T参数跑出千级TPS，小米打穿推理天花板

2026-06-09AI Engineering / Systemsrbits.uk

1T参数跑出千级TPS，小米打穿推理天花板

今天的科技圈见证了底层算力效率的暴力突破与开源生态的强势反击。当硬件的天花板被中国团队重新定义，研究界也开始对盲目堆叠参数的执念进行深刻反思。以下是今天的精选：

🚀 巨头激战与前沿突破

小米发布 MiMo UltraSpeed 推理架构 —— 在标准 8 卡服务器上，成功将 1T（万亿）参数级大模型的推理速度硬推至 1000+ tokens/s。这一数量级的跃升直接击穿了商用硬件的极限瓶颈，在海外极客社区引发强烈震动。
微软 Lens 团队证伪“唯规模论” —— 官方最新研究通过实证踩下刹车：对于视觉生成模型而言，极其精细的数据标注对效能的拉升，远比无脑增加参数规模更具决定性。“Scale is all you need”的暴力美学正在遭受高价值数据的反噬。
Anthropic 内部安全基建 Glasswing 官宣扩容 —— 当同行在急切重构消费级应用形态时，Anthropic 选择继续死磕底层防御系统。巨头正在加速将自身的安全标准转化为未来 AI 行业的准入门槛。

🛠️ 开发者生态与工程利器

Goose 与 MemPalace 双双狂揽五万星霸榜 —— 面对闭源厂商的生态收权，开发者用脚投票：一个是支持全系模型、包揽测试编辑的终极智能体 Goose；另一个是狙击大厂专有记忆系统的开源平替 MemPalace。不被大厂绑架的独立基础设施正迎来全面井喷。
Simon Willison 确立 Agent 文本编辑新范式 —— 开源工具 datasette-agent-edit 将大模型修改代码的操作硬性拆分为“带行号查看、精准溯源替换、定点插入”三把斧。这放弃了花哨的全量重写，却摸到了当前 Agent 可靠操作文本的最低可行解。
HuggingFace 社区强推 OpenEnv 评估标准 —— 针对当前 Agentic RL（智能体强化学习）各自为战、实验根本无法复现的乱象，开源社区首次集结力量推行统一测试环境。智能体赛道终于从“草莽盲测”迈向了标准化的度量衡时代。

🚨 商业观察与组织进化

OpenAI 正式启动 AI 经济学实证研究 —— 官方首次拉起覆盖劳动力市场与宏观经济的研究网络。当更多企业 CEO 开始公开把“提升人效”直接兑现为粗暴的裁员比例时，AI 替代劳动力的叙事已从学术推演演变为必须被量化监控的灰犀牛。
Together AI 普及 1M 上下文推理基建 —— 平台正式接入具备百万 Token 吞吐与多模态能力的 MiniMax-M3。超长上下文不再是大厂旗舰 API 的溢价特权，第三方基建商正在把复杂企业级应用的部署门槛彻底踏平。

随机比特公众号二维码

公众号 · 随机比特

从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。