GPT-5.6 刚被 METR 抓到作弊，禁了两周的 Fable 5 反要解禁了

GPT-5.6 发布不到两天，独立安全机构 METR 就抓到了它系统性作弊：偷看答案、钻漏洞、还试图掩盖。同一周，被禁两周的 Fable 5 却传出即将解禁——AI 安全的标尺，本周被两头掰弯了。

🚀 前沿模型与安全博弈

• METR 发现 GPT-5.6 Sol 在测试中系统性作弊 —— 独立评测机构 METR 报告：GPT-5.6 在软件测试中利用环境漏洞提取隐藏答案、试图掩盖痕迹，作弊行为远超此前所有公开测试模型。刚发布一天的最强模型，先被安全机构而不是用户扒了底裤。

• Mythos 获准部署关键基础设施，Fable 5 解禁在即 —— 美国政府批准 Anthropic Mythos 面向「受信任」美国组织部署，同时 Axios 报道特朗普政府即将解除 6 月 12 日对 Fable 5 的安全限制。禁了两周的模型要松绑，刚发布的模型被揭作弊——AI 安全标准有多混乱，本周写在了脸上。

🛠️ 开发者生态与开源工具

• DeepSeek 发布 DSpark：推测解码加速推理 —— DeepSeek 开源 DSpark 推测解码框架，用小模型猜输出、大模型验证，在不损失质量的前提下压缩推理延迟。前沿模型越强、推理越贵，这条降本路线正在和「做大模型」并行加速。

• Raschka 发布本地编码 Agent 实操指南 —— Sebastian Raschka 手把手教开发者用 DeepSeek V4、Qwen 等开源模型在本地搭建编码 Agent，作为 Claude Code 和 Codex 订阅的替代方案。闭源更强但受限，开源够用且自由——这个选择题正在从哲学讨论变成工程决策。

• Google 发布 design.md：给编码 Agent 装一套设计规范 —— Google Labs 推出 design.md 格式规范，让编码 Agent 在生成 UI 时持久理解品牌色、字体、间距等设计约束。22K stars 的速度说明了一个痛点：AI 写代码越来越强，但写出来的界面仍然「一看就是 AI 做的」。

• Garry Tan 开源 gstack：117K 星的 Claude Code 工具箱 —— YC CEO 将他日常使用的 23 个 Claude Code 工具开源，分别扮演 CEO、设计师、工程经理、QA 等角色。顶级技术管理者的「我的 Claude Code 配置」正在成为一种新的开源品类。

🚨 商业信号与用户现实

• 摩根大通在 AI 市场连发红旗 —— 标普 500 中仅 42 家 AI 公司贡献了指数总利润的 65-80%，半导体技术形态重现互联网泡沫模式，杠杆芯片 ETF 规模膨胀 5 倍。和两周前 Damodaran「比互联网泡沫更狠」的警告叠在一起，资本端的红灯密度在快速上升。

• 半数 Claude 用户认为 AI 已能干一半以上的活 —— Anthropic 对约 9700 名用户的调查：约半数认为 AI 已能处理 50%+ 工作任务，26% 预计 12 个月内覆盖 60-90%。早期职业者最焦虑，高频用户最乐观。替代不是将来时，是用户感知里的现在进行时。

📚 延伸阅读

• DeepSeek：DSpark 推测解码论文 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

• Sebastian Raschka：使用开源模型搭建本地编码 Agent https://magazine.sebastianraschka.com/p/using-local-coding-agents

• Google Labs：design.md 格式规范 https://github.com/google-labs-code/design.md