2000 人轮番攻击一个 AI 助手，烧掉 $500，全白给了

OpenAI 刚掏出比 Claude 更强的 GPT-5.6 Sol，华盛顿就要求逐个客户审批——OpenAI 公开说「不可持续」。同一天，2000 人花了 $500 想攻破一个 AI 助手的防线，全军覆没。

🚀 巨头博弈与前沿突破

• OpenAI 预览 GPT-5.6 Sol：编程超 Claude Mythos 5，但美国政府要「逐个客户」审批 —— OpenAI 发布下一代旗舰系列（Sol/Terra/Luna），编程基准超越 Claude，配备史上最强安全栈。华盛顿邮报同日曝出：美国政府要求对每个客户进行访问审批，OpenAI 公开表示此限制不可持续。继 Fable 5 之后，第二家顶级实验室被同一只手卡住了脖子。

• DeepSeek V3.2：开源 Agent 能力登顶，首次实现思考+工具调用融合 —— V3.2 含标准版和 Speciale 长思考增强版，在 IMO/ICPC 等竞赛中斩获金牌。关键升级：首次实现 thinking + tool use 融合，Agent 评测达开源模型最高。与 GPT-5.6 同日登场——闭源要审批，开源在加速，两条路线今天同框了。

• IBM 发布全球首款亚 1 纳米芯片技术 —— 制程突破 1 纳米临界点，进入后摩尔时代新纪元。AI 算力焦虑的物理底层，芯片制造仍在默默捅天花板。

🛠️ AI Agent 攻防与工程现实

• 2000 人攻击同一个 AI 助手，花了 $500，零人成功 —— Fernando Irarrázaval 在 hackmyclaw.com 发起公开挑战：任何人可通过邮件攻击其 OpenClaw 测试实例，目标是泄露密钥。6000+ 次尝试后无人成功，一个 Google 账号反因收件过多被暂停。底层 Claude Opus 4.6 配多层 anti-prompt-injection 规则。此前社区普遍认为 prompt injection 对邮件入口几乎无解——2000 人的失败证明，工程防线可以比实验室预测更坚固。

• 虚构事故：两个 AI Review Agent 互掐 340 条，烧掉 $41,255 —— Andrew Nesbitt 发布讽刺报告：两个不同厂商的 AI Code Review Agent 同时挂到同一个 PR，就一个包是否恶意产生分歧死循环。340 条评论后 $41,255 推理账单出炉，其中一家厂商营销部却发新闻稿称「多 Agent 安全推理同比增长 430%」，股价反涨 6%。虽是虚构，精准戳中了多 Agent 系统缺护栏的真实痛点。

• OpenAI 内部 Codex 输出 token 中位数暴增 56 倍 —— Latent Space 拿到 OpenAI 内部数据：研发场景 Codex 输出 token 中位数增长 56 倍，客服场景增长 32 倍。这个数字比任何外部报告都更诚实地展示了 AI 在企业内部的渗透速度。

🚨 商业观察与估值信号

• OpenAI 考虑推迟 IPO 至 2027 年，SpaceX 暴跌 25% 成前车之鉴 —— NYT 报道 OpenAI 倾向将 IPO 延至 2027 年。两周前 SpaceX 上市短暂触及 $2T 估值后暴跌 25%，市场对 AI 估值泡沫担忧加剧。Altman 据称认为估值不到 $1T 不上市。产品叙事（GPT-5.6 更强）与资本叙事（估值恐惧）构成了 OpenAI 当下最撕裂的两面。

📚 延伸阅读

• Anthropic：Core views on AI safety https://www.anthropic.com/news/core-views-on-ai-safety

• Fernando Irarrázaval：2000 people tried to hack my AI assistant — nobody succeeded https://www.fernandoi.cl/posts/hackmyclaw/

• Andrew Nesbitt：Incident Report — CVE-2026-LGTM https://nesbitt.io/2026/06/26/incident-report-cve-2026-lgtm.html