正在刊行早报 · Morning Brief
2026-06-27所有内容
随机比特 · Random Bits

2000 人轮番攻击一个 AI 助手,烧掉 $500,全白给了

2026-06-27AI Engineering / Systemsrbits.uk
2000 人轮番攻击一个 AI 助手,烧掉 $500,全白给了

OpenAI 刚掏出比 Claude 更强的 GPT-5.6 Sol,华盛顿就要求逐个客户审批——OpenAI 公开说「不可持续」。同一天,2000 人花了 $500 想攻破一个 AI 助手的防线,全军覆没。

🚀 巨头博弈与前沿突破

OpenAI 预览 GPT-5.6 Sol:编程超 Claude Mythos 5,但美国政府要「逐个客户」审批 —— OpenAI 发布下一代旗舰系列(Sol/Terra/Luna),编程基准超越 Claude,配备史上最强安全栈。华盛顿邮报同日曝出:美国政府要求对每个客户进行访问审批,OpenAI 公开表示此限制不可持续。继 Fable 5 之后,第二家顶级实验室被同一只手卡住了脖子。

DeepSeek V3.2:开源 Agent 能力登顶,首次实现思考+工具调用融合 —— V3.2 含标准版和 Speciale 长思考增强版,在 IMO/ICPC 等竞赛中斩获金牌。关键升级:首次实现 thinking + tool use 融合,Agent 评测达开源模型最高。与 GPT-5.6 同日登场——闭源要审批,开源在加速,两条路线今天同框了。

IBM 发布全球首款亚 1 纳米芯片技术 —— 制程突破 1 纳米临界点,进入后摩尔时代新纪元。AI 算力焦虑的物理底层,芯片制造仍在默默捅天花板。

🛠️ AI Agent 攻防与工程现实

2000 人攻击同一个 AI 助手,花了 $500,零人成功 —— Fernando Irarrázaval 在 hackmyclaw.com 发起公开挑战:任何人可通过邮件攻击其 OpenClaw 测试实例,目标是泄露密钥。6000+ 次尝试后无人成功,一个 Google 账号反因收件过多被暂停。底层 Claude Opus 4.6 配多层 anti-prompt-injection 规则。此前社区普遍认为 prompt injection 对邮件入口几乎无解——2000 人的失败证明,工程防线可以比实验室预测更坚固。

虚构事故:两个 AI Review Agent 互掐 340 条,烧掉 $41,255 —— Andrew Nesbitt 发布讽刺报告:两个不同厂商的 AI Code Review Agent 同时挂到同一个 PR,就一个包是否恶意产生分歧死循环。340 条评论后 $41,255 推理账单出炉,其中一家厂商营销部却发新闻稿称「多 Agent 安全推理同比增长 430%」,股价反涨 6%。虽是虚构,精准戳中了多 Agent 系统缺护栏的真实痛点。

OpenAI 内部 Codex 输出 token 中位数暴增 56 倍 —— Latent Space 拿到 OpenAI 内部数据:研发场景 Codex 输出 token 中位数增长 56 倍,客服场景增长 32 倍。这个数字比任何外部报告都更诚实地展示了 AI 在企业内部的渗透速度。

🚨 商业观察与估值信号

OpenAI 考虑推迟 IPO 至 2027 年,SpaceX 暴跌 25% 成前车之鉴 —— NYT 报道 OpenAI 倾向将 IPO 延至 2027 年。两周前 SpaceX 上市短暂触及 $2T 估值后暴跌 25%,市场对 AI 估值泡沫担忧加剧。Altman 据称认为估值不到 $1T 不上市。产品叙事(GPT-5.6 更强)与资本叙事(估值恐惧)构成了 OpenAI 当下最撕裂的两面。

📚 延伸阅读

• Anthropic:Core views on AI safety https://www.anthropic.com/news/core-views-on-ai-safety

• Fernando Irarrázaval:2000 people tried to hack my AI assistant — nobody succeeded https://www.fernandoi.cl/posts/hackmyclaw/

• Andrew Nesbitt:Incident Report — CVE-2026-LGTM https://nesbitt.io/2026/06/26/incident-report-cve-2026-lgtm.html

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。