正在刊行长文 · Essay
2026-05-31所有内容
随机比特 · Random Bits

大厂的“官僚化”迷思:为什么开发者正在抛弃 Anthropic 的 MCP 协议?

2026-05-31AI Engineering / Systemsrbits.uk

就在本周,AI 圈上演了极具撕裂感的一幕。 一边,Anthropic 宣布完成了高达 650 亿美元的 H 轮融资,投后估值逼近万亿美元。伴随着 Claude Opus 4.8 的发布,这家公司无疑正处于其历史的高光时刻。 但在另一边,Hacker News 的头版头条却被一篇名为《MCP is dead》(MCP 已…

大厂的“官僚化”迷思:为什么开发者正在抛弃 Anthropic 的 MCP 协议?

就在本周,AI 圈上演了极具撕裂感的一幕。

一边,Anthropic 宣布完成了高达 650 亿美元的 H 轮融资,投后估值逼近万亿美元。伴随着 Claude Opus 4.8 的发布,这家公司无疑正处于其历史的高光时刻。

但在另一边,Hacker News 的头版头条却被一篇名为《MCP is dead》(MCP 已死)的讨贼檄文霸占。这篇文章来自一线工程团队,无情地戳破了 Anthropic 试图一统天下的野心:他们耗费巨大精力推广的 MCP(Model Context Protocol,模型上下文协议),正因为其过度设计和极高的接入成本,被开发者们用脚投票无情抛弃。

当一家顶级 AI 实验室试图用构建操作系统的复杂度,来解决一个只需“函数调用”就能完成的问题时,大厂的“爹味”和“官僚化”迷思便暴露无遗。


一、技术考古:从 SOAP 到 MCP 的历史重演

历史不会简单地重复,但总是惊人地相似。

把时钟拨回 2000 年代初的 Web Service 时代。当时,微软、IBM 和 Sun 等巨头为了解决异构系统之间的通信问题,联合推出了被视为“工业级标准”的 SOAP 协议。

如果你经历过那个时代,一定还记得被 SOAP 支配的恐惧:为了发送一句简单的 hello,你需要包裹上层层叠叠的 XML 信封(Envelope),编写繁琐的 WSDL 契约,还要处理各种复杂的 Header 和安全校验。

最终,开发者们受够了这种大厂强加的“重型装甲”,转而投向了极简的 REST 和 JSON。

人类和机器都需要更低的心智负担。

遗憾的是,Anthropic 的 MCP 似乎忘记了这个教训。MCP 的设计初衷很好:为 AI Agent 提供一套统一的标准来读取本地文件、访问数据库或调用外部 API。

但看看 MCP 的实际设计吧。为了让大模型读取一个本地的 .txt 文件,MCP 强迫开发者实现一套完整的生命周期:

  1. Initialize(握手与能力协商)
  2. Ping(心跳保活)
  3. Resource Discovery(列出可用资源)
  4. Template Registration(注册资源模板)
  5. 最后才是真正的 Read 操作。

这简直就是现代版的 SOAP。它用构建分布式微服务的复杂架构,来解决一个仅仅需要一进一出的“读写请求”。


二、硬核剖析:为什么 Agent 不需要沉重的通信协议?

<figure><img src=“images/01-protocol-comparison.png” alt=“MCP 重型协议与极简 Function Calling 对比” /></figure>

MCP 架构设计的核心谬误在于:它把大模型、本地工具和外部服务,抽象成了对等的分布式网络节点。

但在实际的高效 AI 开发流中(看看爆火的 Cursor、Cline 或是基于 CLI 的极简 Agent),最强大的 Agent 根本不是通过网络去调用成百上千个微服务 API。

真相是:Local-first(本地优先)与共生。

效率最高的 Agent,往往是直接挂载在你的本地文件系统上。你不需要一套复杂的“上下文协议”来告诉它数据库表结构是什么。你只需要给大模型一个可信的 Bash 执行环境和一个极简的 Virtual Filesystem(虚拟文件系统)。

当纯粹的 Function Calling 已经足够强大时,任何外衣都是累赘。

假设我们需要让大模型返回一条读取数据库的指令。 在极简的 JSON-RPC 或纯 Function Calling 范式下,模型只需要输出:

{
  "action": "read_db",
  "query": "SELECT * FROM users"
}

几行 Python 代码接管标准输出(stdout),执行查询,把结果扔回给大模型。整个过程连 10 行代码都不用。

而在 MCP 体系下,你需要引入官方沉重的 SDK,定义复杂的 Schema,注册 Handler,处理各种状态回调和分页逻辑。这消耗的不仅仅是开发者的周末,更是无谓的 Token 和网络带宽。


三、大模型的“理解成本”与幻觉之源

除了开发者的厌恶,MCP 这类重型协议还在挑战 LLM(大语言模型)本身的物理极限。

大模型在进行推理时,最害怕的其实是复杂的层级嵌套

在 Transformer 架构中,注意力机制(Attention Mechanism)的运作方式决定了:层级越深、格式包裹越厚的 JSON/XML,模型在提取核心有效信息时,注意力的衰减就越严重。

当模型的上下文窗口被大量毫无意义的 MCP 协议封包、握手状态、生命周期标志位塞满时,它用来思考业务逻辑的“脑容量”就被挤占了。这会直接导致模型遵循指令的能力下降,幻觉(Hallucination)率直线上升。

相反,极简、扁平的 JSON 结构,能最大程度降低大模型的“认知解码成本”,让它把每一分算力都用在刀刃上。


四、结语:避开基础设施的焦油坑

Anthropic 是一家伟大的公司,Claude Opus 4.8 也是目前最顶尖的模型之一。但这并不意味着由财力雄厚的大厂自顶向下设计的“标准协议”就一定是行业的未来。

当一个协议需要长达几十页的白皮书来解释如何跑通一个 Hello World 时,它就已经走在了被淘汰的路上。

AI 时代的工程箴言,其实依然是半个世纪前那个古老的 Unix 哲学: “提供小而美的工具,让它们通过纯文本进行组合。”

在为你的下一个 AI Agent 选择基础设施时,请果断抛弃那些试图控制你架构、引入复杂生命周期的重型协议。拥抱极简的 Function Calling,拥抱直接的文件读写。

因为在 AI 的世界里,少,即是多。


随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。