正在刊行长文 · Essay
2026-06-21所有内容
随机比特 · Random Bits

Matt Pocock 把每天用的 agent skills 开源了,最常用的那个不写代码,是先盘问他

2026-06-21AI Engineering / Systemsrbits.uk
Matt Pocock 把每天用的 agent skills 开源了,最常用的那个不写代码,是先盘问他

Matt Pocock 把自己 .claude 目录里每天用的那套 agent skills 开源了,副标题写得很冲:「Skills for real engineers — not vibe coding」。一两天就冲上了 GitHub Trending。

我点进去本来想看他塞了多少花活,结果看完愣了一下:他装得最多、自己说最常用的那个 skill,根本不写代码。它干的事,是在你让 agent 动手之前,反过来把你盘问一遍。

这个细节比「又一个大佬开源了 skills 库」有意思得多。它顺手回答了一个我一直想不太通的问题:现在让 AI 多写代码已经不难了,可为什么用 agent 写生产代码的人,活得反而更累?

把翻车拆开,只有四种

Matt 没按工具列清单,他按「翻车的样子」分类。用 coding agent 久一点的人,这四种大概率全踩过。

第一种,它没干你想要的。 你以为它懂你要什么,吭哧吭哧产出一大坨,跑起来发现它建的根本是另一个东西。这是最常见的失败,败在沟通错位,跟代码能力没半点关系。

第二种,它太啰嗦。 被丢进一个陌生项目,agent 只能自己猜行话,于是用二十个词去说一个词能说清的事。整段对话被它的废话稀释,你的注意力也跟着稀释。

第三种,跑不通。 对齐也对了,沟通也顺了,产出的还是垃圾——因为它没有一条能告诉自己「我错了」的回路。Matt 这里有句话我很认:反馈有多快,你就只能开多快。没有类型、没有测试、没法自己点开浏览器看一眼,它就只能蒙着眼睛狂奔。

第四种,堆成一团泥。 这条最阴。agent 让你飞快地写代码,于是它也让你飞快地累积复杂度——Matt 的原话是,agent 加速写代码的同时,也在加速软件的熵增,代码库以前所未有的速度变复杂。前三种是当场翻车,这一种是几周后才结账。

01-四失败模式

四把解药,全是老掉牙的东西

到这里才是真正值钱的部分。Matt 给每种翻车配了一个 skill,你把这四个 skill 的标签撕掉,看它们到底在干什么——

治「没对齐」的,是 grill-me:让 AI 在你动手前,揪着你的方案一路追问,把决策树的每个分叉都问到没得问为止。这不就是需求澄清。

治「太啰嗦」的,是建一套共同语言,写进 CONTEXT.md。他给的例子很传神:把「课程某个章节里的一节课被真正生成出来」这一长串,压成一个词——materialization cascade,物化级联。以后你和 agent 一说这个词,双方脑子里是同一张图。这就是领域驱动设计里讲了二十年的统一语言(ubiquitous language)。顺带一提,他说边盘问边把难解释的决策记成 ADR 的那个 grill-with-docs,可能是整个仓库里最酷的一招——他原话就是 the single coolest technique in this repo。

治「跑不通」的,是 tdd,红-绿-重构:先写一个必然失败的测试,再去把它修绿。这是测试驱动开发,岁数比这屋里大部分程序员都大。

治「一团泥」的,是每隔几天跑一次 improve-codebase-architecture,主动去抢救正在变烂的结构。说白了就是:每天匀点时间在设计上,别等它烂穿了再哭。

四种翻车,四把解药,没有一把是新发明。对齐、共同语言、反馈回路、持续投资设计——全是软件工程讲了几十年的基本功,换了层 AI 的皮重新出场。Matt 自己在末尾点破:软件工程的基本功,比以往任何时候都更重要。

真正的拐点:基本功从加分项变成了地基

这句话听着像鸡汤,但它背后是一个很硬的判断,我愿意替他说得更直白一点。

AI 没让这些基本功过时,它干的是另一件事:把它们从「加分项」挪成了「地基」。

以前你工程基本功一般,写得慢,但慢本身是个缓冲——你边写边想,烂代码堆积的速度被你打字的速度卡着。现在 agent 把油门替你踩到底,打字这道闸没了。基本功好的人,借这股加速把好东西更快地搭出来;基本功差的人,是把烂泥更快地糊上墙。同一脚油门,两个相反的方向。

所以「最受欢迎的 skill 是 grill-me」这件事,本身就是答案。一屋子工程师手里最缺的,原来不是「让 AI 多写点代码」的本事——那它早就管够了——而是「先把自己想清楚」的本事。大家抢着装的,是一个逼自己想清楚的工具。

这也给了你一把现成的尺子。下次再看到某个 AI 编程框架、某个 skill、某套 prompt 模板被吹上天,先别管它包装得多新,问一句:它治的是这四个病里的哪一个——没对齐、太啰嗦、跑不通、还是烂成一团泥?答得上来,它大概率有用;答不上来,它多半只是又一层好看的壳。

顺便说个边界,免得被我带偏:grill-me 这种反向盘问,对「我自己也没完全想清楚」的探索型任务最值钱;要是任务早想透了、纯机械活,它就是纯添堵。工具对不对,永远看你拿它治哪个病。

想试,一行就装上:npx skills@latest add mattpocock/skills。先装 grill-me,让它把你审一遍。多半你会发现,被卡住的从来不是 AI,是你还没想清楚自己到底要什么。

「有了 AI 不用学工程」,是这一年我听过最甜的一句谎。

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。