← 随机比特 / 所有内容

{{FINAL_TITLE_WECHAT}}

2026-04-23 · 随机比特

看 Star 数选库?你这不叫技术评估,叫买彩票


0.5 元,一颗 GitHub Star。1000 颗起购。

我第一次看到这个数字的时候,脑子里闪过的不是愤怒,而是一种奇怪的释然:原来那种隐约的"这个项目感觉不太对劲"真的不是错觉。

我有个习惯,选 AI 工具的时候会先看 Star 数。不是觉得这是完美标准,只是图省事——“这么多人点过,应该不会太坑”。去年有个内部讨论,同事推荐一个 AI 文档解析的 Python 包,说"你看都 8000 Star 了"。我当时没反驳,直接加进了 requirements.txt。后来这个包三个月没更新,issue 区一片沉默,贡献者就一个人,README 里的 benchmark 根本跑不出来。

8000 颗星,没有一颗是我认识的人点的。

现在我知道了:那 8000 颗,可能有 5600 颗是买的。

<figure><img src=“images/01-star-price-funnel.png” alt=“star-price-funnel”></figure>


这不是刷单,这是武器化

量子位、新智元今天(2026-04-23)集中报道了这个数字:GitHub Star 在 Fiverr 上明码标价,0.5 元/颗,1000 颗起购。研究团队扫描 AI 类高星仓库,发现某些仓库 70% 以上的 Star 来自批量注册账号。

刷 Star 这个灰产已经运转了五六年了,这不是新鲜事。

但我想说的是:AI 赛道让这件事的性质变了。

在别的领域,刷 Star 是虚荣心或者 SEO 操作——让自己的库出现在搜索结果里,仅此而已。在 AI 领域,GitHub Star 数直接嵌进了整条价值链:投资人 due diligence 第一步看 GitHub 链接,BD 和潜在客户问"社区活跃度怎么样",媒体报道写"已在 GitHub 获得 X 万颗星",开发者选型把 Star 当第一道筛选器。

这颗星不再只是一个数字,它是可信度的代理变量。而 0.5 元就能买到一颗,意味着整条依赖这个代理变量的判断链条——都可以被 0.5 元/颗的成本攻破。

AI 项目之所以是假星重灾区,还有一个结构性原因:入局成本极低,但可信度需求极高。 Fork 一个开源模型,套一层 UI,写一份漂亮的 README,一个 AI 项目就起盘了。但没人知道你。而 GitHub Star 是最快、最便宜的"我有人用"的证明。1000 颗星,500 块,换来媒体报道里那句"已获得千星关注"——这笔买卖对灰产来说太划算了。

这不是刷单,这是把信任基础设施武器化。


同一天,另一条防线也塌了

如果只是 Star 数是假的,我可能还能自我安慰:行,那我去看 commit 记录、看 issue 响应、看代码质量。

但今天同时还有另一件事:OpenAI 公开了一份内部排查报告,主题是 axios 开发者工具遭遇供应链攻击。

axios 这个名字你一定不陌生——它是 JavaScript 世界里用量最大的 HTTP 客户端之一。这次被攻击的不是 axios 本身,而是某个关联的开发者工具包:攻击者在里面植入了恶意代码,目标是开发环境。OpenAI 在内部发现了问题,公开了排查结果,并在报告中提到了 SBOM(软件物料清单)需求。这是 AI 公司第一次因为一个 npm 包出问题而进行"自我通报"。(来源:openai.com/index/axios-developer-tool-compromise/)

这件事有一个细节:这个被攻击的工具,Star 数和下载量并不低。

假 Star 告诉你这个库值得信任,真的恶意代码在这个"可信"的库里等着你。

两条防线,同一天,同时失守。

一条是数量层面的:Star 数是假的,你以为有人在用,其实没有。 另一条是代码层面的:Star 数是真的,但代码是坏的,真的有人在用,所以更危险。

这两件事同时发生,说的是同一个底层问题:AI 时代开源生态的信任基础设施还没建好,但我们已经在上面盖了二十层楼。

<figure><img src=“images/02-trust-chain-collapse.png” alt=“trust-chain-collapse”></figure>


那现在信什么

说完问题,我得说说我自己现在怎么做。

第一,不再把 Star 数当第一道筛选器。

替代它的,是几个更难造假的信号:

Commit 频率和分布——看最近三个月的记录,不只看数量,看时间分布。真实活跃的项目 commit 散布在工作日,不会某个下午突然出现 50 个提交。

Issue 响应时间——打开 Issues 页面,找最近 20 个 bug report,看 maintainer 的响应时间和回复质量。这个很难批量造假,因为雇人认真回 issue 的成本远高于刷 Star。

贡献者账号年龄——看主要 contributor 的注册时间和历史活动。一个真实的开发者账号不只有这一个 repo,注册时间往往也早于项目本身。

CI 是否真实跑测试——看 Actions 标签,有没有真实运行的测试流水线。一个完全没有 CI 的"热门"项目,是非常强的警告信号。

依赖链有没有透明度——这是从今天 axios 事件里学到的教训。看这个包依赖了什么。如果依赖文件里充满你不认识的间接依赖,又没有 lock 文件、没有 SBOM,那你装下来的不只是这个工具,而是它背后整条信任链——包括里面可能藏着的东西。

这些信号都不完美,但造假成本比 Star 高几个数量级。


说到今天 GitHub Trending,排第一的是一个叫 Shannon Lite 的白盒 AI 渗透测试工具:读你的源码,自动推断攻击面,然后构造真实 exploit 来证明漏洞存在。40,000 Star,在安全基准测试上跑出 96.15% 准确率。

我没有要给它打广告的意思。只是觉得这个时间节点出现这个工具,说明了什么:当我们还在争论 Star 数是不是真的时候,已经有人在自动化地扫你的代码证明它有多不安全了。

从 0.5 元/颗的 Star,到供应链里的恶意代码,再到自动找漏洞的 AI 工具——今天这三件事合在一起,是同一句话的三种说法:

我们把"看着靠谱"当成了"真的靠谱",然后把这个误判,用 pip install 硬编码进了生产环境。

这颗星,你买得起。地基,你建不起。