你的AI编程助手在悄悄多收你钱,而你可能永远不会发现

4月29日,一个 GitHub Issue 在 Hacker News 上炸了——952分,389条评论。
事情的起因听起来像个段子:有开发者在用 Claude Code 写代码时,在 git commit message 里写了 “HERMES.md”——意思是提交了一个叫 HERMES 的 Markdown 文件。然后账单异常了。同样的操作、同样的代码量,就因为 commit 信息里多了这个字符串,请求被路由到了额外的计费通道,价格不一样了。
他不信邪,又测了几次。确认了。提交到 Anthropic 的 GitHub——issue #53262。
这件事情的核心不是 HERMES.md 这三个字。核心是:一个对用户完全透明的文本字符串,能在用户完全不知情的情况下改变计费逻辑。而且如果不是有人偶然在 commit message 里写了这三个词,可能永远不会被发现。
你不知道的,远比你发现的多
Mike Hearn——前 Google 资深工程师,也是 Java 和比特币社区里那个 Mike Hearn——在 HN 帖子里写了长篇分析。他指出的问题远不止这一个字符串。
问题本质是:AI 编码工具的计费模型,对用户是一个完全的黑箱。
你知道你每次问 Claude Code 一个问题,消耗了多少 token 吗?你知道这个请求走的是哪条推理路径吗?你知道 Anthropic 在你的请求里加了多少层的 system prompt、routing logic、context injection 吗?你不知道。你只知道月底收到账单,然后选择信或者不信账单上的数字。
这不是 Anthropic 独有的问题。GitHub Copilot 刚刚宣布从固定价格转向按实际用量计费。Cursor 的定价页面上写着”基于请求的复杂度和 token 消耗”。所有 AI 编码工具的定价模型都在往同一个方向走:更细粒度、更”公平”、也更不透明。
HERMES.md 被找到是偶然。如果是 HERMES2.md 呢?如果是某个只在特定条件下才触发的模式呢?用户没有办法去审计这些——因为没有工具、没有日志、没有标准。
开发者可以 audit 自己写的每一行代码,但 audit 不了 AI 助手收的每一分钱。
“最安全的 AI 公司”与被侵蚀的信任
这事最讽刺的地方是:出问题的是 Anthropic。
在 AI 行业的三巨头里,Anthropic 一直扮演的是”好人”角色。OpenAI 讲 AGI,Google 讲规模,Anthropic 讲安全。Claude 的宪法 AI、负责任扩展策略、拒绝为五角大楼提供服务——这些不是营销话术,是 Anthropic 区别于其他人的实质性选择。
也正是因为这层人设,它出的问题杀伤力更大。
HN 评论里点赞最高的一条回复是:”Brought to you by, allegedly, the ‘Good’ AI company.” 下面紧接着的是对这件事是否违法的讨论——多个国家的开发者分析各自国家的消费者保护法能不能管到这种情况。讨论很快就从”这是个 bug”变成了”这合法吗?”
对一个以信任为核心资产的 AI 公司来说,这个转变是致命的。
而且 Anthropic 的回应方式也在加剧问题。Issue 被提交后,截至 HN 讨论沸腾时,Anthropic 的官方回应含糊其辞——没有明确说这是 bug 还是设计行为,没有说会退还多收的费用,没有承诺审计计费逻辑中是否还有其他类似触发器。开发者社区嗅到的是回避和拖延。
这不是一次公关危机。这是一次信任危机。而信任这种东西,攒起来慢,花起来快。
AI 工具的计费,需要一场透明化革命
如果把这件事放到更大的图景里看,它指向的是一个行业级的空白地带。
过去一年,AI 工具的计费模型发生了两次结构性转变。第一次是从”免费试用”到”付费订阅”——用户接受了你得为 AI 付钱这件事。第二次正在发生——从”固定月费”到”按量计费”,GitHub Copilot 和 Claude Code 都在往这个方向走。
但有一个东西没有跟上:透明度。
在传统云计算里,AWS 的账单可以细到每个 API 调用、每个 GB 的流量。在电信行业,通话详单可以精确到每一秒。
但 AI 工具呢?
你不知道一次对话到底消耗了多少 token,不知道 prompt 的复杂度如何影响价格,不知道有没有隐藏的路由规则在改变你的计费层级。
这不是技术难题。这些信息 AI 公司自己全都有——否则它没法计费。它只是没有给你看。
HERMES.md 事件是一个警示:当计费逻辑变得足够复杂,复杂到用户根本无法验证的时候,”bug”和”设计”之间的界限就消失了。每一个未披露的计费逻辑,都有被当成 bug 发现的那一天。而每一次这样的发现,都会在开发者社区里引发同样的反问:还有多少我不知道的?
如果觉得内容不错,欢迎你点一下「在看」,或是将文章分享给其他有需要的人^^
相关好文推荐:
一种快速判别产品AI含量的黄金指标,帮你远离披着AI外皮的传统软件公司
夜雨聆风