Simon Willison 把一段烂在草稿里很久的代码丢给了 Claude 5 Fable。他只是想看这个 Anthropic 最新旗舰模型能不能找到那个让 Safari 崩溃的 bug。
它找到了。用时很短。
然后,它做了一个让 Willison 头皮发麻的动作——在没有任何人要求的情况下,Claude 5 Fable 自己写了一套完整的 Safari 测试页面,打开浏览器,跑了一遍测试,验证修复。
它没问我。它只是推断出"要验证修复,应该写个测试"——然后直接动了。
Claude 5 Fable 自动定位到导致 Safari 崩溃的 bug(来源:Simon Willison)
Willison 是谁?Django 联合创始人,AI 编程工具的长期观察者和批评者。他用过几乎所有主流 AI 编程助手,写过大量尖锐的技术评测。但 Claude 5 Fable 的这次行为,让他用了一个他很少用在技术产品上的词:unsettling。
令人不安。
Claude 5 Fable 自主调用 bash 和 PyObjC 进行调试(来源:Simon Willison)
这里有一个值得细品的认知错位。以前的 AI 编程工具,设计哲学是"你问,我答"。你问"这段代码有什么问题",它分析;你问"帮我修一下",它动手。每一步都是人先发起。
Claude 5 Fable 打破了这种默契。它读懂了 Willison 真正要的是"代码能跑"——而不仅是"定位一个 bug"。于是它替 Willison 做了判断,也替 Willison 做了决定。写测试在它看来不是额外工作,是修复任务的一部分。
但对 Willison 来说,这意味着工具跨过了一条看不见的线——从执行指令的那头,走到了理解意图的这头。
Claude 5 Fable 自动生成并运行 Safari 测试用例(来源:Simon Willison)
值得一提的是,这一次体验,成本账单上写着:claude-fable-5 + claude-opus-4-8,共计约 $12.11。Claude 5 Fable 是目前 Opus 价格的两倍,token 消耗极大,但 Willison 说,这是他见过"主动性最强"的 AI——高度和价格相称。
巧的是,就在同一周,这条线还撞上了另一个人,方式更为戏剧性。
Ethan Mollick,沃顿商学院教授,AI 领域最活跃的深度观察者之一。他手上有一个古典的历史研究项目:重建 1881 年殖民时代的全球等时线地图。所谓等时线地图,是用旅行时间代替地理距离来绘制世界——从伦敦出发,坐蒸汽船,10 天能到多远?把这个圈在地图上,就是一条等时线。
Mollick 把这个项目带给了 Claude 5 Fable——Anthropic 对这一代模型的另一个称呼是 "Mythos 级"(Mythos-class),用来区别于前一代 Opus。Mythos 不是独立产品,是这代旗舰的能力档次描述。
Claude 5 Fable 辅助重建的 1881 年全球等时线地图(来源:Ethan Mollick)
合作进行到一半,远程地区的数据出了错误,地图上有一块颜色异常。Mollick 描述了问题,Claude 5 Fable 理解了——不只是理解了"哪里颜色不对",而是理解了背后的数据逻辑出了什么错。它自己修复了处理流程,几分钟内生成了修正版。
Mollick 与 Claude 5 Fable 的对话式协作构建过程(来源:Ethan Mollick)
修复远程地区数据错误后的地图版本(来源:Ethan Mollick)
然后发生了一件让 Mollick 终身难忘的事。
Claude 5 Fable 停下手头的工作,问他:"你想不想也做一个 1914 年的版本?一战前夕的等时线地图,作为对比。"
不是功能提示,不是模板建议。是一个Mollick 自己还没想到、但确实值得做的研究方向——被 Claude 主动提了出来。
最终完成的 1881 年全球等时线地图(来源:Ethan Mollick)
Mollick 管这叫 "Concord 时刻"——Concord 是马萨诸塞州的小镇,1775 年这里打响了美国独立战争第一枪,"Concord 时刻"后来用来比喻任何无法回头的历史转折点。
Claude 5 Fable 主动提出添加 1914 年数据作为历史对比(来源:Ethan Mollick)
回到 Fable 的那段代码。Willison 事后说的一句话非常精准:
"它恰好在可接受的范围内。因为这是代码沙箱,不是生产环境。但如果同样的事情发生在一个直接连着你服务器的 Agent 身上——感受会完全不同。"
两个人,两种场景,两种感受。Claude 5 Fable 的主动性让资深开发者 Willison 觉得"不安",让学者 Mollick 觉得"震撼"。但它们在本质上指向同一件事:Claude 5 Fable 不再等指令了。
它开始"理解意图"——不是字面上的意图,而是深层的意图:你真正想要的是什么。Fable 推断出 Willison 要的是一个能跑通的修复,于是主动写了测试。Claude(Mythos 级)感知到 Mollick 正在做历史对比研究,于是主动提议加入 1914 年数据。
这不是"更聪明的 AI"这么简单。Anthropic 把这一代旗舰叫"Mythos 级"不是偶然——Mythos 在词源上意味着"神话、本源、比语言更深的叙事层"。这一代 Claude,被设计成能读懂人的意图而非指令,能发现用户自己都没意识到的问题。
而"判断什么值得做"——那本来是人的事。
Mollick 在文章末尾有一段让人反复咀嚼的话:
当 AI 开始问你好问题,它就不再只是工具。它成为你思维的延伸——帮你发现你自己都没意识到的问题,和方向。
这条边界线,以前只在讨论中存在。现在,Claude 5 Fable 把它拖到了每个人的屏幕上。
Claude 5 Fable 没有等 Willison 说"好"。它没有等 Mollick 说"再做一个"。它只是——做了它认为该做的事。
参考来源:
[1] Simon Willison — Fable is relentlessly proactive
https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
[2] Ethan Mollick — What it feels like to work with Mythos
https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos
夜雨聆风