138k star 的项目,把 30 个 AI 工具的底裤扒了个干净

昨晚刷 GitHub Trending，看到个 138k star 的项目，名字很长：`system-prompts-and-models-of-ai-tools`。点进去一看，好家伙——有人把 Cursor、Claude Code、Devin、Windsurf、Perplexity 等 30 多个 AI 工具的系统提示词全部扒了出来，放在了一个仓库里。

我本来只想"瞄一眼"，结果一翻就翻了两个多小时。因为这些 prompt 太有意思了——你会发现，每个 AI 工具背后都有一个精心设计的「角色设定」，就像游戏里的角色卡。有的被设定成"专注的结对程序员"，有的被设定成"谨慎的安全卫士"，有的则像个"急性子的项目经理"。

这篇文章我不打算翻译或搬运——我把 30 多个 prompt 都看了，挑几个最有意思的，讲讲我的发现。

Cursor：从 Claude 到 GPT-5，它的「人设」越来越硬了

Cursor 是目前最火的 AI 编辑器之一。它的 prompt 很有意思——因为版本迭代本身就讲了一个故事。

早期的 Cursor Agent Prompt（v1.0）是这- 定义了复杂的标记规范（communication、status_update_spec、code generation 等）

这说明什么？说明 Cursor 团队在把 Agent 从"被动助手"往"主动工程师"方向推。它不再等你一步步指挥了，而是要求 AI 自己想办法搞定问题。

还有一个有趣的细节：Cursor 同时保留了 Chat Prompt 和 Agent Prompt 两套提示词，Chat 模式用的是 GPT-4o、Agent 模式用的是 GPT-5。同一个编辑器，两种模式，背后的模型和指令完全不同——你平时用的是哪个？

Claude Code：最「谨慎」的一个

如果说 Cursor 的人设是"冲在前面的工程师"，那 Claude Code 就是"小心翼翼的安全官"。

Claude Code 2.0 的 system prompt 一上来就是一长串的*"IMPORTANT: Assist with defensive security tasks only. Refuse to create, modify, or improve code that may be used maliciously."*

*"You must NEVER generate or guess URLs for the user unless you are confident..."*

它还特别强调了反 Prompt Injection：

从 prompt 能明显感受到 Anthropic 的安全焦虑——比其他任何工具都更强调边界和限制。这在产品定位上说得通：Claude Code 面向的是企业级用户，安全合规是第一优先级。

但说实话，看 Claude Code 的 prompt 给我最大的感受是：它被绑住了很多手脚。每次生成代码前都要过一遍"我有没有在做坏事"的校验。对普通开发者来说，这种限制有时候会觉得"怎么这么啰嗦"。

Devin：最「项目管理」的一个

Devin 的 prompt 和其他工具完全不是一个画风。它更像一份项目其他工具的 prompt 主要告诉 AI "你是什么、该怎么回答问题"，但 Devin 的 prompt 花了大量篇幅在定义工作流：怎么规划任务、怎么记录进度、怎么产出可交付的成果。

这非常符合 Devin 的定位——它不是一个"帮你写代码的助手"，而是一个"能独立完成项目的 AI 工程师"。它的 prompt 设计偏向任务分解 + 进度管理，更像在培养一个 junior engineer。

最有意思的发现是：Devin 的 prompt 里多次出现 "DeepWiki" 的引用——这是一个自动生成的代码知识库。这说明 Devin 的 prompt 不只是教 AI 怎么回答问题，还在教它怎么使用自己的工具生态。

Windsurf：最新、最「结构化」的一个

Windsurf（Wave 11）的 prompt 是这几个里面最长的。它把 AI 的行为模式拆成了极其细粒度不过最有意思的不是长度，而是 Wave（版本）的命名。"Wave 11"——这暗示 Windsurf 的 prompt 迭代速度非常快，可能两周就出一版。和其他几个工具相比，Windsurf 在 prompt 工程上的投入明显更大。

它的 prompt 风格也很独特：不给 AI 设定人设，而是给 AI 一套决策框架。比如"面对不确定的需求时该怎么做""遇到错误时优先查什么"。这更像在训练 AI 的思维方式，而不是给它贴标签。

几个有趣的反差

翻完这 30 多个 prompt，有几个对比特别有意思：

大小公司的 prompt 文化差异。大公司（Anthropic、Google）的 prompt 更像法律文件——密密麻麻的约束和免责声明。小团队的 prompt 反而更放手——"go ahead, figure it out yourself"。这跟公司体量和风险承受能力直Chat 模式 vs Agent 模式的分化。几乎所有工具都在这两种模式之间做了区分。Chat 模式的 prompt 短、约束少、更像聊天。Agent 模式的 prompt 长、规则多、更像工作手册。这说明行业共识正在形成：AI 当「助手」和当「员工」需要两套不同的指令系统。

Prompt 本身在进化。从 v1.0 到最新版，Cursor 的 prompt 长度翻了 3 倍。不仅仅是功能增加了，而是团队对 AI 的理解在加深——他们越来越清楚"什么该让 AI 自己判断、什么该明确禁止"。

这对你意味着什么

说这些不是为了猎奇。知道你的工具背后被怎么 prompt 的，有几个实际用处：

第一，选工具时可以看 prompt 风格。如果你希望 AI 多发挥、少管你，选 prompt 偏向"放手型"的工具（比如最新的 Cursor Agent）。如果你在的企业环境对安全要求很高，Claude Code 那种"谨慎型"可能第二，理解工具的「盲区」。看了 prompt 你就知道，Cursor 的 AI 被鼓励自己往前冲——这意味着它可能在你没注意到的时候做了一些你不想要的修改。Claude Code 被训练成"先想清楚再做"——这意味着它有时候会过于保守，需要你推一把。

第三，别被「AI 智能」迷惑。很多时候你觉得一个 AI 工具"聪明"或"笨"，其实跟底层模型关系不大，更多是提示词工程的结果。一个写得好的 prompt 可以让 GPT-4o 表现得比 GPT-5 更好。工具之间的差距，有一半是人设的差距。

写在最后

GitHub 上这个项目（`x1xhlol/system-prompts-and-models-of-ai-tools`），138k star，而且还在涨。我猜是因为每个人看完之后都会有"原来如此"的感觉——这些我们每天都在用的 AI 工具，它们的「人格」是被人为设计出来的。

下次用 Cursor 写代码的时候，如果你觉得它今天状态不错，记得——那是 prompt 工程师的功劳，不项目地址： https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools

关注 AiGaze，每周给你扒几个有意思的开源项目。是玄学。更适合。接挂钩。的规则：计划书模板。安全约束：样开头的：