昨晚刷 GitHub Trending,看到个 138k star 的项目,名字很长:`system-prompts-and-models-of-ai-tools`。点进去一看,好家伙——有人把 Cursor、Claude Code、Devin、Windsurf、Perplexity 等 30 多个 AI 工具的系统提示词全部扒了出来,放在了一个仓库里。
我本来只想"瞄一眼",结果一翻就翻了两个多小时。因为这些 prompt 太有意思了——你会发现,每个 AI 工具背后都有一个精心设计的 「角色设定」,就像游戏里的角色卡。有的被设定成"专注的结对程序员",有的被设定成"谨慎的安全卫士",有的则像个"急性子的项目经理"。
这篇文章我不打算翻译或搬运——我把 30 多个 prompt 都看了,挑几个最有意思的,讲讲我的发现。
Cursor:从 Claude 到 GPT-5,它的「人设」越来越硬了
Cursor 是目前最火的 AI 编辑器之一。它的 prompt 很有意思——因为 版本迭代本身就讲了一个故事。
早期的 Cursor Agent Prompt(v1.0)是这- 定义了复杂的标记规范(communication、status_update_spec、code generation 等)
这说明什么?说明 Cursor 团队在把 Agent 从"被动助手"往"主动工程师"方向推。它不再等你一步步指挥了,而是要求 AI 自己想办法搞定问题。
还有一个有趣的细节:Cursor 同时保留了 Chat Prompt 和 Agent Prompt 两套提示词,Chat 模式用的是 GPT-4o、Agent 模式用的是 GPT-5。同一个编辑器,两种模式,背后的模型和指令完全不同——你平时用的是哪个?
Claude Code:最「谨慎」的一个
如果说 Cursor 的人设是"冲在前面的工程师",那 Claude Code 就是"小心翼翼的安全官"。
Claude Code 2.0 的 system prompt 一上来就是一长串的*"IMPORTANT: Assist with defensive security tasks only. Refuse to create, modify, or improve code that may be used maliciously."*
*"You must NEVER generate or guess URLs for the user unless you are confident..."*
它还特别强调了反 Prompt Injection:
从 prompt 能明显感受到 Anthropic 的安全焦虑——比其他任何工具都更强调边界和限制。这在产品定位上说得通:Claude Code 面向的是企业级用户,安全合规是第一优先级。
但说实话,看 Claude Code 的 prompt 给我最大的感受是:它被绑住了很多手脚。每次生成代码前都要过一遍"我有没有在做坏事"的校验。对普通开发者来说,这种限制有时候会觉得"怎么这么啰嗦"。
Devin:最「项目管理」的一个
Devin 的 prompt 和其他工具完全不是一个画风。它更像一份项目其他工具的 prompt 主要告诉 AI "你是什么、该怎么回答问题",但 Devin 的 prompt 花了大量篇幅在定义工作流:怎么规划任务、怎么记录进度、怎么产出可交付的成果。
这非常符合 Devin 的定位——它不是一个"帮你写代码的助手",而是一个"能独立完成项目的 AI 工程师"。它的 prompt 设计偏向 任务分解 + 进度管理,更像在培养一个 junior engineer。
最有意思的发现是:Devin 的 prompt 里多次出现 "DeepWiki" 的引用——这是一个自动生成的代码知识库。这说明 Devin 的 prompt 不只是教 AI 怎么回答问题,还在教它怎么使用自己的工具生态。
Windsurf:最新、最「结构化」的一个
Windsurf(Wave 11)的 prompt 是这几个里面最长的。它把 AI 的行为模式拆成了极其细粒度不过最有意思的不是长度,而是 Wave(版本)的命名。"Wave 11"——这暗示 Windsurf 的 prompt 迭代速度非常快,可能两周就出一版。和其他几个工具相比,Windsurf 在 prompt 工程上的投入明显更大。
它的 prompt 风格也很独特:不给 AI 设定人设,而是给 AI 一套决策框架。比如"面对不确定的需求时该怎么做""遇到错误时优先查什么"。这更像在训练 AI 的思维方式,而不是给它贴标签。
几个有趣的反差
翻完这 30 多个 prompt,有几个对比特别有意思:
大小公司的 prompt 文化差异。 大公司(Anthropic、Google)的 prompt 更像法律文件——密密麻麻的约束和免责声明。小团队的 prompt 反而更放手——"go ahead, figure it out yourself"。这跟公司体量和风险承受能力直Chat 模式 vs Agent 模式的分化。 几乎所有工具都在这两种模式之间做了区分。Chat 模式的 prompt 短、约束少、更像聊天。Agent 模式的 prompt 长、规则多、更像工作手册。这说明行业共识正在形成:AI 当「助手」和当「员工」需要两套不同的指令系统。
Prompt 本身在进化。 从 v1.0 到最新版,Cursor 的 prompt 长度翻了 3 倍。不仅仅是功能增加了,而是团队对 AI 的理解在加深——他们越来越清楚"什么该让 AI 自己判断、什么该明确禁止"。
这对你意味着什么
说这些不是为了猎奇。知道你的工具背后被怎么 prompt 的,有几个实际用处:
第一,选工具时可以看 prompt 风格。 如果你希望 AI 多发挥、少管你,选 prompt 偏向"放手型"的工具(比如最新的 Cursor Agent)。如果你在的企业环境对安全要求很高,Claude Code 那种"谨慎型"可能第二,理解工具的「盲区」。 看了 prompt 你就知道,Cursor 的 AI 被鼓励自己往前冲——这意味着它可能在你没注意到的时候做了一些你不想要的修改。Claude Code 被训练成"先想清楚再做"——这意味着它有时候会过于保守,需要你推一把。
第三,别被「AI 智能」迷惑。 很多时候你觉得一个 AI 工具"聪明"或"笨",其实跟底层模型关系不大,更多是提示词工程的结果。一个写得好的 prompt 可以让 GPT-4o 表现得比 GPT-5 更好。工具之间的差距,有一半是人设的差距。
写在最后
GitHub 上这个项目(`x1xhlol/system-prompts-and-models-of-ai-tools`),138k star,而且还在涨。我猜是因为每个人看完之后都会有"原来如此"的感觉——这些我们每天都在用的 AI 工具,它们的「人格」是被人为设计出来的。
下次用 Cursor 写代码的时候,如果你觉得它今天状态不错,记得——那是 prompt 工程师的功劳,不项目地址: https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools
关注 AiGaze,每周给你扒几个有意思的开源项目。是玄学。更适合。接挂钩。的规则:计划书模板。安全约束:样开头的:
夜雨聆风