重新理解 AI 系列04:Prompt 不是咒语,而是任务说明书

副标题：从“会提问”到“会交代任务”，理解 Prompt Engineering 的真正价值与边界

图注：Prompt 的价值不是神秘咒语，而是把任务交代清楚，让模型少猜。

引言：为什么“换个问法”，AI 就像换了个水平？

如果你用过一段时间 AI，大概率会有过这种体验。

你随手问一句：

帮我写一个产品方案。

AI 很快就会给你一份看起来挺完整的方案：背景、目标、用户、功能、流程、风险，一个都不少。

但你读完会发现，它好像什么都说了，又好像什么都没真正说到。文字是通顺的，结构是完整的，可放到你的具体业务里，并不太能用。

于是你换一种问法：

我们要给连锁门店做一个会员运营工具，目标用户是区域运营经理。当前痛点是活动配置复杂、门店执行不可控、复盘数据分散。请写一版给业务负责人的产品方案，重点说明目标、核心流程、关键功能和风险，语气不要太技术化。

这一次，AI 的回答明显不一样了。它更贴近业务场景，也更知道该强调什么、不该展开什么。

你可能会有点惊讶：只是换了个问法，AI 怎么就像换了个水平？

这就是很多人第一次接触 Prompt Engineering 时的兴奋感。

于是，各种“神奇提示词”“万能 Prompt”“让 AI 智商提升 10 倍的咒语”开始流行起来。

但我觉得，Prompt 确实重要，只是它重要的原因并不神秘。

它不是暗号，而是在改变模型这一次生成时的任务条件。

在《重新理解 AI 01：LLM 是什么？不是搜索引擎，也不是数据库》里，我们讨论过，LLM 不是在答案库里查答案，而是基于当前输入生成回答。

在《重新理解 AI 系列02：LLM 是怎么选出下一个 Token 的？》里，我们进一步拆开过这个过程：模型的回答，是一个 token 一个 token 生成出来的。

在《重新理解 AI 系列03：为什么 AI 会一本正经地胡说八道？》里，我们又讨论了幻觉：语言上顺滑、结构上完整，不代表事实上一定正确。

把这三点放在一起，就能理解 Prompt 为什么有用：

如果模型每一步都在基于当前输入生成，那么你给它什么输入，它就会沿着什么条件去生成。

所以这一篇，我们先不急着进入更复杂的 Context Engineering、RAG、工具调用和 Agent。

我们先把最贴近日常使用的一层讲清楚：

Prompt Engineering 到底在解决什么问题？

我希望通过这篇文章，和你一起建立一个更稳的直觉：

Prompt 不是咒语，而是任务说明书。它的价值，是减少模型对任务目标、输出形式和判断标准的猜测。

一、Prompt 为什么真的有用？

我们先承认一件事：Prompt 真的有用。

同一个模型，面对不同的提示方式，确实可能给出完全不同质量的回答。

但这不是因为某个神秘句式“激活”了模型。

更朴素的解释是：

Prompt 是模型当前输入的一部分，它会影响模型如何理解任务、选择回答路径、控制输出形式。

如果你只说“写个方案”，模型大概率会生成一个最常见、最安全、最不容易出错的通用版本。它不会太离谱，但也不会太贴身。

因为它不知道你的行业、读者、目标，也不知道这份方案更像内部汇报、销售材料，还是产品需求说明。

人类协作也是一样。

你让一个同事“帮我写份方案”，他大概率也要反问你：写给谁？什么背景？要解决什么问题？什么时候要？要多详细？老板关心什么？研发关心什么？

如果这些都不说清楚，对方只能猜。

AI 也是在猜，只是它猜得很快、很顺、很像那么回事。

Prompt 的作用，就是减少这种猜测。

你补充目标、受众、格式、边界和评价标准，模型就更容易知道：

这一次到底要做什么。

所以，Prompt 有用，不是因为它是咒语，而是因为它让模型更清楚任务。

图注：Prompt 不是激活模型的暗号，而是在减少模型对任务的猜测。

二、好 Prompt 首先不是好句子，而是好任务说明

很多人一说到 Prompt，就会下意识去找“更高级的句式”：

要不要写“你是一位世界级专家”？

要不要说“深呼吸，一步一步思考”？

要不要加一句“如果你做得好，我会给你奖励”？

这些句子有时可能有点用，有时只是心理安慰，有时还会把提示词变得很啰嗦。

我觉得，真正值得先抓住的，不是句式，而是任务说明。

一个好 Prompt，通常至少要交代五件事。

第一，目标：你希望 AI 完成什么？

是解释概念、写文章、改代码、做总结、提炼观点，还是设计流程？目标越模糊，AI 越容易生成一份“看起来有内容，但不一定是你要的东西”。

第二，角色：你希望它以什么视角处理问题？

这不是让模型真的变成某个人，而是给它一个观察角度。比如“代码审查者”会更关注风险、边界和测试，“公众号编辑”会更关注可读性、节奏和读者理解。

第三，背景：这件事发生在什么场景里？

面向谁？为什么要做？前面已经发生了什么？很多 AI 回答之所以空，不是因为它不会写，而是因为它不知道这件事发生在哪里。

第四，约束：哪些必须遵守？哪些不能做？

比如只能基于给定材料，不要发散；比如不要堆术语；比如输出要适合给业务负责人看。

第五，输出：最终结果要长什么样？

是列表、表格、邮件、文章、PRD、代码片段，还是一份可以直接继续加工的正文？

我们看一个对比。

弱 Prompt：

帮我写一篇 AI 文章。

这个问题不是不能答，但它给 AI 留下了太多猜测空间。

更好的 Prompt：

我在写一个面向 AI 初学者的公众号系列，这一篇要解释 Prompt Engineering 的价值和边界。读者不是专业研究人员，但已经用过 ChatGPT、Claude 或 Cursor。请用作者和读者对话的方式写一篇文章草稿，避免堆术语，重点说明 Prompt 不是咒语，而是任务说明书。

你看，后一个 Prompt 并没有什么神秘词汇。

它只是把目标、读者、背景、风格和边界说清楚了。

所以，好 Prompt 的价值不是让模型更会猜，恰恰相反：

好 Prompt 的价值，是让模型少猜。

三、经典结构化提示词框架：它们有用，但不是因为缩写神奇

说到这里，就可以理解为什么网上会出现很多结构化提示词框架。

比如 RTF、RACE、CO-STAR。

这些框架看起来都是首字母缩写，很容易给人一种“掌握公式就掌握 Prompt Engineering”的感觉。

但我觉得，它们真正有用的地方，不在缩写本身。

它们更像一张防漏清单，提醒你别只丢一句模糊问题，而要把任务里最关键的几个部分补齐。

先看最简单的 RTF。

RTF 通常可以理解为：

• Role：让模型以什么角色或视角处理任务。
• Task：具体要完成什么任务。
• Format：输出成什么格式。

比如：

你是一名产品顾问。请帮我分析下面这个会员运营工具的核心功能，并用表格输出“功能、用户价值、实现风险”三列。

这里面就有 Role、Task、Format。

它简单、好记，适合初学者快速避开“帮我看看”“帮我写写”这种过于模糊的说法。

再看 RACE。

RACE 可以理解为：

• Role：角色或处理视角。
• Action：希望模型执行什么动作。
• Context：相关背景和材料。
• Expectation：期待的结果、标准或边界。

它比 RTF 多强调了背景和期待。

比如：

你是一名公众号编辑。请基于下面这篇草稿，帮我检查表达是否顺畅。背景是：这是一篇给 AI 初学者看的系列文章。我的期待是：保留作者和读者交流的语气，不要改成学术论文风格；重点指出重复、跳跃和生硬的地方。

这个 Prompt 里，模型就不只是知道“要修改文章”，还知道为什么改、按什么标准改。

再看 CO-STAR。

CO-STAR 通常可以拆成：

• Context：背景。
• Objective：目标。
• Style：风格。
• Tone：语气。
• Audience：受众。
• Response：输出形式。

它特别适合写作、汇报、邮件、营销文案、公众号文章这类任务，因为这些任务不仅关心“说什么”，还很关心“对谁说、怎么说、用什么语气说”。

比如写一封邮件，给老板、给客户、给同事、给用户，哪怕内容差不多，语气也会完全不同。

CO-STAR 这类框架提醒我们的，就是不要只交代内容，也要交代受众、风格和输出形式。

不过，我想强调一点：

这些框架不是官方标准，也不是唯一答案。

网上类似框架很多，名字不同，拆法不同，侧重点也不同。你不用纠结哪个才是“正宗”。

关键是理解它们背后的共同逻辑：

结构化 Prompt 框架不是答案，而是检查表。它帮你发现：目标有没有说清楚？背景有没有给够？输出标准有没有交代？

如果你理解了这一点，就不会被缩写绑住。

你可以用 RTF，也可以用 RACE，也可以用 CO-STAR，也可以自己形成一套更适合自己工作的检查清单。

真正重要的不是缩写，而是任务是否被交代清楚。

图注：RTF、RACE、CO-STAR 的价值，不在缩写，而在提醒你补齐任务信息。

四、角色、示例、格式和步骤，分别在起什么作用？

除了这些结构化框架，Prompt Engineering 里还有几类非常常见的技巧。

比如角色设定、给示例、指定格式、要求分步骤。

这些技巧也不是魔法。它们的共同作用，还是降低任务的不确定性。

先说角色设定。

当你说“你是一名资深产品经理”“你是一名代码审查者”“你是一名科普作者”时，模型并不会真的变成那个人。

但它会更倾向于按照这个角色常见的表达方式和判断标准来回答。

“代码审查者”会让它更关注 bug、风险、测试和边界条件。

“科普作者”会让它更关注例子、类比和读者理解。

“投资人”会让它更关注市场、增长、商业模式和风险。

所以，角色设定的价值不是换皮，而是给模型一个回答视角。

再说 Few-shot 示例。

Few-shot 的意思，可以简单理解为：你给模型几个输入输出示例，让它照着这个模式继续完成类似任务。

比如你要它把用户反馈分类，不只是告诉它“请分类”，而是给它几条样例：

输入：页面加载太慢，每次打开都要等很久。
输出：性能问题

输入：我找不到订单退款入口。
输出：功能可发现性问题

这样模型就更容易理解你期待的分类方式。

示例不是给它抄答案，而是让它看见你希望的模式。

再说格式约束。

如果你需要表格，就明确说表格。

如果你需要 JSON，就明确字段。

如果你需要文章，就说明标题、小标题、段落节奏。

格式约束会让模型知道答案应该组织成什么形状，尤其适合摘要、清单、表格、邮件、PRD、代码配置这类任务。

最后说分步骤要求。

这类提示常见于分析、检查、规划、推理任务。

比如：

先指出这段论证的核心观点，再检查逻辑跳跃，最后给出修改建议。

这比单纯说“帮我改一下”清楚得多，因为它把任务拆成了几个可执行的动作。

这些技巧表面上看起来很多，但底层逻辑其实很一致：

它们不是在触发模型隐藏能力，而是在告诉模型：你应该按什么视角、什么模式、什么格式、什么步骤来完成这件事。

图注：角色、示例、格式和步骤，本质上都在降低任务不确定性。

五、为什么提示词模板有用，但不能迷信模板？

理解了前面这些，我们就能更平衡地看待提示词模板。

提示词模板当然有用。

对初学者来说，它能提醒你别忘了角色、目标、背景、约束和输出格式；对重复任务来说，它也能减少很多重复沟通。

比如你经常让 AI 总结会议纪要、改写文章、检查代码、生成周报，一套固定模板确实能省心。

但模板也很容易让人偷懒。

你以为自己用了一个很高级的 Prompt，实际上只是套了一个很长的壳。

模板不理解你的真实任务。

它不知道你这次要写给谁，哪些材料最重要，哪些限制是硬边界，也不知道什么才算这次任务的好结果。

更麻烦的是，有些模板太长、太泛、太用力。

它会要求模型“从 10 个维度深度分析”“给出极其全面的答案”“像世界顶级专家一样思考”。

听起来很厉害，但如果你的任务只是写一篇轻量公众号文章，模型可能会被带成一篇又重又散的报告。

模板还可能带来无关约束。

比如你只是想让模型帮你润色一段话，但模板里要求它输出背景分析、风险评估、行动计划。结果模型就会做很多你并不需要的事情。

所以，模板是脚手架，不是自动驾驶。

真正会用 Prompt，不是收藏更多模板，而是知道什么时候该删、该改、该补。

如果模板帮你补齐任务信息，它就是有用的；如果模板开始掩盖任务本身，它就变成了噪声。

六、那些早期有用的“咒语”，为什么越来越没用了？

现在我们可以回到标题里的“咒语”。

早期使用大模型时，确实有很多提示词看起来很神奇。

比如：

Let's think step by step.

或者：

你是一位世界顶级专家，请深呼吸，认真思考，不要犯错。

再或者一些更夸张的说法：如果你回答得好，会得到奖励；如果你回答错了，会造成严重后果。

我们不必嘲笑这些提示词。

在早期模型上，它们有时候确实能改善输出。

比如 Kojima 等人在 2022 年提出的 Zero-shot-CoT，就展示过在问题后面加入 “Let's think step by step” 这类简单提示，可以提升一些推理任务上的表现。

为什么会这样？

因为当时很多模型对指令跟随、步骤拆解、格式控制、不确定性表达的能力还没那么稳定。用户显式提醒“分步骤”“认真检查”“不要编造”，确实可能把模型拉到一个更好的输出方向上。

但现在，情况正在变化。

随着模型训练、指令微调、对齐方式和产品层系统提示不断升级，很多过去需要用户显式写出来的“咒语”，正在变成模型默认更容易做到的能力。

比如，早期你可能需要反复提醒模型“按步骤分析”，现在很多模型本来就更擅长拆解复杂任务；早期你可能需要强调“请严格按照格式输出”，现在模型的格式跟随能力也普遍更强。

早期你可能要写一大段角色设定，模型才会进入某种回答风格；现在很多时候，只要给出明确任务视角，它就能理解你要它怎么处理。

早期你还可能反复说“不要编”，现在模型更容易表达不确定性，但这仍然不能替代事实来源。

所以，不是说这些提示词完全没用。

更准确的说法是：它们的边际价值在下降。

过去一些“咒语”可能是显著提升模型表现的技巧，现在更多时候只是锦上添花，甚至有时是多余的噪声。

对新模型来说，越是空泛、神秘、情绪化的句子，越不如清楚的目标、材料、约束和验收标准有用。

我更愿意这样总结：

模型越强，越不需要你用咒语把它“唤醒”；但它仍然需要你把任务交代明白。

这也是 Prompt Engineering 正在发生的变化：

从“寻找神奇句式”，转向“设计清晰任务”。

七、Prompt 的边界：它不能替代事实、上下文和验证

讲到这里，我们已经比较清楚 Prompt 为什么有用。

但也正因为它有用，很多人容易高估它，仿佛只要提示词写得足够好，事实、材料、验证都会自动补齐。

Prompt 可以改变模型怎么回答，但它不能凭空提供模型没有看见的事实。

你让模型：

请不要编，认真回答。

这当然比什么都不说要好。

但如果它没有可靠资料，它最多更谨慎，不代表一定更正确。

你让模型：

请基于最新资料回答。

听起来很严谨。

但如果你没有给它最新资料，它也没有接入检索或工具，那这句话并不会自动把最新事实变出来。

你让模型：

请严格按照官方文档写代码。

也很好。

但如果官方文档没有进入它的上下文，它就只能根据训练中见过的模式和已有知识来回答。遇到版本差异、小众库、新接口，就很容易出问题。

你让模型：

请仔细检查这段代码有没有 bug。

它可以分析，但如果没有运行测试、没有看到依赖、没有完整调用场景，它仍然可能漏掉关键问题。

这就回到了第三篇讲过的幻觉。

AI 可以生成看起来合理的文本，但事实正确性不是自动附赠的属性。

Prompt 能让模型更谨慎、更聚焦、更符合你的任务意图。

但它不能替代事实材料、外部文档、工具执行、结果验证，也不能替代人类在高风险问题上的判断。

所以，Prompt 的边界可以用一句话说清楚：

Prompt 能减少模型乱走的概率，但不能把不存在的地面变成可靠道路。

当任务需要事实材料、项目背景、历史状态、外部文档和执行结果时，问题就不只是“怎么写 Prompt”了。

问题会变成：

模型到底看见了什么？

这就自然进入下一层：上下文。

图注：Prompt 可以减少模型乱走的概率，但不能替代事实、上下文、工具和验证。

八、从 Prompt 到上下文：真正的下一步是什么？

Prompt Engineering 是使用 AI 的入口。

它教我们不要只丢一句模糊问题，而要把任务交代清楚。

但当任务变复杂时，Prompt 本身会变成上下文的一部分。

真正影响模型表现的，不只有你写给它的那一句指令，还包括它看见的材料、历史、文件、系统规则、工具结果、任务状态和验证标准。

比如你让 AI 写文章，Prompt 可以告诉它写给谁、写什么、什么风格、什么篇幅。但如果这是一篇系列文章，它还需要知道前几篇讲过什么、这一篇应该接住哪个问题、哪些内容不要重复。

比如你让 AI 改代码，Prompt 可以告诉它修复 bug、不要改无关逻辑。但它还需要看到相关文件、错误日志、测试结果、依赖版本和项目约定。

比如你让 AI 分析政策，Prompt 可以告诉它请严谨分析影响。但它还需要看到政策原文、适用地区、公司业务、时间范围和不确定信息。

所以，下一步不是否定 Prompt，而是把 Prompt 放回更大的框架里。

Prompt 是你对 AI 说的话，上下文是 AI 这一次完整看见的世界。

如果 Prompt 是任务说明书，那么上下文就是任务发生的现场。

说明书写得再清楚，如果现场材料不全，任务还是可能做错。

这就是为什么我们还要继续讨论 Context Engineering。

但在这篇文章里，我们先收住。

先把最重要的一点带走：

会写 Prompt，不是会念咒语，而是会把事情交代明白。

结语：好 Prompt 的本质，是让 AI 少猜

在本文中，我们讨论了 Prompt Engineering。

它并不是一套神秘咒语，也不是万能模板集合。

它的真正价值，是让模型少猜：少猜你要它做什么，少猜应该以什么视角做，少猜输出成什么样，也少猜哪些边界不能越过。

RTF、RACE、CO-STAR 这些结构化提示词框架是有用的，但它们不是万能公式，而是检查表。

角色设定、Few-shot 示例、格式约束、分步骤要求，也不是魔法，而是在帮助模型降低任务不确定性。

早期一些看起来有效的提示词“咒语”，随着模型能力提升，正在逐渐失去魔法。

模型越来越不需要你用夸张句式把它唤醒，但它仍然需要你把任务说清楚。

同时，我们也要记住 Prompt 的边界：

它不能凭空提供事实，不能替代上下文，不能替代工具，也不能替代验证。

所以，好 Prompt 的关键，不是把话说得更玄，而是把任务说得更清楚。

最后，我想把这一篇收在一句话上：

Prompt 不是咒语。它是你递给 AI 的第一份任务说明书。

参考资料

• Takeshi Kojima et al., Large Language Models are Zero-Shot Reasoners, 2022. https://arxiv.org/abs/2205.11916
• OpenAI, Prompt Engineering Guide. https://platform.openai.com/docs/guides/prompt-engineering
• OpenAI Help Center, Best practices for prompt engineering with the OpenAI API. https://help.openai.com/en/articles/6654000-how-to-prompt-chatgpt
• Anthropic, Claude 4 Prompt Engineering Best Practices. https://docs.anthropic.com/zh-CN/docs/build-with-claude/prompt-engineering/claude-4-best-practices
• GovTech Singapore, Mastering the art of prompt engineering with Empower. https://www.tech.gov.sg/media/technews/mastering-the-art-of-prompt-engineering-with-empower/