你有没有发现,AI圈的人说话特别费劲?
明明是"写句话",非要说"提示词工程";明明是"给AI加点料",非要说"上下文工程";明明是"让AI自己干活",非要说"AI Agent"。
就像以前"裁员"叫"优化","加班"叫"赋能","没业绩"叫"长期主义"——人们总爱用高级词汇掩盖内容的普通。
但AI时代这几个流行词,还真不是装。它们每一个背后,都代表AI能力的质变。今天用最白话的方式,一次讲明白。
第一个词:提示词 Prompt
大模型刚出现时,就是个聊天机器人。你说"你好",它回"你好呀"。
你发给AI的那句话,就叫提示词(Prompt)。
就这么简单。但同样是说一句话,效果天差地别:
1. "帮我写篇文章" → AI给你一篇空话连篇的八股文
2. "你是一位10年经验的科技记者,帮我把这个AI话题写成1000字的深度稿,受众是零基础的普通读者,语言要轻松,多用类比" → AI给你一篇能直接发的文章
区别在哪?你给的指令越精准,AI的输出越靠谱。
后来厂商发现,有些设定不应该和用户说的话混在一起。比如"你是一个猫娘"这种角色设定,和用户问的"今天天气怎么样",逻辑上就是两回事。
于是提示词被分成了两层:
1. 系统提示词(System Prompt):AI的"人设",后台设定,用户一般看不到
2. 用户提示词(User Prompt):你在聊天框里打的字
你在ChatGPT里看到的"Customize ChatGPT"功能,其实就是让你间接修改系统提示词。
第二个词:提示词工程 Prompt Engineering
既然提示词的质量直接影响AI的表现,那研究怎么把提示词写好,就成了一个正经事——这就是提示词工程。
听起来很高端,但核心就三招:
第一招:Zero Shot(零样本)
只提要求,不给例子。
比如:"请仔细检查你的答案是否正确。"这就是零样本——你只说了"要仔细",没教它怎么仔细。
第二招:Few Shot(少样本)
先给几个例子,再让它照着做。
比如你想让AI把正常句子改成"猫娘体",先给它举例:"去吃饭吧"→"去吃饭好不好呀喵喵";"我写了个程序"→"我把程序写好了喵"。给了例子再让它改新句子,准确率直接拉满。
这招在需要AI稳定输出特定格式的场景下特别好用,比如写AI应用、做AI Agent的时候。
第三招:思维链 Chain of Thought
让AI"一步一步想"。
AI是个概率模型,算"1+2×3=?"这种题容易出错。但如果你加一句"请一步步拆解问题,给出每步中间结果",AI就会变成:"第一步先算2×3=6,第二步1+6=7"。准确率大幅提升。
现在ChatGPT等聊天机器人已经内置了这个功能,不需要你手动加那句话了。但原理都是一样的——通过提示词引导AI分步思考。
小结:提示词工程 = 精心设计你向AI提问的方式,获得更精准的回答。
2023年,这个技能火到炸——"提示词工程师"年薪25万美元起步,被称为"AI时代的翻译官"。但2026年,《华尔街日报》宣布这个独立职位"基本过时"。不是技能没用了,是它变成了人人都要会的基本功。就像打字一样——曾经是专业岗位,现在是默认技能。[来源]
第三个词:上下文 Context
说上下文工程之前,先得搞懂一个事实:AI模型本身没有记忆。
你每次给AI发消息,对它来说都是一次全新的独立请求。它不记得你上一句说了什么。
那为什么聊天机器人看起来"有记忆"呢?
因为聊天机器人(也就是AI应用)在背后做了手脚:
1. 你发消息给AI应用
2. AI应用把你的消息拼到完整的历史记录后面
3. 然后把这整段历史记录一次性发给AI模型
AI模型本身是失忆的,但它每次收到的都是完整对话,所以看上去就像有了记忆。
这段被一次性发给AI的完整历史记录,就叫上下文(Context)。
第四个词:上下文工程 Context Engineering
如果AI只是个简单的聊天机器人,提示词工程就够用了——用户总有机会通过新消息来修正AI的行为。
但AI Agent的出现,让事情变复杂了。
AI Agent不是一问一答,而是拥有一个工具箱,能自主调用工具——比如搜索网页、查数据库、读文件。用户只说了最开头那句话,AI可能在背后自主跑几十轮:搜索、读网页、再搜索、总结……
问题来了:
1. 上下文越来越长,塞满了搜索结果和中间信息
2. 用户只有最开头那一句提示词,中间几十轮用户完全无法干预
3. AI面对越来越长的上下文,很容易跑偏,忘记自己最初要干什么
怎么通过程序化的规则,自动管理和修改上下文,确保AI在漫长的自主行动中始终符合用户最初的要求?
这就是上下文工程要解决的核心问题。
上下文工程四招,招招管用
第一招:让AI学会记笔记
给AI一个"记笔记"的工具,再通过系统提示词教它怎么用:先分解任务、写下任务清单、每完成一项更新状态。
关键细节:笔记要放在上下文的开头或结尾。因为大模型用的是Transformer架构,对首尾信息最敏感——就像人看一长串文字,开头结尾印象最深。
写着核心任务目标的笔记和最初的提示词,始终处于最显眼的位置,AI就不容易跑偏。
第二招:丢掉老消息
直接砍掉太老的历史记录,只保留最近的。当然,最开始的系统提示词和用户提示词必须保留,不然AI就不知道自己要干什么了。
第三招:压缩
比直接丢弃更优雅的做法:让AI对老消息做总结,用精炼的摘要替换原文。
更高级的压缩:遇到超长的搜索结果(比如一篇上万字的文章),先存进向量数据库,在上下文中只留一句"文章已存入知识库,你可以查询片段"。几万字瞬间压缩成一句话。
第四招:从源头减少信息量
比如浏览网页的工具,返回给AI之前先去掉HTML标签、广告、无关内容,只保留核心文字。上下文还没变长,就从源头控制住了。
一张图看懂四个词的关系
| 概念 | 一句话解释 | 打个比方 |
|---|---|---|
| 提示词 | 你跟AI说的话 | 给服务员点菜 |
| 提示词工程 | 研究怎么把话说好 | 学会精准点菜 |
| 上下文 | AI每次收到的完整信息 | 服务员记住你之前的单子 |
| 上下文工程 | 管理这些信息,让AI不跑偏 | 服务员帮你筛选、总结之前的需求 |
为什么你需要知道这些?
2023年,"提示词工程师"是硅谷最火的职位,年薪25万美元。2026年,这个独立职位"基本过时"了。但不要误会——不是技能没用了,是它扩散成了所有人的基本功。
LinkedIn数据显示,要求提示词技能的岗位在2024到2026年间增长了135.8%,只是它不再单独挂牌,而是被写进了AI工程师、产品经理、内容策略师等各种职位里。[来源]
而上下文工程,是比提示词工程更深层的能力——它解决的是"AI自己干活时你怎么管住它"的问题。这是AI Agent时代真正的核心技术。
小学时老师问我们长大想做什么,我在作业本上写下"当老师",因为我觉得他们是超人,什么都懂,什么都能讲得明明白白。
也不知道老师当时花了多少心思,到底用了什么神奇的方法,几十年后我依然还记得。
上下文工程做的事,本质上和老师是一样的:让AI在漫长的行动中,始终记得自己最初的任务。
夜雨聆风