乐于分享
好东西不私藏

应用级AI的核心或许就是提示词架构

应用级AI的核心或许就是提示词架构

我在上篇文章提到了应用级AI以及我自身角度给出的定义。刚好这段时间也看到了一些关于Claude Code 逆向工程分析的资料,也间接印证了我心中所想。
提示词工程并未消失,而是升级为更高级的形态,我称之为提示词架构,而这个提示词架构在我看来就是通往应用级AI的核心。而我把提示词的概念定义也从狭义的对话内容,扩展为广义的用户问题和大模型之间沟通的一套语言规范。
我先申明我的观点,我始终坚持纯粹基于现有预测模式的AI为核心的系统构建是不可靠的,只有以传统软件架构为核心,AI作为辅助的方式才能够建立有足够确定性的应用级AI。
从GPT开始回顾提示词工程的演化。
从最初GPT开始,我们跟AI对话的内容称之为提示词,那时候如何跟AI对话成了核心关键,掌握了提示词方法的人,能够从AI拿到更好的结果,还催生出提示词工程师的岗位,我们甚至一度把提示词看作是公司的核心资产之一。这一状况持续到DeepseekR1的横空出世。
现在回头来看,DeepseekR1的推理链从最终结果上看,也是相当于围绕提示词进行的。在这之前所谓的提示词工程其实就是掌握预测的关键特征,从而更好地拿到结果,那么从问题到有结构的提示词工程结果中间能否创造一个“转换扩展器”?而推理链就是在大模型的内部入口插入了一个推理过程,这个推理的过程其目的就是为了更好地推测用户的问题,其结果就是将用户的问题进行细化,再往后传递,效果是显而易见的,DeepseekR1得到了非常好的市场反馈,这一伟大的发明为AI的普及做出了极大的贡献。
我们现在已经感受到,在AI领域除了发展AI模型本身的能力之外,还需要考虑在人与AI之间构建一条稳固的通道,来让人与AI的协同更加的顺畅。
我们在不久的之前,还习惯了在跟AI对话之前先说一句:“你是一位资深的XXX”,直到智能体的诞生。智能体则是将系统角色定义固化,当人们跟AI对话时,自动附带角色定义给到大模型,从而达到更好的角色化效果。所以智能体也还是提示词工程实践的一种形式。
再后来我们发现AI的上下文有限,导致我们与之对话的内容无法更好地延续。但是随着实际生产生活的需要,我们不再局限于只是跟AI进行对话,但是实际需求本身又比较复杂,所以人们发明了将需求先拆分再分步骤咨询的方法。于是就有了任务拆分和智能体协同的概念,其本质就是约束提交给AI的内容,使其在某一个特定问题的回答上得到更好的结果。按照拆分的步骤一步步执行下去得到最终的结果,以此来完成一个复杂的任务。
再后来,这种拆分被发展为计划模式,还有专家模式等等,叫法虽然不同,本质就是让AI先进行拆分。
随着AI的不断深入使用,后来也发展出工具调用,MCP,工作流等方法,这些跟今天的主题关系不强,我们略过,工具调用为AI编程提供了很好的思路,既然可以调用外部工具了,可操作空间就很大了,如果让AI回答问题之前,先查询外部信息来弥补模型数据训练滞后的问题,这就可以极大地提高问题回答的准确率,同时也让AI的回复超出人们的预期,所以这就是后来为什么大家觉得传统搜索引擎会被替代。那么这个其实也是提示词的一种扩展。但是这种扩展不是对大模型的扩展,而是我们不再把大模型看作是一个孤立的运算单元,而是将大模型以及围绕大模型构建的外围工具看作是一个整体。这样提示词的目的就不再是只服务于大模型,而是应该作用于这个整体,这就是我说的广义的提示词概念,提示词不再是对话内容,而是定义了如何跟大模型进行交互。
这种看作整体的认知是一个很大的突破,后来就出现了Manus的出现,还有AI编程的雏形。当我们发现对于问题的拆解不应该只考虑大模型,而是应当回归到本质。
我们实际上是为了解决客户提出的问题,大模型的能力是理解并获取更详细的匹配信息,如果再加上外围工具,那我们就可以抽象出这样一个应用框架:让AI理解人类语言,找到问题的解决方案,并将方案转化为任务,交给外部工具完成实际的操作。
以下分两条线路,AI编程龙虾机器人
AI编程里的代码补全这个可以看作是对话的一种集成应用,我们不做过多的说明,今天我们就说说Codex和Claude这类工程化的AI编程。这两者的核心其本质就是先优化自家的模型,让其对编程相关工具的调用更加的契合,然后再设计一套工程架构规范,更好地去配合自家模型的调用。
如果只是大模型适配,但工程师用得不好,效果还是大打折扣。
本质还是提示词的问题。
但是如果制定一套工程规范,你按照规范去操作,那么这个模型优化的效果就很容易凸显出来了,只要开发者尝到甜头,就会对规范保持信任,持续不断地迭代下去。所以他们一方面在卖Token,另一方面最重要的是在制定AI编程的工程规范。
既当裁判员,又当运动员。
很多人在这些编程工具里调用其他家的模型发现总有些不得劲,模型虽有差距,但本质就是在人家的主场,怎么适配那才是核心,大家技术差距并不是很大,也许就是场“田忌赛马”。所以即便代码泄露了又如何,也许人家要的就是自家规范的普及。这里或许有人就会反驳,这里我不做过多解释,后续我会再发一篇文章来阐述未来模型一定会向着非RAG方向的专业化发展。
当然,从Claude Code的逆向工程来看,其设计确实还是很巧妙的,父子结构的调度模式,有种特别熟悉的感觉。在高并发架构的一种设计就是父进程负责派发任务和监听返回,任务由子进程Worker执行,鼎鼎大名的Nginx就是这样的。
还有对于问题的处理,既是对话记忆,也是任务拆解的前提,在这之上衍生出知识库的概念,比如针对记忆的,针对项目的,针对任务的,而这些又得益于工程架构规范的设定,所以只要确定好,存放在哪里,从哪里读取,处理好并发问题,多少智能体协同都不是问题,工作空间就是基于规范的共享空间。
说了这么多,跟提示词有啥关系呢?
我们这么来看这个问题,我今天让AI开发一个XXX管理系统。我们同样知道,单凭这句话是没办法完成的,所以开发者就拆分任务,就跟以前跟AI对话拆分步骤一样,假如我拆分的足够细致,是不是就相当于我在不断完善我的提示词,也就是产品设计文档。然后我需要一个个手动按照步骤发给AI,有些任务虽然可以并行,但是我只能自己一个个录入。所以你看吧,所谓的工程规范模板就是把提示词结构化了,并且让人们按照设定好的规则进行填充,只要确保共享空间的数据一致性,不断多少人,多少智能体在执行都没问题。当然规范设定好了不止这一个好处,还可以构建权限,安全,分布式协同等等,不过这些不属于我定义的提示词范畴,不做过多描述。最终这些类似于产品文档的内容就是指导AI完成工作的设计文档,只是说这种设计文档跟以往的PRD的区别就是一个给人看,一个是给AI“看”的。
所以这类AI编程工具的本质就是实现了提示词的结构化,什么人才能够做到可以将提示词结构化到适配到这个世界上绝大多数项目开发?这个人首先得熟悉软件开发流程,同时也清楚怎么跟AI沟通可以拿到很好的结果,结合起来就是提示词架构师。
再看看“龙虾机器人”,也在这个提示词扩展认知之上完全跳出提示词+大模型这种模式,回归到解决人类问题本身来。既然AI作为意识中枢,外部工具完成实际操作这种模式可行,那么干脆直接就构建一个以AI为大脑,外部工具为手的应用,为了让大脑更好的指挥“手”,就要定义控制的指令,这个指令就是技能。只需要让发出的指令遵循一个固定的规范,大脑就可以按照规范调动越来越多的不同业务场景下的外部工具。
龙虾比工程规范的适用范围更加的宽泛,因为它不限制在编程领域,而是从让AI拥有“手”这个角度来看,事实证明,这种认知的产品获得了巨大的成功。
那这个跟提示词又有什么关系呢?
当我们跟“龙虾机器人”对话时,实际上龙虾会通过关联本地的人格设定,历史对话,技能描述等信息以及用户的问题一并发送给大模型,大模型实际上就是根据这些包装后的信息进行回答,这一套封装发送消息,就是针对提示词的包装,再配合解析返回的消息,如果命中技能,则也会触发技能的调用指令,进行本地执行。
通过与人的对话不断重复这个过程,如果是AI编程是基于工程规范的,只聊项目,那么龙虾更像是一位“真人”,啥都能聊,只要有“手”,啥都能干。
当然,目前龙虾由于过度“自由”,造成了很多困扰。虽然吃惊于AI的随机性,但人类本身还是要追求稳定性的,不希望自己的工具出现不可控的情况,所以需要一套规范来约束它。这也就是我说的纯粹借助预测机制的AI来驱动系统是不可靠的,可信的应用级AI必须有人工设计的框架规范来作为安全保障。
而目前“龙虾机器人”也在不断完善,而最新出现的“爱马仕机器人”,其在我看来更像是将“龙虾机器人”的构建逻辑进行了二次架构,规范了信息包装的逻辑,就类似于Codex和ClaudeCode一样,通过一套规范来构建提示词和解析返回,从而保证提示词的精准性和运行的安全性。
当然,其核心肯定不止这一点,但是从提示词角度来看,核心逻辑是这样的,那么什么人对于电脑外部工具的调用如何熟悉,对提示词的结构化封装又如此专业呢?结合起来就是提示词架构师。
所以单纯的提示词工程师还不能称之为提示词架构师,一定在某个领域有着丰富的经验,同时对该领域提示词特征又非常熟悉,能够很好的把握AI预测方向的人。
回到应用级AI的定义上,我说过,只有当这个AI应用可以在某种场景提供基于界定边界的专业能力,且能够为其结果负责的时候才是真正的AI应用,那么从上面的发展历程来看,想要达到这一点,这个人必须熟悉这个行业,熟悉企业的运行逻辑,同时又知道如何让从AI获取到想要的结果。
我们很多企业都在寻找所谓的“龙虾机器人”解决方案师或者智能体开发工程师,其实就是对于这套模式理解的误会,以为有了AI工具,就真的可以跨越专业做专业的事情。实际上业务场景不同,这套架构也会有所不同,不同的大模型的对话逻辑也会因各自优化的差异而变得不同,所以这样的人就既要懂业务,还需要会跟AI交互,同时可能还需要具备工程化思维。此外未来或许真正落地的应用不是构建在“龙虾机器人”之上,而是构建一个适合自己的“龙虾机器人”。
所以应用级AI的核心,就是能够用类似于AI编程范式的方式来提供一套AI协作框架,既能够让AI按部就班的解决问题,也可以通过既定的约束来调节AI的“手”的边界和精准度。其核心就在于那个能够为特定业务设计这套架构的人。
所以,综上所述,提示词工程并没有消失,只是定义上更加的广泛,回归到为客户解决问题的本质上。让人与AI之间的沟通门槛进一步降低的同时,确保AI能够更加进行符合人类预期的协同作业,而实现这一切的人就是我所定义的——提示词架构师。