AI的确定与不确定
很多人用AI助手时会有这样的困惑:同一个问题,问了两遍,答案不一样;让AI写一份文档,每次生成的结果都不同;明明是简单的问题,AI却一本正经地给出错误答案。这些"不稳定"的表现,常常让人对AI产生不信任感。
但这些"不靠谱"的表现,恰恰是AI工作原理的直接结果。理解了AI为什么会这样,你才能真正驾驭它,而不是被它气到摔手机。
为什么AI助手有时很"飘"——Soul与风格的作用
你有没有遇到过这种情况:让AI帮你写一封邮件,它一会儿语气正式得像律师函,一会儿又随意得像朋友短信。你说"正式一点",它确实变了,但变得到底对不对,你心里没底。
问题的根源在于:AI没有固定的"Soul"。
所谓"灵魂"(Soul),是指一个人稳定的价值观、说话风格、处世原则。一个成熟的人,无论在什么场合,说话都会有自己的风格基调——这是多年阅历沉淀下来的,几乎不会变。但AI不一样。AI的"性格"是由你的提问方式决定的,同样的问题,换一种问法,AI就会给你一个不同"性格"的回答。
举个例子。你问AI:"帮我写点东西。"它可能给你一个中规中矩的开头。但如果你换一种说法:"帮我写一个有温度的、亲切的故事开头,像一个老朋友在跟你聊天。"AI立刻会切换到另一个"人格"。问法不同,AI的灵魂就不同——这解释了为什么AI有时感觉很"飘"。
核心本质:AI输出飘忽,是因为没有预设角色约束。同一件事有一百种说法,每种说法AI理解都不同。
## 二、为什么AI有时很"健忘"——长期记忆与短期记忆体系
你跟AI聊了很久,关掉对话重新打开,它完全不记得你们聊过什么。你之前辛辛苦苦喂给它的背景信息,它像失忆了一样全忘了。
这不是AI故意跟你作对,而是它根本没有真正的长期记忆。
AI的"记忆"分为两个体系:
短期记忆(Context Window):就是你当前对话窗口里的一切内容。AI能"记住"多少,取决于它的上下文窗口大小——目前主流AI大概是几万到几十万字不等。当对话超过这个长度,AI就会开始"遗忘"早期内容,腾出空间给新内容。这是技术限制,不是AI的脾气。
长期记忆(Training Data):这是AI在训练阶段"学到"的东西,类似于人类的通识教育。你告诉AI"我叫张三,我住在上海"——这句话它不会永久记住,因为它存在于短期记忆里,而短期记忆随对话结束而消失。下次新建对话,AI什么都不知道。
核心本质:AI的"记忆"是窗口式的,对话结束即消失。下次新建对话,AI就是一个全新的"陌生人"。
## 三、为什么AI有时一本正经胡说八道——向量寻径,不是真正思考
这是AI最让人恼火的问题:明明说得头头是道,结果是错的。 术语叫"幻觉"(Hallucination)。
要理解为什么会产生幻觉,你需要理解AI训练的本质是"向量寻径",不是"真正思考"。
AI在训练时,会把世界上所有的文本转换成数字向量——你可以理解为一个巨大无比的"概念地图"。每个词语、每句话都被映射到这个地图上的一个点,相似的概念在地图上距离较近。训练的过程,就是让AI学会在地图上找到从问题到答案的最短路径。
当你问AI一个问题,AI做的事情是:把你的问题转换成地图上的一个点,然后从那个点出发,找到它认为最"合理"的下一个点、再下一个点,最终生成一段文字。
AI并不真正"理解"你说的话,它是在找一个统计学上最可能的答案。 它不知道什么是对什么是错,它只知道在它的"地图"里,从A点到B点的路径是训练数据中出现频率最高的。
核心本质:AI的"思考"是在巨大概念地图上找概率最高的路径,不是真正理解后回答。统计学上的"最可能"不等于"正确"。
## 四、为什么AI的回答有时很"过时"——训练数据与实时信息的区别
你问AI"最新的人工智能政策有哪些",它给了一个2023年的回答。你明明知道2024年、2025年已经出了很多新政策。
原因是:AI的知识有截止日期。
AI的回答,是基于它的训练数据生成的。GPT-4o的训练数据有明确的截止日期,Claude的训练数据也有。AI并不知道截止日期之后发生的事,除非它被允许接入互联网进行实时搜索。
这里有一个重要的区分:
训练数据直接回答:AI基于训练时学到的知识直接生成答案。优点是速度快,缺点是信息可能过时。
浏览器实时搜索:AI调用搜索工具获取最新信息,再整理成答案。优点是信息最新,缺点是速度慢,且依赖搜索结果的准确性。
目前主流AI助手都支持这两种模式。你需要在提问时明确:这个问题需要最新的信息,请先搜索再回答。 如果你不说明,AI默认会用训练数据直接回答。
核心本质:AI的知识有截止日期,需要实时信息时必须明确要求AI使用搜索工具。
## 五、为什么每次技能执行结果都不一样——精要概要化与理解力差异
你让AI帮你执行一个任务:写一段Python代码处理数据。同样的需求,你请AI做了三次,结果是三个略有不同的版本——有的代码更简洁,有的更详细,有的用了不同的函数写法。
这背后有两个原因:
第一,自然语言到技能储存的"精要概要化"会丢失信息。
当你描述一个任务时,你的自然语言表达本身就是对任务的"概要"。AI把这个概要转换成代码时,需要"脑补"你省略的细节。不同的"脑补"方式,就会产生不同的代码版本。这就是为什么你感觉"说清楚了",但AI每次理解的都不完全一样。
第二,每次执行时大模型的理解力有波动。
AI生成内容的过程带有随机性——这不是bug,而是设计特性。AI在生成每个字词时,会计算多个可能选项的概率,并通过一个叫"温度"(Temperature)的参数来控制随机性。高温度=更创意/更多样,低温度=更确定/更一致。
核心本质:自然语言的本质是不确定的,同一描述有一百种理解方式;AI生成过程带有随机性。两个不确定性叠加,结果必然每次不同。
## 六、如何让AI的不确定变得更确定——三个实用策略
理解了前面的五个问题,答案其实已经呼之欲出。以下是让AI输出更稳定的三个核心策略:
策略一:过程用脚本执行,而非自然语言
自然语言的本质是不确定的——同一件事有一百种说法,每种说法AI的理解都有细微差别。把重复的工作流程写成脚本或模板,让AI按照固定步骤执行,而不是每次都靠自然语言描述任务。
比如,你每周要生成一份运营报告,与其每次都说"帮我写一份运营报告,包含数据分析和下周建议",不如提前写好一个报告模板框架,让AI只在预设的位置填入内容。
脚本执行 = 确定的过程 + 确定的输出格式 = 稳定的结果。
策略二:角色预定义要具体,不要泛泛而谈
"你是一个助手"和"你是一个专注AI领域的资深产品经理,有5年AI行业经验,擅长写B端产品需求文档,语言简洁专业,不用语气词"——这两个角色定义给AI带来的影响是天壤之别。
越具体的角色定义,AI的输出越稳定。 好的角色定义应该包含:专业领域、经验年限、风格偏好、输出格式要求。
把角色定义保存下来,每次新建对话时粘贴进去,比每次临时发挥要可靠得多。
策略三:把自然语义变量压缩到流程的一两个环节
整体思路是:大部分流程是固定的,只有少数环节需要自然语言输入。
举个例子:设计一个每周自动生成的文章流水线。固定的流程是:选题库→初稿框架→配图规范→排版格式,这些全部脚本化。只有"本周选题"这一个变量,由你用自然语言指定。
自然语义变量越少,AI的输出就越确定。 这是一个系统设计问题,而不仅仅是提问技巧问题。
## 写在最后
AI的不确定,不是AI的缺陷,而是它的本质特性。
它是基于概率运行的,它的"记忆"有截止日期,它的"思考"是在巨大概念地图上找最可能的路径。这些特性决定了AI天然是"不确定"的。
但这种不确定性,是可以被管理的。 通过脚本化流程、固定角色定义、压缩自然语义变量,你可以把AI从一个"飘忽的助手"变成一个"可靠的执行者"。
理解AI的边界,才能用好AI的优势。
本文涉及的技术原理基于主流大语言模型(LLM)的通用架构,具体实现因模型版本和平台而异。
本文涉及的技术原理基于主流大语言模型(LLM)的通用架构
具体实现因模型版本和平台而异
具体实现因模型版本和平台而异
夜雨聆风