乐于分享
好东西不私藏

构建会思考的智能体 基于源码未来平台的中小学AI推理教学案例

构建会思考的智能体 基于源码未来平台的中小学AI推理教学案例

在大模型与智能体技术快速融入教育场景的当下,中小学人工智能教学亟需跳出浅层体验模式,从 “使用 AI” 转向 “理解 AI、构建 AI”。为让中小学生直观掌握大模型与智能体的核心逻辑,笔者依托源码未来平台,设计了大模型与智能体主题的工作坊,并在内蒙古地区教师培训活动中进行了分享,为中小学人工智能教育提供了实践方案。

一、案例来源

本次工作坊的核心实践案例,源自 AI 探学营学员、内蒙古兴安盟扎赉特旗音德尔第一中学王子瑞同学的探究项目。王子瑞同学在学习中发现,一些大语言模型受概率生成机制影响,在处理简单推理任务时频繁出错,比如比较 “3.11 和 3.8 哪个数字更大”、统计 “strawberry 中有多少个字母 r” 这类基础问题,都可能给出错误答案。

针对这一问题,该同学提出通过链式思考与验证机制优化智能体推理能力,将复杂推理拆解为逻辑步骤并增加验证环节,既保障结果准确,又能清晰展示思考路径,这一成果也成为本次工作坊的核心教学内容,项目简介如图1所示。

图1 项目简介

二、智能体开发路径

推理智能体的开发有两条适配中小学教学的主流路径,一是通过 Coze、腾讯元器等低代码平台进行可视化搭建,二是借助 Python 等编程语言调用 API 开发,源码未来平台整合了两类路径的优势,以图形化模块操作兼顾便捷性与灵活性,成为中小学生搭建智能体的理想工具。

三、提示词设计

提示词是驱动大模型精准执行任务的核心,智能体使用的提示词分为系统提示词与用户提示词,二者协同决定智能体的工作效果。

系统提示词是大模型的 “隐形指挥官”,在对话启动前为模型设定核心规则,完整的系统提示词包含四项关键内容:角色定位、任务目标、约束规则、输出要求,如图2所示。

图2 系统提示词

用户提示词是传递具体任务的指令,直接指导模型执行操作,有效的用户提示词包含两部分:清晰的任务描述、必要的背景信息,如图3所示。

图3 用户提示词

四、大模型推理能力测试

在搭建推理智能体前,可先通过源码未来平台测试普通大模型的推理能力,直观发现其存在的缺陷,测试内容如图4所示。

图4 推理问题测试

测试结果会清晰呈现大模型的推理漏洞,如图5所示,模型错误地将 3.8 的小数部分视为 0.08,与 3.11 的 0.11 进行对比,得出 3.11 更大的错误结论。这一问题源于大模型的概率生成机制,在简单推理任务中易出现逻辑偏差,也印证了为大模型加入链式思考与验证机制的必要性。

图5 测试结果

五、人类推理过程拆解

让智能体实现精准推理,核心是复刻人类解决问题的思维流程,以经典的鸡兔同笼问题 “鸡和兔共 8 只,腿有 26 条,鸡兔各几只” 为例,人类的推理过程可拆解为五个标准化步骤,如图6所示:

图6 人类求解过程

第一步确认问题,提取题目中的关键信息;

第二步回忆相关知识与解题方法;

第三步基于知识方法提出解题假设;

第四步开展推理与计算;

第五步对结果进行检查验证。

这一流程就是链式思考与验证机制的原型,也是智能体实现结构化推理的核心依据。

六、节点搭建

基于人类推理流程,可在源码未来平台上搭建包含五大核心节点的推理智能体,每个节点各司其职,完整还原逻辑思考过程,同时配套重推理与输出整理节点,进一步保障推理结果的准确性。

1.观察问题节点

该节点的角色为问题观察助手,核心任务是将用户问题拆解为结构化 JSON 格式,需包含四项内容:intent ,即问题意图,分为计算、推理、比较、事实、概念、开放、其他七类;goal,即用户想要解决的核心目标;reason,即用户提出问题的潜在原因;info,从题目中提取的关键信息列表。问题拆解仅输出 JSON 格式内容,不附加额外解释。如图7所示。

图7 观察问题节点

2.回忆知识节点

此节点定位为知识与方法回忆助手,基于观察问题节点的结果,仅调取与解题相关的知识点和方法,不进行答案计算。输出同样为 JSON 格式,包含 knowledge 与 method 两项,前者罗列公式、定义、常识等知识要点,后者列出适用的解题方法及适用范围,为后续推理提供理论支撑。如图8所示。

图8 回忆知识节点

3.提出假设节点

作为假设生成助手,该节点需基于问题信息与回忆的知识,生成至少 3 个合理的解题假设,每个假设需包含名称、前提条件(premise)和适用范围(when),确保假设贴合问题、不凭空猜测,最终按指定 JSON 格式输出,为推理计算提供多元方案。如图9所示。

图9 提出假设节点

4.推理计算节点

该节点为推理计算助手,从生成的假设中选择最匹配的方案,分步开展推理。输出 JSON 格式需明确所选假设名称、有序列表形式的推理步骤、简洁明确的最终答案,要求推理过程逐步展开,答案不提前出现,完整呈现思考路径。如图10所示。

图10 推理计算节点

5.检查验证节点

此节点扮演审查官角色,从逻辑、算式、常识三个维度,对推理过程与答案进行全面复核。输出 JSON 包含三项内容:istuili 判断推理过程是否严谨,isdaan 判断答案是否正确,jianyi 针对错误给出具体修正建议,无需修改则留空。如图11所示。

图11 检查验证节点

6.重推理节点

若检查验证节点发现推理错误,可启动重推理节点,严格按照修正建议调整推理步骤,不推翻原有逻辑,仅修改错误部分,输出新的推理过程与修正答案。如图12所示。

图12 重推理节点

7.输出整理节点

最后通过输出整理节点,将 JSON 格式的内容转化为规范的中文纯文本,分 “推理过程” 与 “最终答案” 两部分呈现,去掉格式代码与多余说明,让智能体的推理结果清晰易懂。如图13所示。

图13 输出整理节点

通过以上步骤,即可在源码未来平台上完成具备链式思考与验证能力的推理智能体搭建,解决普通大模型推理易错的问题。相较于传统大模型的 “黑箱作答”,该智能体能清晰展示推理步骤、验证结果准确性,让中小学生在搭建过程中理解大模型的运行逻辑,培养问题拆解、逻辑推理与验证修正的计算思维。