邵家豪 | AI 时代,我们需要怎样的历史教育?

AI 时代,我们需要怎样的历史教育?
——来自一线教师的思考与实践



推荐缘由

这篇文章紧密贴合当下AI与人文教育融合的时代热点,直面了AI 发展给历史教育带来的现实困境,又给出了具体的解决方案。作者从一线教师的视角展开思考,内容贴近教学实际,且极具借鉴意义。文章中不仅纠正了 “AI可取代文科” 的认知误区,还重申了历史教育的人文本质与独特价值,对AI时代的历史教学转型有着重要的启发与指导作用。
摘要:近十年来人工智能快速发展不断引起关注,教育自然成为人工智能赋能的重点领域之一,历史教育教学领域也有许多教师作出了各种尝试并取得了一些成果。但目前人们更多关注的是AI如何帮助我们改进教学,对AI可能存在的问题关注不足。AI在融入历史教学的过程中会产生的主要问题有:幻觉问题、创新与质疑能力缺失和价值观偏差。历史学科的本体知识即使在信息唾手可及的AI时代依旧有着价值,因为历史知 识是民族观念、文化认同等许多社会共识的基础。AI时代人与人之间沟通交流、建立信任的能力会变得非常重 要,而人们之间的沟通与信任离不开这些共识性的知识基础。未来的历史教育也不能仅仅是对历史知识的传承。历史学科应该成为未来的“AI时代”培养社会成员的想象力、质疑的思维与能力的重要基础。基于这些思考,笔者尝试提出未来历史教育的“五力”模型:即想象力、共情力、理解力、认知力、判断力。
关键词:AI 时代;人工智能;历史教育;历史教学
从AlphaGo到 ChatGPT,近十年来人工智能的快速发展不断引起人们的关注,我国近期更发布了一系列 政策文件,如《关于深入实施“人工智能+”行动的意见》,引导人工智能赋能千行百业。教育自然也成为人工智能赋能的重点领域之一,《关于深入实施“人工智能+”行动的意见》中明确提出要“把人工智能融入教育教学全要素、全过程”。历史教育教学领域也有许多教师作出了各种尝试,并取得了一些成果。值得注意的是,目前人们更多关注的是AI有哪些优点、可以如何帮助我们改进教学,但对AI可能存在的问题关注不足。AI强大的能力确实对现有的教育教学形成了挑战,但AI的不足同样会决定未来的教育走向何方,因此同样需要我们做一番分析与思考。
一、AI 带来的挑战
(一)对教育的挑战
虽然AGI(通用人工智能)和 ASI(超级人工智能)还未到来,但目前的AI已经在许多方面堪比甚至超越人类,并开始对人类的就业市场造成冲击。或许有人认为,AI只会取代一些机械性重复的、不需要创意或共情能力的岗位。当AI 真的开始代替人类从事艰苦、繁琐的生产工作时,或许才是人类整体真正得到解放的开端。但从个体的角度看,这显然是遥远的未来,而眼下AI 可能会让自己失业的威胁却是实实在在,且单凭个体的力量难以应对。更重要的是,我们的教育系统依旧在批量培养着“生产者”,而非帮助我们的学生适应 即将到来的新时代。
帮助学生适应社会的需求、帮助社会延续与发展是教育的使命,而AI 已经对教育提出了真实的挑战。在 AI 可能取代一些工作的背景下,教育工作者必须思考:从个人的角度看,我们的教育是否能够帮助我们的学生真正适应未来的需要?我们的教育真的“使人成为人”了吗?从人类社会的角度看,我们的教育究竟只是在代际之间传递知识,还是去激发新的智慧?
(二)对历史学科的挑战
另一方面,AI对历史学——不仅是历史教学,更是整个历史学科,甚至所有人文学科都构成了严重的冲击。一些机构甚至将历史学家列为最容易受到AI冲击而失业的人群之一。这主要是因为AI强大的信息处理能力冲击到了历史学科的知识基础。
在过去,知识的价值是不言自明的,这很大程度上是因为过去知识的保存、获取与传播门槛较高、难度较大。但以ChatGPT 为代表的大语言模型极大降低了人们获取知识的难度,进而带来知识的“贬值”。类似情况在互联网普及的数十年间其实早已出现,日本学者屋太一早已观察到这一现象,并称之为“知识价值革命”。但AI的冲击力度比网络更大——过去人们想要获取知识还需要在网络上海量的信息中进行爬梳,现在AI完全可以将知识的搜集、翻译、解释、整理、总结一步到位地完成,直接将一份详尽的报告呈现在提问者的面前,人们想要快速进入一个完全陌生领域的门槛被大大降低,即使是专业的研究人员也可以在AI的帮助 下更加高效地完成此类任务。因此,“知识不再重要”或类似的观点已经不止一次地出现,并在一定程度上成为许多人认为包括历史在内的“文科”终将在AI时代走向消亡的重要依据,因为人们普遍认为“文科”主要就是对知识的记忆,而人类对知识信息的记忆和调用能力显然无法与AI相提并论。
即便这种观点在很大程度上曲解了“文科”的真相,我们也确实不可否认人文学科,至少是历史学科的大厦,确实无法离开知识的地基。而现在,地基被动摇了,甚至一些专业的研究人员都对自己赖以为生的学科产生了价值上的幻灭感。人们或许依旧认为历史有价值,但包括历史学科在内的人文学科的价值受到挑战也已成为一个现实问题,甚至受到了媒体的关注。
二、AI 融入历史教学的问题
AI虽然已经很强大,但问题也还不少。其中一些问题源于大语言模型的底层原理——通过对人类语言的学习掌握人类语言的规律,从而基于概率地预测生成内容。
基于这一原理,AI在融入历史教学的过程中会产生以下几个问题:幻觉问题、创新与质疑能力缺失和价值观偏差。
很多用过AI的人都会发现,AI有时会生成一些语句通顺但缺乏事实依据的内容,也即幻觉。这本质上是因为大语言模型只是对人类的语言概率进行预测,实际上未必真正理解语言背后的知识,因此在面对一些 问题,尤其是其训练数据中未能提供支持的问题时就会“一本正经的胡说八道”。虽然可以通过RAG (检索增强生成)工程在一定程度上予以改善,但目前也有一些研究认为幻觉属于无法根除的根本性挑战。这对于教育,尤其是强调“求真”的历史教育,属于比较难接受的缺陷。
目前AI生成内容的底层原理,是AI通过学习训练数据掌握一套规则,然后利用强大的算力将素材按照这套规则进行排列组合。我们会觉得AI能够启发思路,有时甚至可以给出令人惊喜的回答,但这只是对于我们个体,其本质是AI掌握信息的总量和计算能力超过了个体的能力范围。从人类整体的角度来看,AI的回答其实是缺乏创意的,因为AI进行排列组合的规则本身来自大量来源于人类的数据,这些规则本身就是人类所创造的,而AI实际上没有创造规则的能力和动机。此外,由于缺乏动机、社会情感、具身认知等能力,不少相关领域的专家认为目前的AI其实缺乏真正意义上的创新能力,尤其是开创人类没有开创过的领域,也即缺乏“颠覆式创新”的能力。
同时,这也意味着AI缺乏质疑并形成独立认知的能力。AI的输出内容总是趋向于统计上可能的多数,这在提高AI生成内容符合社会主流认知的同时却也隐含着湮没现实中的少数的可能性。“真理往往掌握在少数人手中”这句话虽然并不总是正确,却的确反映出少数人对特殊性的洞见往往有着巨大的价值。而从学科角度来看,历史的价值不仅包含提取对人类社会发展的规律性认知,也包括打捞特殊个案,并通过对这些个案的深入分析来洞见历史的复杂性、多样性与独特性,这些正是AI容易忽略的。
最后,AI的训练数据来源于人类,因此AI会受到其中隐含的人类价值观的影响。这一方面意味着AI生成的内容大多数情况下是符合人们的主流观念的,这对于人机对齐来说是个好消息,却也意味着AI无法纠正主流观念中可能存在的问题,例如一些研究者发现AI可能存在地缘政治上的偏见。这不得不引起教育工作者的重视。
另一方面,目前也有一些研究表明过度依赖AI 有可能造成使用者思维能力的下降,也即“认知负债”。使用AI的过程中如果方法不当,只是简单地向AI索取回答,那最终短期的问题或许会以比较轻松的方式得到解决,长期来看却是使用者放弃了自己的思维过程,AI的回答并不会成为自身认知的一部分,甚至连思维能力本身都有可能因“用进废退”而发生退化。
三、模型构建与教学实践
(一)基于反思的“五力”模型构建
综上,笔者认为AI融入历史教学不仅是如何使用好这一新工具的问题,更需要对历史教育教学的内容进行重新思考。
笔者认为,历史学科的本体知识即使在只是唾手可及的AI时代依旧有着价值,因为历史知识是民族观念、文化认同等许多社会共识的基础。AI时代人与人之间沟通交流、建立信任的能力会变得非常重要,而人们之间的沟通与信任离不开这些共识性的知识基础。未来的历史教育也不能仅仅是对历史知识的传承。历史学科应该成为未来的“AI时代”培养社会成员的想象力、质疑的思维与能力的重要基础。
基于这些思考,结合对AI时代的人们的需要,笔者尝试提出未来历史教育的“五力”模型。“五力”,即想象力、共情力、理解力、认知力、判断力。
想象力,是指历史学科能够培养学生跨越时空长河,基于史料作出合理想象的能力。AI 缺乏想象能力,因此想象力是未来人类区别于机器、保持独特竞争力的关键所在。与研究对象之间不可打破的时空阻隔是历史区别于其他学科的核心特征。学生学习历史需要在阅读和理解史料的基础上,通过想象力尝试还原过去人们的生活以及所面对的问题。因此,历史学科理应在培养学生想象力方面发挥重要的作用。还需要注意的是,历史学科能够培养的是合理想象,于历史学科而言即有史料依据、符合当时时空环境,也即学科核心素养中的“时空观念”与“史料实证”。这种合理的想象是共情力与理解力的基础。
共情力,即对他人情绪的感知与共鸣能力。这同样是AI缺失而可能成为未来人类重要竞争力的一种能力。因为思维的基础不同,甚至可以说是因为物种的不同,AI并不擅长理解人类的感情,也缺乏唤醒学生共情的能力。而历史上那些鲜活的人物正是培养共情力最好的素材,许多历史教师也正擅长于此。通过阅读与想象,教师可以引导学生深入挖掘人物的内心世界,感受他们的喜怒哀乐,逐渐培养学生对他人情绪的感知,进而产生共鸣,提升共情力,成为有温度、有情感的人。
理解力,是建立在想象与共情基础之上理解他人和历史现象的能力,也即“同情之理解”。历史教学不仅要求对历史人物和事件进行深入地想象与共情,更要通过理性的分析与推理更好地理解历史背景下的个体 行为和决策,进而理解历史人物的复杂互动最终如何形成我们所看到的历史现象。由此,历史教学不仅能够培养 AI 所无法替代的同理心和跨文化理解的能力,更能增强学生对历史现象背后的原因、本质与影响的理解,进而形成对社会的认知。
认知力,是指对社会现象、集体共识的认知能力。历史知识是学生理解社会现象进而形成社会认知的基础,历史教学是学生形成社会认知、认同集体共识的重要路径。在AI时代,知识的获取或许会变得很便捷,但社会认知作为思维的重要基础是不能被外包的。因此历史知识,尤其是核心的、构成社会认知基础的历史知识,还是需要被人脑记忆的。而在社会认知的基础上,还需结合对他人“同情之理解”,才能认知、理解、最终认同集体共识,从而为判断力奠定基础。
历史教学给予学生的判断力包含两个层次。低层次的证据意识和批判质疑思维,以及高层次的基于共情与理解做出富有人性的决策的能力。
如前文所述,幻觉问题在短期内或许无法解决,人类需要在一个较长的时间内面对AI输出内容中真假参半的问题。而历史学的最终追求就是求真,史学思维的特点之一就是证据意识,“史料实证”是历史学科五 大核心素养的重要组成之一。另一方面,前文提及的价值观偏差和“认知负债”问题表明,不假思索地全盘接受 AI的回答存在着巨大的风险,而历史学科正强调从不同的角度、立场去理解与看待问题并作出合理解释,也即五大核心素养中的“历史解释”。因此,历史学科的训练正有助于应对幻觉问题与价值观问题,从这个角度来说,历史学科的“史料实证”和“历史解释”核心素养一定程度上应该成为人的基本素养。
许多学者均已指出,AI在与人类的价值观念“对齐”上总是存在缺陷,因此在重要的、可能影响人类社会未来长远发展的决策中还是离不开人类自身的想象与判断。人类的未来需要人类自身的想象,而人们正是通过对历史的认知建构出对未来的想象。在这一过程中,需要决策者能够在综合各类客观信息和历史经验 的同时关注并理解他人可能的感受,最后作出有利于人类整体的决定。可以说历史学科对想象力、共情力、理解力、认知力的培养,最终就是为了形成这种判断力。
由此可以发现,想象力、共情力和理解力是认知力、判断力的基础。而从时空的角度看,想象力指向“过去”,共情力、理解力和认知力基于“过去”而又可以迁移至“现在”,判断力基于“过去”和“现在”而又指向“未来”。历史学不仅是研究“过去”的学科,更与我们的“现在”和“未来”息息相关。
笔者提出的“五力”既是基于对未来时代人们可能需要的能力的思考,也是基于目前对历史学科核心素养已有的探索。“五力”并不是对学科核心素养的替代,而是尝试回答基于目前的学科核心素养,历史教育能够为 AI 时代的人们提供些什么。不仅是学科核心素养,当前教育教学领域的诸多前沿,如“大概念”、“跨学科主题学习活动”等也同样有助于我们解决AI 如何融入历史教学的问题。
(二)“AI+ 历史教学”的实践——以小论文写作辅导为例
在进行以上思考和模型构建的同时,笔者也在自身教学实践中尝试进行了一些“AI+历史教学”的探索。
在目前的历史教学与评价体系中,尤其是上海的高中历史教学评价体系中,小论文还是比较能反映学生素养的一种题型。尤其是从大概念的角度来看,小论文写作过程中的观点提炼需要学生掌握对材料信息的 提炼归纳与抽象思考的能力,论述的过程能够体现解释论证能力,因此小论文是目前考试题型中比较能够体现学生是否掌握“大概念”的思维模式、体现学生的认知力、理解力与判断力的一类题型。
另一方面,小论文写作的辅导也一直是教师在进行教学中的一个痛点。一篇小论文通常有500—600字, 学生的写作一般需要10—15分钟,教师的阅读时长在没有时间限制的情况下一般需要2—3分钟,如果在阅 卷这类有时间限制的情况下可能被压缩到1分钟,而最后的评价在大多数情况下可能只是一个简单的分数。 这对于学生而言显然是一件投入——产出比极低的事情,但若要求教师对每位学生的小论文都进行深入的点评,例如提供一段100—200字的评语,则对教师而言又成为了一种巨大的,甚至可能是难以承受的负担。
《关于深入实施“人工智能+”行动的意见》认为AI在教育教学中的使用目标就是“加快实现大规模因材施教,提高教育质量,促进教育公平”。AI在材料阅读、分析、归纳、批改和个性化写作指导的效率上有天然的优势。因此,如果能够在小论文写作指导中合理使用AI工具,对教师来说可以一定程度上减轻工作负担学生也可以收获更个性化的辅导。
为实现这一效果,笔者做了以下探索:
(1)搭建“历史小论文批改师”智能体
在尝试使用了一些AI工具后,笔者发现虽然理论上AI确实能够实现辅助教师进行小论文批改,但如果只是上传一道试题与该题的评分标准,AI在打分时与教师的打分总是会存在较大的偏差,且给出的修改意见常常会超出课标要求的范围。这样给出的评分与修改意见是无法应用于教学或对学生的个性化辅导的。笔者尝试通过提示词进行限定效果也不理想,最终发现问题的症结在于AI本身并不理解“高中历史”的知识范畴到底在哪里,更不知道小论文试题的批改除了一般的参考答案外还需要遵循一系列的格式规范等“隐性 知识”的制约。这就需要教师人工上传课程标准与教材,并在提示词中对打分标准进行详细的规定。但每次编 写这样一段提示词、上传相关文件效率非常低下,且由于课标和教材的体量非常大,很容易引起AI工具的上下文篇幅限制,最终影响批改效果。为解决这些问题,笔者决定基于扣子(coze)平台搭建一个“小论文批改智 能体”。
笔者首先在扣子平台创建了“高中历史课标与教材”知识库,并上传了5册统编教材与课程标准的pdf文件。之后又结合自身教学经验总结了“小论文写作要点”,并与自身教学中曾用于指导学生写作的课件上传到另一个名为“小论文写作要点与指导”的知识库中。
之后笔者使用“Kimi+”中的“提示词专家”功能,要求AI为我提供一份历史小论文批改智能体的提示词模板,并基于自身经验对AI提供的模板进行修改,同样上传至扣子平台。
最后,笔者创建了“历史小论文批改师”智能体,直接调用已上传的提示词与知识库,并添加“链接读取” 和“ocr”两个插件。经过调试,这样的智能体已经能够满足小论文批改的需求,给出的分数虽然与教师还存在偏差,但已经比较稳定,且给出的修改意见基本符合高中历史的范围。试测过程中再上传由试题、参考答案 和学生作答组成的一份文档后,智能体能在较短的时间内(2—3分钟)完成阅读、理解、打分和撰写评语,效率远高于教师,且生成的评语可以做到紧密结合学生的作答,从而实现个性化辅导的效果。
(2)引导试用、收集数据与反馈意见并迭代
在完成智能体的搭建后,笔者在任教的班级中征集了一批学生作为志愿者对智能体的实际表现进行测试。测试过程中为方便数据的收集,笔者要求学生将撰写的小论文以电子文档或照片的形式提供给笔者,由笔者统一上传,并将智能体的批改分数与评语反馈给学生。
经过5轮的反复测试,除了笔者收集到宝贵的数据,参与测试的学生还发现了一些问题、提出了一些意见。主要问题在于智能体的打分普遍会高于教师,幅度一般为2—3分。具体意见主要包括两点:第一,学生认 为智能体虽然会给出修改建议,但这些建议总是显得比较笼统,希望能得到更具体的范例帮助理解。第二,智能体给出的建议主要集中在具体的论述过程,对于论点的提炼很少给出有效的建议,而这也是许多学生小 论文写作的难点,恰恰是他们比较希望得到建议与指导的地方。
针对这些问题与意见笔者做了如下改进迭代:第一,在提示词中明确要求智能体控制打分,尽量贴近教师的给分;第二,在提示词中要求智能体在今后的评语中对修改意见给出具体的示范;第三,设计了“历史小论文观点提炼教练员”智能体,在提示词中明确要求该智能体只能通过问题引导的方式辅助使用者自行总结 出观点。
在学生建议的基础之上,笔者进而想到,观点提炼智能体的最佳使用场景应该是学生在正式落笔进行写作、思考提炼观点遇到困难的时候,从而实现对学生的个性化辅导。但是除了观点提炼外,会不会也有学生希望在论文写作的其他方面同样得到个性化的辅导呢?由此笔者又设计了“历史小论文写作辅导员”这一智能体。
这两个智能体使用的知识库和插件与批改智能体是相通的,不同功能的实现主要是通过对提示词的调整,由此实现了在对学生进行个性化辅导的同时,通过工具的复用减轻教师负担的效果。
(3)效果总结与反思
在三个智能体的使用与反馈中,学生对批改智能题的评价最好,表示虽然经过迭代打分还是会显得偏高 (见表1)给出的修改意见已经非常具有参考价值,对他们改进此后的小论文写作有着很大的帮助。而通过对收集数据的统计分析,智能体打分与教师打分的皮尔逊相关系数约为0.78,表明两者的打分之间存在较强的正相关关系,智能体在大多数情况下能较好地模拟教师的评分趋势,但仍存在一定偏差,尤其在个别学生或题目上可能出现打分偏高或偏低的情况。这与学生的主观体验是基本一致的。而论点提炼智能体和写作辅导智能体因推出时间较晚,收到的反馈也较少,还需进一步收集相关数据进行迭代。

从学生的表现来看,笔者的实验主要集中在2025年7月—8月的暑假期间,因此前后共有15名学生参与了实验,但有相当部分的同学不是全程参与。即使如此,将这部分同学在2025年10月参与的考试中的小 论文均分与班级均分、年级均分相比,比2025年4月及6月的两场考试中的小论文均分的表现都有明显的提升。(见表2)

当然,以分数作为衡量标准或许存在不妥之处,且无法说明带来分数变化的究竟是智能体的辅导还是在这一过程中学生的学习兴趣被激活了,又或者只是因为参与这项实验本身增加了这部分同学在小论文写作上投入的时间和精力从而在客观上提升了他们的表现。此外,其余两个智能体的具体功效也有待进一步的 实验。但就笔者自身的主观感受而言,AI对教师工作的减负增效、对学生实现大规模因材施教的可能性依旧让人激动不已。
AI对史学、对教育甚至对人与知识的本质都造成冲击的同时,也为教育的发展打开了新的大门、指出了新的方向。在AI时代,我们通过历史教学不仅要传授知识,更能够塑造具有合理想象能力、情感共鸣能力、深度思考与理解能力,并最终通过批判性思考对复杂的现实问题做出合乎情理判断的新一代。当前历史教育教学的诸多研究对如何将AI融入历史教学同样有着重要价值,但也有许多新问题值得我们研究解决。笔者的思考与实践尚有诸多不足之处,仍需更多的探索,在此抛砖引玉,求教于方家。
(本文刊载于《历史教学问题》2026年第1期,转载时原注释从略。)
注:本平台所载文章,仅供学术交流使用,作者(版权所有人)如不希望被转载,请联系后台删除。
夜雨聆风