越依赖AI,知识越留不住:AI可能正在偷走你的记忆


越依赖ChatGPT,知识越留不住:AI可能正在偷走你的记忆
Andr´e Barcaui
|前言|

生成式人工智能正以前所未有的速度渗透高等教育领域。ChatGPT自2022年11月发布后,仅两个月便积累了1亿用户,成为史上增长最快的消费类应用,从根本上重塑了学生获取和处理信息的方式。调查显示,目前60%至80%的大学生曾将ChatGPT用于学术目的,跨学科的常态化使用已初步形成。
这一技术浪潮在教育界引发了截然对立的声音。支持者认为,AI能够提供个性化辅导、即时反馈和自适应学习体验,具有重要的教育民主化潜力;批评者则担忧,过度依赖AI可能削弱学生的批判性思维、减少自主解题投入,并通过”认知卸载”机制,从根本上改变知识编码与长期保留的方式。这种担忧与早年”谷歌效应”的研究遥相呼应——数字工具的便捷性会让人记住”在哪里找信息”,而非信息本身。
然而,现有研究多停留于理论探讨、问卷调查或短期绩效测量,缺乏针对长期知识留存的严格因果实证证据。教育机构在尚无充分数据支撑的情况下,便已大规模推进AI整合政策,这构成了显著的决策风险。正是在这一背景下,本研究应运而生,试图通过随机对照实验,为这场争论提供可靠的实证答案。

|Methods|
理论框架及研究问题


本研究整合了三大理论框架,共同构成预测ChatGPT影响学习效果的理论基础。
认知卸载理论(Cognitive Offloading)由Risko与Gilbert提出,指个体将记忆、检索、分析等内部认知操作委托给外部工具,从而降低编码阶段的主动投入。与计算器或笔记本等传统工具相比,ChatGPT能够卸载包括综合分析、批判思考在内的整体认知过程,属于”深度卸载”。
合意困难原则(Desirable Difficulties)由Bjork夫妇系统阐述,认为学习过程中某些短期内降低流畅度的”困难”——如间隔练习、测试效应、自我生成答案——反而能显著提升长期记忆巩固。ChatGPT提供即时、完整的答案,恰恰绕过了这些有益挑战。
记忆巩固与遗忘曲线理论则揭示了新记忆从脆弱的海马体依赖型表征转化为稳定皮质网络的时间依赖机制。主动检索与精细加工是这一过程的关键驱动力,而AI辅助学习可能恰恰削减了这类活动。

基于上述框架,研究提出两项预注册假设与一个探索性问题:H1,使用ChatGPT的学生长期知识留存显著低于传统学习者;H2,AI辅助组的遗忘曲线将比传统组更为陡峭;RQ(探索性),先前的AI使用经验是否调节条件与留存之间的关系。
研究方法


本研究采用随机对照实验(RCT)设计,历时三个月(2024年10月至2025年1月),分三个阶段展开。
参与者为巴西某大学120名本科工商管理学生,年龄18至24岁,男女比例均衡(68男52女),均无人工智能或机器学习的正式训练背景,母语为葡萄牙语。依据基线AI熟悉度调查,62%为频繁用户,31%为初级/偶尔用户,7%具有理论知识背景。

随机分组通过随机数生成器实现,AI辅助组(n=60)与传统学习组(n=60)各占一半,组间基线特征高度均衡。学习干预(第二阶段)中,所有学生被分配一个AI/ML主题,在两周内完成资料研究并准备10分钟演示报告。AI辅助组可自由使用GPT-4网页版,传统学习组仅可使用课程讲义、学术数据库、标准搜索引擎等非AI工具。

保留测试(第三阶段)在学习干预结束45天后,以突击测验形式进行,共20道五选一单选题,考察概念理解而非死记硬背。测试工具经过专家评审、30名学生的试点测试及题目分析优化,内部一致性良好(Cronbach’s α = .82)。
最终85名学生完成测试(AI组43人,传统组42人),整体留存率70.8%,两组流失率相近。统计分析采用独立样本t检验、ANCOVA及子组分析,在Python环境中完成,显著性水平设定为α = .05(双尾)。
研究结果


45天后的延迟测试结果显示,传统学习组的平均得分(M = 6.85,SD = 1.7)显著高于AI辅助组(M = 5.75,SD = 1.5),t(83) = −3.19,p = .002,Cohen’s d = 0.68(95% CI [0.24, 1.12])。这一约11个百分点的差距,在效应量上属于中等偏大水平,意味着传统组约75%的学生得分高于AI组的平均水平,随机抽取一名传统学习者比AI辅助学习者得分更高的概率约为66%。现实意义上,11%的成绩差距足以导致完整的绩点等级差异。

从得分分布看,传统组得分集中于高分段,约73.8%的学生得分在6分及以上;AI辅助组得分则更为分散,仅约51.2%达到同等水平,说明AI辅助学习在结果上更具不稳定性。

遗忘曲线差异(H2验证)
两组的遗忘轨迹呈现出明显差异:传统组从Day 0到Day 45的知识保留率约为68.5%,AI辅助组仅约57.5%,后者的遗忘速率更为陡峭。这一差异与记忆巩固理论的预测一致,支持H2:初始学习阶段减少主动编码努力,会导致更快速的记忆衰退,而非仅仅拉低终点均值。
时间投入与独立效应
AI辅助组的平均学习时间(3.2小时)显著少于传统组(5.8小时),差异约45%(p < .001)。然而,将学习时间作为协变量纳入ANCOVA后,AI使用对留存的负向效应依然显著(F(1,82) = 7.89,p = .006),调整后两组均值差为0.65分。这表明,AI的不利影响超越了单纯的时间投入减少,反映的是学习过程的质的差异——传统学习者可能投入了更多重读、自测、间隔复习等深度加工活动,而AI辅助学习者的时间则更多用于提示词撰写和对AI输出的被动审阅。

子组分析
按主题领域划分的子组分析显示,技术类主题的AI劣势最为突出(d = 0.92),伦理与社会类主题效应相对较小但仍有意义(d = 0.45);各子组间异质性低(I² = 28%,p = .21),说明AI的负向效应具有跨领域的稳定性。

先验AI经验的调节作用(探索性问题)
AI熟悉度与留存成绩之间的相关极弱且不显著(r = 0.18,p = .10)。频繁使用AI的学生并未展现出更好的适应能力,提示AI辅助学习的认知损耗效应具有普遍性,甚至连经验丰富的AI用户也难以免疫——研究者将此现象称为”借来的能力(Borrowed Competence)”,即AI提供的流畅输出会制造掌握感幻觉,掩盖实际记忆未被有效编码的事实。
讨论及结论

本研究将认知卸载理论延伸至生成式AI领域,揭示了ChatGPT所代表的”全面卸载”与传统工具(计算器、笔记)所代表的”局部卸载”之间的本质区别。研究还为”合意困难”框架提供了新的实验支撑:当AI即时提供结构完整的答案时,它不仅取代了答案生成的过程,更消解了促进记忆巩固的整个认知挣扎阶段。”借来的能力”这一新概念,也为AI使用中的元认知盲点研究开辟了新方向。
研究结果对教育设计有直接的政策含义。研究者提出两种可行的教学序列:其一,”先尝试后AI”策略——让学生先独立完成初步学习和自测,再用AI核对、补漏、深化理解;其二,”AI作为检索教练”策略——要求学生先独立作答,再对照AI输出获得分级反馈与追问,以保留主动检索和间隔复习的认知效益。这两种策略的核心在于:让AI充当反馈与脚手架的提供者,而非答案的替代者。
对于教育者而言,应特别警惕在新知识初次学习阶段的无限制AI使用,尤其是技术类等认知要求较高的内容领域。AI的便利性与学习的深度之间存在真实的张力,政策制定者不应仅凭直觉或短期绩效数据做出决策。对学生而言,需要建立”流畅≠记忆”的元认知意识,警惕将AI输出的清晰度误判为自身理解的深度。
本研究采用随机对照设计、45天延迟惊喜测验、跨话题子组分析和ANCOVA控制,在方法论上较既往研究有明显提升,为该领域高质量实验研究的规范提供了参考范本。
研究亮点与不足

主要亮点
本研究最突出的贡献在于其严格的因果推断设计:随机分组、预注册假设、按难度分层的主题随机分配,有效排除了选择偏误和混淆变量。45天延迟的惊喜测验设计既防止了临时备考的污染,又提供了足够的时间窗口让差异性遗忘充分显现,弥补了现有文献普遍依赖即时测试的短板。ANCOVA分析进一步揭示了AI效应独立于学习时间之外的质性成分,增强了解释深度。研究的生态效度也值得肯定——真实课程话题、自然学习情境、同伴演示任务,使结论更贴近实际教学场景。
主要局限
首先,样本流失率较高(约29.2%),虽然两组流失比例相近,且完成者与未完成者的基线特征无显著差异,但不可观测因素导致的偏误仍无法完全排除。其次,样本代表性有限,全部来自巴西某大学工商管理系,便利抽样限制了跨文化、跨学科的推广性。第三,传统组AI使用情况未被直接监控,仅依赖事后合规声明,存在污染风险。第四,关键变量依赖自我报告(AI熟悉度、学习时间),可能引入社会称许性偏差。最后,研究聚焦于记忆留存这一单一结果,未评估信息综合、批判性思维、工作效率等AI可能具有优势的其他能力维度,结论的适用范围因此存在一定局限。
编者按
原文地址:
André Barcaui,
ChatGPT as a cognitive crutch: Evidence from a randomized controlled trial on knowledge retention,
Social Sciences & Humanities Open,Volume 12,2025,102287,
https://doi.org/10.1016/j.ssaho.2025.102287.
本文编辑:李晶晶 北京航空航天大学
郑重声明:本公众号推送的文章不能代表本公众号立场。本公众号推送的学术会议、博士招生不负责对接解释。有任何疑问请按照推送内容的官方联系方式对接!如果学术会议、博士招生有任何官方调整,责任不在我方。我们优先推广免费的学术会议、讲座、研修等项目。
语言治理

欢迎关注
Language Governance Alliance

球分享

球点赞

球在看
夜雨聆风