斯坦福报告:AI辅导作业,学会了还是学废了?
斯坦福大学于2026年3月发布了报告《K-12阶段AI证据库:2026 回顾》。该报告针对全球基础教育领域的AI应用现状,对截至2025年10月研究库中的800多篇相关学术论文进行了深度分析,重点考察了其中20项具有严谨因果评估标准的高质量研究。
报告中关于学习者的三个核心发现,为正处于“大模型热”与“养虾热”交织下的教育者和家长,提供了一份基于靠谱实证支撑的冷静视角。

《K-12阶段AI证据库:2026回顾》|图源:斯坦福大学

答案对了,不代表本事学会了
该报告显示,孩子在使用 AI 练习数学或写作时,即时表现通常会提高;但一旦脱离AI的帮助,孩子的学习评估效果则表现不一。慕尼黑大学的马蒂亚斯·施塔德勒博士(Matthias Stadler)认为,“虽然 AI 可以降低感知难度并增加流畅度,但这可能以削弱独立推理和知识获取为代价。”
例如,AI生成的作文反馈提高了巴西学生在议论文考试中的得分;但使用AI学习数学的美国大学生,其考试成绩并未提高;使用AI备考的土耳其高中生在最终考试中表现更差,或仅与同龄人持平。
家长需要关注孩子离开AI工具后的真实水平。因为从学习科学视角来看,一是可能未能实现学习迁移(transferring learning),二是存在元认知(metacognition)方面的风险。
“学会了用AI”不等于“掌握了知识”:这叫“迁移失败”,即并没有开发出可应用于新情境的持久知识和技能。孩子只是在学怎么使唤AI,并没有把知识和技能长在自己脑子里。
“元认知”萎缩:以前孩子得自己查资料、找思路、纠错,这叫元认知练习。现在AI全代劳了,孩子评估信息、找自身短板、选择策略的机会就变少了。

报告配图|图源:斯坦福大学

过程太省力,大脑就容易变懒
AI工具可以减轻学生的认知负担并带来积极的学习体验,但未必能促进深度思考。
研究显示,学生在解决数学证明、编程或科学探究等挑战性任务时,感受到了明显的认知缓解,学习愉悦感大增。然而,这种“不费劲、省事”并不一定转化为深度学习,尤其是在推理和论证等高阶认知任务中。有研究发现,使用通用型AI的学生在分析中的论证质量低于传统搜索组。使用AI辅助写作任务甚至会降低大脑活动并导致记忆力减弱。
家长可能发现孩子老爱问AI,让写作业变简单。但从学习科学视角来看,依赖AI工具可能让学生失去了学习所需的“必要难度(desirable difficulties)”。参与具有认知挑战的任务通常能产生更好的长期记忆和迁移效果。
AI在扫除障碍的同时,也可能顺手“偷走”了大脑的成长。 如果不加节制,AI在除掉那些不必要的麻烦(外在负荷)时,也会连带取消掉大脑为了真正“学会”而必须付出的思考代价(关联负荷)。这种失衡会让孩子产生一种“全学会了”的错觉,但一旦脱离工具,脑子里真实的知识架构其实并没有搭起来。
清理杂事是有益的:指排版、格式调整、纠错等与核心学习目标无关的无效消耗。这类“外在负荷”越少越好。AI通过自动化处理帮孩子分担这些琐事,能释放大脑资源,让孩子把精力全花在核心知识上。
省掉思考是有害的:思考是生产性努力,是大脑为了理解逻辑、建立框架、把新信息存入长期记忆而必须进行的深度加工过程。这种“关联负荷”不能省。当AI直接丢出结论、自动生成论证逻辑或代劳复杂的推理步骤时,它实际上切断了孩子深度思考的机会,知识也就无法转化为长期的个人能力。

报告配图|图源:斯坦福大学

多递梯子引导,少直接喂答案
助学型AI可能比通用型AI更有效,且其教学设计至关重要。
所谓助学型AI是苏格拉底式的,通过提问引导而非直接回答,而通用型AI则是直接给答案。实验显示,高中生认为苏格拉底式AI不如直接给答案的AI有帮助。但德国针对准教师的研究显示,受访者认为苏格拉底式AI更能支持批判性、独立性和反思性思维。
现实情况中,大部分家长和孩子没有专门的教育版AI,而是直接用普通的通用大模型(如豆包、Deepseek或ChatGPT)。在这种情况下,“如何问”就成了决定 AI 是在“喂饭”还是在“递梯子”的关键。
从学习科学视角来看,合适的引导提问能够让AI运行在孩子的“最近发展区(Zone of Proximal Development)”内。
有“认知跨越”才有进步:所谓“最近发展区”,就是孩子“独立能做到”与“在引导下能做到”之间的那个黄金学习区间。有效的学习需要一种“认知跨越”,即那种跳一跳才够得着的挑战。直接给答案,粗暴地剥夺了孩子这个“跳一跳”的过程,让大脑失去了发展的机会。
像“脚手架”一样提供动态支撑:好的问法会提供循序渐进的引导和分步骤的提示,精准地切入最近发展区。如果AI能够根据孩子的实时反馈动态调整回复,就能提供“脚手架式”的支持。
如果孩子直接问 AI“这道题怎么做?”,那就是在偷懒。但如果家长能够引导孩子换一种问法:“我正在做这道数学证明题,请不要直接给我答案或完整的证明过程。请先看我的第一步思路,告诉我是否正确,如果不正确,请给我一个间接的提示引导我思考。” 这样的引导推理式提问比直接问AI答案更好。

结 语
这些发现提醒我们,技术跑得再快,学习认知的底层逻辑未改变。
正如宾夕法尼亚大学的汉姆萨·巴斯塔尼博士(Hamsa Bastani)所言,孩子天生就会寻找偷懒的捷径,试图绕过规则去直接获取答案。因此,我们需要明确使用AI工具的边界。这套边界不是为了禁锢孩子,而是为了让孩子在学习得更快乐的同时,更有效地在最近发展区内设置必要难度,促进真正的学习。

报告目录|图源:斯坦福大学
除了上述针对学习者的核心发现,这份报告还发现了当前教育AI的研究还呈现出学科偏好明显的特征。目前的研究高度集中在逻辑明确、易量化的数学领域。而在涉及读写能力、语言艺术以及社交情感(如自我调节、共情力)等核心素养上,AI 的实际效果仍缺乏严谨验证。
该报告还为一线的教育者和政策制定者提供了实践参考启示。如果您想深入了解这份研究,点击文末的“阅读原文”,即可查阅完整报告。
【资料来源】
[1]https://scale.stanford.edu/research-in-action/understanding-evidence-base-ai-k12-education
[2]https://scale.stanford.edu/sites/default/files/The%20Evidence%20Base%20on%20AI%20in%20K-12%20Report.pdf
*本文由新航道教育研究院整理编辑,图片、音频、视频内容除已署名作品外,其余均由AI工具协助完成。未经允许不得转载,授权事宜请联系murphish@xhd.cn。
-END-

更多阅读


点一下阅读原文即可查阅完整报告

夜雨聆风