一个刚上初二的女孩用AI完成了历史课的朝代表格,作业拿了A+,花的时间比同学少一半。她妈妈当时觉得,善用工具是未来竞争力。
两年后,女孩在高中分班考试的闭卷历史卷上只拿了61分,比平均线低了将近两成。她怎么也不明白,那些“自己整理”过的知识点,到了考场上像被人从脑子里直接抽走了。
这不是孤例。一项追踪了26000名7到12年级中学生、持续30个月的面板数据研究刚刚公布了完整结果。它揭开了一个被短期数字掩盖的真相:AI让作业看起来更漂亮了,但学习的真正塌方,在两年后才全数显露。

一场维持30个月的认知拆解
这项研究最让人不安的地方,不是它发现了AI会伤害学习——这几乎在直觉上就能猜到。而是它精确捕捉到了那种伤害缓慢扩散、最终集中兑现的过程。
研究显示,使用AI工具后,学生的作业平均分数立刻提升了18%,完成时间从64分钟骤降到45分钟。如果只看头几个月的数字,你会觉得这是效率的革命。真正需要盯的是闭卷考试分数,它在同一批学生身上下降了20%。升学标准化考试的成绩下降幅度更大,在18%到24%之间。
最关键的变量是时间。研究用了“整整两年才完全显现”这个表述。第一年,学生在闭卷测试里表现出一些知识掌握松动,但很多人还能靠残存的短期记忆和教师的课堂弥补勉强应付。第二年,地基彻底松动,没有新知识能稳固附着在模糊的概念网上,崩塌就发生在升学考这种真正脱离即时辅助的场合。
从学科分布来看,社会学科的长期损失最大,下降了27%;STEM领域紧随其后,降了22%;英语下降17%,即便是受损最小的语文,也有9%的下降。这个顺序本身就在说话:越需要归纳、构建逻辑链和复杂因果的学科,AI替代思考后留下的窟窿越大。
有一个细节值得单拎出来。研究中81%的长期使用者,每周作业完成时间低于50分钟。研究者把这种特征描述为“外包迹象”:学生可能不只是用AI参考,而是把整个构思、组织、表述的过程一并交了出去。短时间里,作业的完成度和速度都很漂亮,但思维肌肉的萎缩就藏在这张漂亮成绩单底下。
损失曲线为什么不是直线
通常我们会以为,用AI越多,损失就越大,两者成正比。但这份数据给出的画面更微妙一些。
每周使用AI大约一小时的学生,长期学习损失在5%左右;使用五小时,损失直接跳到30%。中间段的斜率非常陡峭。这说明存在一个临界区域,一旦跨过去,认知衰退就不再是缓慢漏气,而是近乎断崖。研究者没有断言因果关系,但几组统计指向同一个方向:学生把原本用于主动检索、试错和重组的认知过程,大量替换成了信息接收和复制粘贴。
换成真实场景就很好理解。一个学生要写一篇关于工业革命起因的论述。靠自己,他得翻书、比对资料、筛选证据,再组织成自己的逻辑链。这个过程慢,但恰好是学习发生的时刻。如果他打开AI,直接让模型生成几个分点,自己再微调一下措辞,作业完成得更快,甚至语句更流畅,但他跳过了检索、筛选和逻辑缝合这三个核心环节。短期内,他通过作业接触了同样的名词和结论,觉得自己懂了。长期闭卷时,信息检索通道没练过,论据与论点之间的结构没自己搭过,记忆就成了一堆散沙。
两年延迟的出现,很大程度上和教育体系的惯性有关。学校里的日常测验往往覆盖近期的教学内容,学生还能靠课堂印象和临时记忆勉强应对。升学考和解耦性更强的综合考试,才把那些代偿机制全部打掉。这时再回头补,成本已经翻了几倍。
另一个容易被忽略的因素是心理锚定。一个学生如果在长期使用AI后,作业一直得高分,他就会建立起“自己学得不错”的自我认知。即便闭卷成绩开始下滑,这种认知也会驱动他把原因归结为考试难度、发挥失常,而不是学习方式本身。研究里提到,早期损失幅度约25%,到了后期虽然回落到16%,却从未消失。有风险的是那种看似“补得回来”的假象,它让人以为问题只是暂时的适应期,实际上认知债已经欠下。
你不能让一个计算器去练深蹲
如果把学习比作身体的锻炼,那AI对很多学生而言更像是一台代步车。坐车到达目的地当然更快,但你不能指望它帮你练出腿部的力量。问题就在这里:大部分教育者与学生还没有意识到,完成作业和学会知识在AI时代正式分成了两条路。
这件事有意思的地方在于,它反常识地揭示了一个时间差。家长们往往用当下的作业评分判断孩子状态,但真正决定性的评估发生在两年后、发生在那场不能带AI的考场里。研究者用数据把这条隐藏的因果链拍了出来,等于是给所有正在大规模部署AI的教育系统发了一个滞后警报。
但同样不能急着吹成一曲悲歌。研究里还有一个不太被强调的数字:那些每周只短暂使用AI、仍以自己思考为主的学生,损失幅度明显更小,甚至在部分学科上出现了微弱增益。这说明工具本身不是原罪,用法和边界才是关键。一刀切地禁用或者全面放开,都是偷懒的管理思维。
推到普通人的影响层面上,这件事至少带来了三个需要警惕的场景。第一个场景是家庭作业。家长一旦看到孩子用AI快速完成功课并且得分不错,很容易放松监督。等到发现知识漏洞,常常已经是期末考甚至升学考前,回头补的难度大到很多人直接放弃。
第二个场景是自适应学习平台。现在不少产品把AI辅导作为卖点,强调“随时随地解答”“不会做的题自动给思路”。但如果这类解答变成一种思维捷径的惯常出口,学习者就永远只练吸收不练提取。两年后,考试成绩会集体现身说法。
第三个更具体的推演是,假设一个初中生从七年级开始每周用AI写英语作文。作业分数稳定在85分以上,语法错误极少。但两年后,当他要独立写一封申请邮件时,连最基本的句法结构都搭不起来,因为他从来没有真正从零组织过一段英文。这不是一个会不会用工具的问题,而是他把语言生成的权利也让渡了。
教育行业的外部强变也可能因此加速。与其继续用旧作业模式去撞AI的墙,不如大幅增加课堂上的即时板书推演、闭卷小测验和口头答辩的比例。对那些在学生报告里写“善于使用各类学习工具”的评语,也要多问一句:擅长的究竟是工具,还是替代?
至于AI公司,也该从这项研究里读懂一点风险。如果工具的收益全部集中在前端使用体验,而把代价留给了两年后的用户自己,那这种产品的长期信任迟早会被清算。比较聪明的做法,或许是在产品里嵌入一些“强制思考”环节,比如必须手动重组关键观点、必须限时闭卷自测,而不是一味优化到让用户手指都懒得动。
学习这件事从来都是反速成的。一个效果需要五年才能稳固的技能,不可能靠五分钟的模型输出来偷步。研究把那个两年后的账单甩在桌上,没别的意思,就是告诉我们:把脑力外包出去的省心,最终会精确地在不能带AI的地方,让你一厘一毫地还回来。
/ / / /
人工智能前沿动态,商业科技一手信息
👇真诚推荐关注👇
夜雨聆风