这份AI作业的账单,两年后才会显现

一个刚上初二的女孩用AI完成了历史课的朝代表格，作业拿了A+，花的时间比同学少一半。她妈妈当时觉得，善用工具是未来竞争力。

两年后，女孩在高中分班考试的闭卷历史卷上只拿了61分，比平均线低了将近两成。她怎么也不明白，那些“自己整理”过的知识点，到了考场上像被人从脑子里直接抽走了。

这不是孤例。一项追踪了26000名7到12年级中学生、持续30个月的面板数据研究刚刚公布了完整结果。它揭开了一个被短期数字掩盖的真相：AI让作业看起来更漂亮了，但学习的真正塌方，在两年后才全数显露。

一场维持30个月的认知拆解

这项研究最让人不安的地方，不是它发现了AI会伤害学习——这几乎在直觉上就能猜到。而是它精确捕捉到了那种伤害缓慢扩散、最终集中兑现的过程。

研究显示，使用AI工具后，学生的作业平均分数立刻提升了18%，完成时间从64分钟骤降到45分钟。如果只看头几个月的数字，你会觉得这是效率的革命。真正需要盯的是闭卷考试分数，它在同一批学生身上下降了20%。升学标准化考试的成绩下降幅度更大，在18%到24%之间。

最关键的变量是时间。研究用了“整整两年才完全显现”这个表述。第一年，学生在闭卷测试里表现出一些知识掌握松动，但很多人还能靠残存的短期记忆和教师的课堂弥补勉强应付。第二年，地基彻底松动，没有新知识能稳固附着在模糊的概念网上，崩塌就发生在升学考这种真正脱离即时辅助的场合。

从学科分布来看，社会学科的长期损失最大，下降了27%；STEM领域紧随其后，降了22%；英语下降17%，即便是受损最小的语文，也有9%的下降。这个顺序本身就在说话：越需要归纳、构建逻辑链和复杂因果的学科，AI替代思考后留下的窟窿越大。

有一个细节值得单拎出来。研究中81%的长期使用者，每周作业完成时间低于50分钟。研究者把这种特征描述为“外包迹象”：学生可能不只是用AI参考，而是把整个构思、组织、表述的过程一并交了出去。短时间里，作业的完成度和速度都很漂亮，但思维肌肉的萎缩就藏在这张漂亮成绩单底下。

损失曲线为什么不是直线

通常我们会以为，用AI越多，损失就越大，两者成正比。但这份数据给出的画面更微妙一些。

每周使用AI大约一小时的学生，长期学习损失在5%左右；使用五小时，损失直接跳到30%。中间段的斜率非常陡峭。这说明存在一个临界区域，一旦跨过去，认知衰退就不再是缓慢漏气，而是近乎断崖。研究者没有断言因果关系，但几组统计指向同一个方向：学生把原本用于主动检索、试错和重组的认知过程，大量替换成了信息接收和复制粘贴。

换成真实场景就很好理解。一个学生要写一篇关于工业革命起因的论述。靠自己，他得翻书、比对资料、筛选证据，再组织成自己的逻辑链。这个过程慢，但恰好是学习发生的时刻。如果他打开AI，直接让模型生成几个分点，自己再微调一下措辞，作业完成得更快，甚至语句更流畅，但他跳过了检索、筛选和逻辑缝合这三个核心环节。短期内，他通过作业接触了同样的名词和结论，觉得自己懂了。长期闭卷时，信息检索通道没练过，论据与论点之间的结构没自己搭过，记忆就成了一堆散沙。

两年延迟的出现，很大程度上和教育体系的惯性有关。学校里的日常测验往往覆盖近期的教学内容，学生还能靠课堂印象和临时记忆勉强应对。升学考和解耦性更强的综合考试，才把那些代偿机制全部打掉。这时再回头补，成本已经翻了几倍。

另一个容易被忽略的因素是心理锚定。一个学生如果在长期使用AI后，作业一直得高分，他就会建立起“自己学得不错”的自我认知。即便闭卷成绩开始下滑，这种认知也会驱动他把原因归结为考试难度、发挥失常，而不是学习方式本身。研究里提到，早期损失幅度约25%，到了后期虽然回落到16%，却从未消失。有风险的是那种看似“补得回来”的假象，它让人以为问题只是暂时的适应期，实际上认知债已经欠下。

你不能让一个计算器去练深蹲

如果把学习比作身体的锻炼，那AI对很多学生而言更像是一台代步车。坐车到达目的地当然更快，但你不能指望它帮你练出腿部的力量。问题就在这里：大部分教育者与学生还没有意识到，完成作业和学会知识在AI时代正式分成了两条路。

这件事有意思的地方在于，它反常识地揭示了一个时间差。家长们往往用当下的作业评分判断孩子状态，但真正决定性的评估发生在两年后、发生在那场不能带AI的考场里。研究者用数据把这条隐藏的因果链拍了出来，等于是给所有正在大规模部署AI的教育系统发了一个滞后警报。

但同样不能急着吹成一曲悲歌。研究里还有一个不太被强调的数字：那些每周只短暂使用AI、仍以自己思考为主的学生，损失幅度明显更小，甚至在部分学科上出现了微弱增益。这说明工具本身不是原罪，用法和边界才是关键。一刀切地禁用或者全面放开，都是偷懒的管理思维。

推到普通人的影响层面上，这件事至少带来了三个需要警惕的场景。第一个场景是家庭作业。家长一旦看到孩子用AI快速完成功课并且得分不错，很容易放松监督。等到发现知识漏洞，常常已经是期末考甚至升学考前，回头补的难度大到很多人直接放弃。

第二个场景是自适应学习平台。现在不少产品把AI辅导作为卖点，强调“随时随地解答”“不会做的题自动给思路”。但如果这类解答变成一种思维捷径的惯常出口，学习者就永远只练吸收不练提取。两年后，考试成绩会集体现身说法。

第三个更具体的推演是，假设一个初中生从七年级开始每周用AI写英语作文。作业分数稳定在85分以上，语法错误极少。但两年后，当他要独立写一封申请邮件时，连最基本的句法结构都搭不起来，因为他从来没有真正从零组织过一段英文。这不是一个会不会用工具的问题，而是他把语言生成的权利也让渡了。

教育行业的外部强变也可能因此加速。与其继续用旧作业模式去撞AI的墙，不如大幅增加课堂上的即时板书推演、闭卷小测验和口头答辩的比例。对那些在学生报告里写“善于使用各类学习工具”的评语，也要多问一句：擅长的究竟是工具，还是替代？

至于AI公司，也该从这项研究里读懂一点风险。如果工具的收益全部集中在前端使用体验，而把代价留给了两年后的用户自己，那这种产品的长期信任迟早会被清算。比较聪明的做法，或许是在产品里嵌入一些“强制思考”环节，比如必须手动重组关键观点、必须限时闭卷自测，而不是一味优化到让用户手指都懒得动。

学习这件事从来都是反速成的。一个效果需要五年才能稳固的技能，不可能靠五分钟的模型输出来偷步。研究把那个两年后的账单甩在桌上，没别的意思，就是告诉我们：把脑力外包出去的省心，最终会精确地在不能带AI的地方，让你一厘一毫地还回来。

/ / / /

人工智能前沿动态，商业科技一手信息

👇真诚推荐关注👇