广东辟谣 AI 批高考卷后,教育科技行业该补这3课了

这两天，“广东夏季高考将用 AI 批卷”的说法在网上转了一圈。

很快，广东省教育考试院回应：“用 AI 批卷”为不实传言。据中国网信网 5 月 29 日辟谣信息和多家媒体报道，这条说法的问题，是把 AI 辅助相关场景误读成了“AI 直接决定高考分数”。

听起来像一场普通谣言。

但我觉得，它戳中了教育科技里最敏感的一根线：AI 到底能不能进入高考、阅卷、评价这些高风险场景？

答案不是简单的能或不能。

真正的问题是：AI 可以辅助判断，但不能替代责任。

大家怕的不是AI，而是不知道谁说了算

“AI 批卷”为什么一出来就容易炸？

因为高考不是普通 App 里的推荐结果。短视频推错了，最多浪费你 30 秒；购物推荐错了，大不了退货；但考试分数一旦出错，影响的是一个人的录取、家庭预期，甚至几年努力的结果。

这里有个很现实的心理账户。

老师改卷，大家未必觉得完美，但至少知道责任主体是谁。阅卷标准、复核流程、申诉渠道，这些机制已经跑了很多年。哪怕有争议，也能追问：这道题为什么这么给分？

AI 一进来，很多人脑子里立刻浮现的是另一个画面：系统扫一眼，分数出来了，没人解释，没人负责。

这才是恐惧的来源。

不是技术本身吓人，而是判断过程变黑箱以后，信任就没地方落脚。

教育场景和商业场景最大的区别就在这里。商业产品可以先上线、再迭代、灰度测试。教育评价不行，尤其是高考这种级别的评价，不能拿学生人生做产品验证。

讲真，科技圈有时候太喜欢一句话：先让机器跑起来。

但在教育里，机器跑起来之前，得先回答一个问题：跑错了谁负责？

AI在教育里最适合做“副驾驶”

这并不意味着 AI 不能用于教育。

恰恰相反，AI 在教育里能做的事情很多。比如题目解析、错题归因、作文训练、学习规划、知识点诊断、阅卷辅助质检。很多场景里，AI 的效率和稳定性确实比人强。

问题是，它的位置要摆对。

我更愿意把教育 AI 理解成“副驾驶”，不是“主裁判”。

副驾驶可以提醒你前方有风险，可以帮你看盲区，可以降低疲劳。但方向盘最后握在谁手里，这件事必须清楚。

放到阅卷场景也是一样。AI 可以做基础识别，比如扫描答题卡、检查漏评、发现异常分差、辅助聚类相似答案。它也可以帮老师提高一致性，提醒某些样本需要复核。

但到了“这名学生最终得多少分”这一步，尤其是主观题、作文、开放式表达题，人类教师仍然应该在关键决策链上。

这里不是怀旧。

教育评价本来就不是简单的模式匹配。学生表达可能不标准，但思路是对的；答案可能绕了一点，但逻辑成立；作文可能有瑕疵，但真实、有结构、有判断。

这些地方，AI 能不能帮忙？能。

能不能直接拍板？至少在今天，我不建议。

教育AI越强，越要学会克制。

真正缺的不是模型，而是解释机制

很多教育科技产品会把重点放在模型能力上：识别率多高、批改速度多快、覆盖多少题型、生成多少反馈。

这些当然重要。

但如果要进入严肃评价场景，只讲“准”是不够的。还得讲“为什么准”、“错了怎么办”、“谁可以推翻它”。

这就是解释机制。

一个合格的教育 AI 系统，至少要能回答三件事。

第一、它依据什么评分。

不能只给一个结论：“本题得 7 分”。它要能对应到评分细则，说明扣分点、得分点、参考样本。尤其是主观题，评分依据越清晰，争议越小。

第二、它有多大把握。

人类老师也会犹豫。AI 更应该暴露不确定性。比如系统判断置信度低，就自动进入人工复核，而不是硬着头皮给出一个看起来很精确的分数。

第三、它的结果能不能被纠正。

这是很多 AI 产品最容易忽略的地方。产品经理喜欢设计“智能闭环”，但教育场景需要“申诉入口”。学生、老师、管理者必须知道：如果系统判断有问题，谁能复核，多久反馈，修改记录如何留存。

没有这些，AI 再快也只是快。

快，不等于可信。

学校和产品团队该补的3门课

这次“AI 批卷”传言被辟谣后，很多人可能会松一口气：假的，那没事了。

别急。

假的传言也能提醒真的问题。AI 进入教育已经不是“要不要”的问题，而是“怎么进”的问题。

第一门课、叫场景分级。

不是所有教育场景都一个风险等级。AI 帮学生整理错题，风险低；AI 给作文训练建议，风险中等；AI 参与正式考试评分，风险极高。

不同等级要配不同规则。低风险场景可以大胆试；中风险场景要有人工抽检；高风险场景必须有人类最终确认、全流程留痕、明确责任主体。

别把“教育 AI”四个字打包讨论。

第二门课、叫用户告知。

如果一个系统使用了 AI 辅助，学生和家长有没有权利知道？老师有没有权利了解它的工作方式？学校有没有清晰说明它参与了哪个环节？

我觉得应该有。

透明不是把技术细节全摊开，而是告诉相关方：AI 在哪里出现，做了什么，没有做什么，哪些结果由人确认。

很多信任危机不是因为技术错了，而是因为用户发现自己“被安排了”。

第三门课、叫责任链设计。

教育产品最怕责任悬空。系统说是算法判断，老师说是系统建议，平台说自己只是工具，最后学生不知道找谁。

这种链条一旦出现，信任基本就崩了。

所以，产品上线前就要想清楚：谁配置规则，谁审核样本，谁处理异常，谁对最终结果负责。别等舆论来了再补说明，那时候成本会高得多。

技术可以自动化，责任不能自动消失。

这场辟谣真正提醒我们的事

“广东夏季高考用 AI 批卷”是不实传言，这一点要说清楚。

但这场传言为什么能传播，也值得想一想。它说明公众已经默认 AI 会进入越来越多的关键环节，只是不确定它会以什么方式进入。

这对教育科技行业不是坏消息。

坏消息是，大家不信任你。

好消息是，大家已经开始认真对待你。

过去 AI 教育产品常常卖效率：省时间、提分数、批改快、反馈多。接下来，真正能走远的产品，可能要卖另一种东西：可信。

可信不是一句品牌口号，而是一整套设计：边界清楚、过程透明、结果可解释、错误可纠正、责任有人担。

说到底，教育不是不能用 AI。

教育只是不能把人交给一个没人解释的系统。

评论区聊聊：你能接受 AI 参与考试评分到哪一步？