这两天,“广东夏季高考将用 AI 批卷”的说法在网上转了一圈。
很快,广东省教育考试院回应:“用 AI 批卷”为不实传言。据中国网信网 5 月 29 日辟谣信息和多家媒体报道,这条说法的问题,是把 AI 辅助相关场景误读成了“AI 直接决定高考分数”。
听起来像一场普通谣言。
但我觉得,它戳中了教育科技里最敏感的一根线:AI 到底能不能进入高考、阅卷、评价这些高风险场景?
答案不是简单的能或不能。
真正的问题是:AI 可以辅助判断,但不能替代责任。
大家怕的不是AI,而是不知道谁说了算
“AI 批卷”为什么一出来就容易炸?
因为高考不是普通 App 里的推荐结果。短视频推错了,最多浪费你 30 秒;购物推荐错了,大不了退货;但考试分数一旦出错,影响的是一个人的录取、家庭预期,甚至几年努力的结果。
这里有个很现实的心理账户。
老师改卷,大家未必觉得完美,但至少知道责任主体是谁。阅卷标准、复核流程、申诉渠道,这些机制已经跑了很多年。哪怕有争议,也能追问:这道题为什么这么给分?
AI 一进来,很多人脑子里立刻浮现的是另一个画面:系统扫一眼,分数出来了,没人解释,没人负责。
这才是恐惧的来源。

不是技术本身吓人,而是判断过程变黑箱以后,信任就没地方落脚。
教育场景和商业场景最大的区别就在这里。商业产品可以先上线、再迭代、灰度测试。教育评价不行,尤其是高考这种级别的评价,不能拿学生人生做产品验证。
讲真,科技圈有时候太喜欢一句话:先让机器跑起来。
但在教育里,机器跑起来之前,得先回答一个问题:跑错了谁负责?
AI在教育里最适合做“副驾驶”
这并不意味着 AI 不能用于教育。
恰恰相反,AI 在教育里能做的事情很多。比如题目解析、错题归因、作文训练、学习规划、知识点诊断、阅卷辅助质检。很多场景里,AI 的效率和稳定性确实比人强。
问题是,它的位置要摆对。
我更愿意把教育 AI 理解成“副驾驶”,不是“主裁判”。
副驾驶可以提醒你前方有风险,可以帮你看盲区,可以降低疲劳。但方向盘最后握在谁手里,这件事必须清楚。

放到阅卷场景也是一样。AI 可以做基础识别,比如扫描答题卡、检查漏评、发现异常分差、辅助聚类相似答案。它也可以帮老师提高一致性,提醒某些样本需要复核。
但到了“这名学生最终得多少分”这一步,尤其是主观题、作文、开放式表达题,人类教师仍然应该在关键决策链上。
这里不是怀旧。
教育评价本来就不是简单的模式匹配。学生表达可能不标准,但思路是对的;答案可能绕了一点,但逻辑成立;作文可能有瑕疵,但真实、有结构、有判断。
这些地方,AI 能不能帮忙?能。
能不能直接拍板?至少在今天,我不建议。
教育AI越强,越要学会克制。
真正缺的不是模型,而是解释机制
很多教育科技产品会把重点放在模型能力上:识别率多高、批改速度多快、覆盖多少题型、生成多少反馈。
这些当然重要。
但如果要进入严肃评价场景,只讲“准”是不够的。还得讲“为什么准”、“错了怎么办”、“谁可以推翻它”。
这就是解释机制。
一个合格的教育 AI 系统,至少要能回答三件事。
第一、它依据什么评分。
不能只给一个结论:“本题得 7 分”。它要能对应到评分细则,说明扣分点、得分点、参考样本。尤其是主观题,评分依据越清晰,争议越小。
第二、它有多大把握。
人类老师也会犹豫。AI 更应该暴露不确定性。比如系统判断置信度低,就自动进入人工复核,而不是硬着头皮给出一个看起来很精确的分数。
第三、它的结果能不能被纠正。
这是很多 AI 产品最容易忽略的地方。产品经理喜欢设计“智能闭环”,但教育场景需要“申诉入口”。学生、老师、管理者必须知道:如果系统判断有问题,谁能复核,多久反馈,修改记录如何留存。
没有这些,AI 再快也只是快。
快,不等于可信。
学校和产品团队该补的3门课
这次“AI 批卷”传言被辟谣后,很多人可能会松一口气:假的,那没事了。
别急。
假的传言也能提醒真的问题。AI 进入教育已经不是“要不要”的问题,而是“怎么进”的问题。
第一门课、叫场景分级。
不是所有教育场景都一个风险等级。AI 帮学生整理错题,风险低;AI 给作文训练建议,风险中等;AI 参与正式考试评分,风险极高。
不同等级要配不同规则。低风险场景可以大胆试;中风险场景要有人工抽检;高风险场景必须有人类最终确认、全流程留痕、明确责任主体。
别把“教育 AI”四个字打包讨论。
第二门课、叫用户告知。
如果一个系统使用了 AI 辅助,学生和家长有没有权利知道?老师有没有权利了解它的工作方式?学校有没有清晰说明它参与了哪个环节?
我觉得应该有。
透明不是把技术细节全摊开,而是告诉相关方:AI 在哪里出现,做了什么,没有做什么,哪些结果由人确认。
很多信任危机不是因为技术错了,而是因为用户发现自己“被安排了”。
第三门课、叫责任链设计。
教育产品最怕责任悬空。系统说是算法判断,老师说是系统建议,平台说自己只是工具,最后学生不知道找谁。
这种链条一旦出现,信任基本就崩了。

所以,产品上线前就要想清楚:谁配置规则,谁审核样本,谁处理异常,谁对最终结果负责。别等舆论来了再补说明,那时候成本会高得多。
技术可以自动化,责任不能自动消失。
这场辟谣真正提醒我们的事
“广东夏季高考用 AI 批卷”是不实传言,这一点要说清楚。
但这场传言为什么能传播,也值得想一想。它说明公众已经默认 AI 会进入越来越多的关键环节,只是不确定它会以什么方式进入。
这对教育科技行业不是坏消息。
坏消息是,大家不信任你。
好消息是,大家已经开始认真对待你。
过去 AI 教育产品常常卖效率:省时间、提分数、批改快、反馈多。接下来,真正能走远的产品,可能要卖另一种东西:可信。
可信不是一句品牌口号,而是一整套设计:边界清楚、过程透明、结果可解释、错误可纠正、责任有人担。
说到底,教育不是不能用 AI。
教育只是不能把人交给一个没人解释的系统。
评论区聊聊:你能接受 AI 参与考试评分到哪一步?
夜雨聆风