AIGC查重| AI检测工具再次引发争议:雷军34年前论文AI率超标
小米创始人雷军1992年发表于国家一级学报的一篇论文,在当下的AIGC检测系统中,测出了可能“不合格”的结果。1992 年,雷军在武汉大学求学期间发表的论文《计算机病毒判定专家系统原理与设计》,发表时通用 AI 技术尚未出现,是实打实的原创研究。可如今用四款主流 AIGC 检测平台测试,结果天差地别:两款显示 0%,一款 4.12%,还有一款高达 23.8%。若按部分高校 “AI 率低于 20%” 的硬标准,这篇经典论文竟可能 “不合格”。荒诞结果的背后,是 AIGC 检测工具的普遍不靠谱。乱象根源很清晰:检测平台算法不透明、行业无统一标准,同一篇论文在不同平台结果差 20 个百分点以上。商业平台两头收费,既卖检测又卖降重,最终买单的是学生和学术生态。首先,学生的时间和金钱被消耗在毫无意义的事情上。
一位学生单是测试不同平台就花了700块。而“降AI”服务动辄几十到上千元不等-。真正用来做研究的时间呢?被挤没了。其次,论文质量被牺牲。
经过工具“降AI”处理的论文,逻辑往往变得稀碎。一个本该严谨的学术论述,硬生生被改成了大白话。这是对学术写作本身的一种伤害。
思考两个问题
一:AI率检测,到底是防作弊的手段,还是制造了新的作弊方式?
本来是为了防AI代写。结果呢?催生了“降AI”灰色产业,大家不是在研究如何提升论文质量,而是在研究如何“骗过检测系统”。这等于把“魔”和“道”都摆在学生面前:你自己选吧。
AI检测平台之间的差异超过20个百分点。四川大学要求不超过20%,南京工业大学让学院自己定标准,鲁东大学的标准是AI特征值小于50%即算通过-1-。如果换一所学校,同一个学生、同一篇论文,结果可能截然不同。这本身就说明“一刀切”式的AI率指标缺乏科学依据。AI检测的本质是什么?
用算法判断内容是否由算法生成。
这件事在逻辑上就存在一个悖论。如果AI生成的内容可以越来越接近人类写作,那么算法凭什么区分二者?反过来,如果人类写得太严谨、太规范,算法就会把人错判成AI。
那究竟谁是“人”,谁是“机器”?让机器来判断的话,这个问题可能根本没有答案。