乐于分享
好东西不私藏

AI查AI这场荒诞闹剧究竟要什么时候才能结束?

AI查AI这场荒诞闹剧究竟要什么时候才能结束?

当《滕王阁序》被测出”AI生成率100%”,当5.8万字纯手写原创论文被判定”AI率86%”,我们不得不问:AI查AI这场荒诞闹剧,究竟要什么时候才能结束?

AI本是人类语言逻辑训练的产物,如今却反过来要求人类写作不能像AI,这难道不是赤裸裸的逻辑荒谬吗?

最近有人拿AI检测工具扫了一遍《滕王阁序》,就是”落霞与孤鹜齐飞,秋水共长天一色”那篇,AI生成率100%。

王勃若是泉下有知,恐怕要质疑:千年前的创作如何用上AI?

这并非网络段子。《滕王阁序》被测出100% AI率一事,澎湃新闻、央广网、新华网、36氪、虎嗅等正规媒体均于2025年5月报道。不止王勃,朱自清的《荷塘月色》也被某检测系统判定AI生成内容疑似度高达62.88%,刘慈欣《流浪地球》的片段同样中招。连中学生课本里的经典名篇都被打成”AI写的”,检测工具到底在检测什么?

记者将这几篇经典作品上传至常用检测系统,结果显示这些经过时间检验的文学作品全部被判定为”机写”。问题在于:学术写作追求的用词规范、句式工整、逻辑严密,恰恰是AI训练时学习的对象。写得越像”好文章”,在AI眼里就越像”AI写的”。

一名博主曝光自己撰写了5.8万字的纯手写论文,花120元做AI检测,结果显示AI率86%。花费数月逐字敲出的内容,被判定为”大部分是AI写的”。更有学生反复修改论文使其逻辑更严密、论证更完整,结果AI率不降反增。

“一篇逻辑混乱、语言不通的垃圾论文能顺利毕业,但一篇倾注无数心血的严谨论文却被打回。这样的’学术纯洁’,我们到底在维护什么?”
—— 知乎用户 @学术打工仔

这个逻辑的荒谬程度可见一斑:AI本是人类语言训练的产物,如今人类写作却不能像AI,否则即被视为AI作品。这就好比说”你长得太像你爸了,所以你不是你爸亲生的”。

那AI检测的核心逻辑是什么?目前主流工具主要基于两个指标:困惑度(Perplexity)和突发性(Burstiness)。困惑度指”这段文字让AI感到困惑的程度”,AI训练时已形成对”人类写作预期”的判断框架,若文本过于工整规范,AI便判定”符合预期,系我所写”。突发性则观察文本节奏变化,人类写作有高低起伏,AI生成内容往往更平稳、更”标准”。

有计算机领域研究者指出,这一判断逻辑存在根本性缺陷:AI检测本质上是”用AI的偏见来判断文本”,”AI觉得’这像我'”并不等于”这是AI写的”,这个逻辑链条从源头上就是断裂的。

62.88%
朱自清《荷塘月色》被某AI检测系统判定的AI生成内容疑似度
来源:澎湃新闻(2025年5月)

Cell Press旗下学术期刊《Patterns》发表的研究指出,AI检测工具对非英语母语学生存在系统性歧视——研究显示,超过50%的情况下,AI检测器会将非英语母语者的写作错误判断为机器生成。《纽约时报》《科学美国人》等媒体报道,过多形容词、长句子甚至标点符号都可能触发AI警报。此外,至今没有任何统一标准,什么叫”AI率50%”?阈值设在哪里?各家工具各搞一套,学生和学校只能被动接受,被判了死刑却无申诉渠道。

这场闹剧最恶劣的影响,是它正在系统性地破坏一代人的学术写作能力。

学生为过关,开始被迫采取各种”降AI率”的操作。其一是故意把文章改得更”人类”。有学生发现,把论文改得逻辑更混乱,AI率反而降低。原本严谨的学术表达开始充斥着莫名其妙的转折、重复的表述、刻意的口语化。一名理工科博士生透露,他写论文时不得不故意加入”嗯””啊””这个”之类的口头禅,再故意写几个语法不太规范的长句,才能让AI率降下来。为证明自己是人类,必须写得像”不太聪明者”。

其二是添加各种套话来弱化逻辑。有”攻略”建议在论文里加”笔者认为””综上所述”之类的废话,或故意来几句”自问自答”的对话,能降低AI率。结果是学术论文变成了啰嗦的人机对话。

其三是花钱买”AI降重”服务。淘宝、闲鱼、QQ群里,各种”AI降重””AI率修改”服务层出不穷,价格从几十到几百不等。这些服务用另一套AI工具把文章改得”不像AI”,即学生花钱用AI来”证明自己没用AI”。更讽刺的是,检测和修改往往来自同一平台,左手查AI率,右手卖降重服务,双重收费。

还有更极端的操作。36氪报道,一些学生被迫与AI”斗智斗勇”,用方言插入、错别字掩护、甚至手写扫描再转录等”土办法”来降低AI率。即先在纸上写一遍,再扫描转成电子版。原因是手写文字经过扫描后,AI检测系统反而认不出”AI味”了。这已不是”降AI率”,而是对学生智商和学术的双重侮辱。

5亿元+
中国高校AI检测市场年规模估算(按500万毕业生×50元计算)
来源:搜狐科技综合报道(2025年)

最严重的后果还不是钱的问题。当”通过AI检测”成为写论文的第一目标,学生的写作重点从”如何清晰准确地表达思想”变成了”如何骗过检测算法”。有高校教师反映,他带的学生交上来的论文有些地方故意写得颠三倒四,问为什么,回答说”老师,这样AI率低”。老师竟无法反驳,因为学校确实要求AI率不能超过20%。

长期下去会发生什么?一代人的学术写作能力会退化。不是因为他们用了AI,而是因为他们为对抗AI检测所做的那些事情:刻意制造语法错误、故意添加逻辑漏洞、人为制造节奏混乱,本身就在系统性破坏写作规范。当”写得好”等于”AI率高”时,学术写作的标准实际上被强行拉低了。

那为什么这种不靠谱的东西还能大行其道?答案很简单:利益驱动。

中国每年高校毕业生约1000万,主流AI检测工具收费模式:按字数收,每千字1到5元;按篇收,本科论文三五十元,硕士论文近百;年度会员套餐也近百元。保守估计人均50元,500万人就是2.5亿元。考虑到修改后再检测、来回折腾,市场规模轻松破5亿。

讽刺的是,这些提供AI检测的平台,自己也在卖AI写作工具。平台A既有AI检测服务又有AI写作助手,平台B左手卖”查AI率”右手卖”降AI率”,平台C更绝,检测报告末尾直接推荐”AI修改服务”,一条龙服务。左手查AI,右手卖AI,所有的钱都流进同一个口袋。

92%
国内”双一流”高校将硕士论文AI率红线设在10%以下的比例
来源:IT之家《2026年全国高校学术检测白皮书》(2026年3月)

这维护的不是学术纯洁,而是把学生的毕业焦虑做成了一门生意,且是一门没有监管、没有标准、没有申诉机制的生意。

反观国际,欧盟2024年通过的《AI法案》把教育评估用的AI系统划入”高风险”类别,要求必须满足严格的透明度、准确性和可解释性要求。这意味着:要用AI检测学生论文可以,但必须公开检测方法、准确率数据、误判申诉机制,不能用黑箱工具给学生随便贴标签。

美国多所高校已宣布停用AI检测工具。加州大学戴维斯分校发生过AI检测工具引发的虚假作弊案件,University of North Georgia一名学生被系统误判为AI作弊后,被留校察看。更极端的案例是,有学生为自证清白进行了93分钟的屏幕录像,全程展示写作过程,仅为证明”这篇文章是我自己写的”。

国际社会在往谨慎的方向走,而我们的一些高校却在毫无保留地拥抱这项连发明者自己都承认有缺陷的技术。复旦、西南、中国传媒大学等十余所高校相继出台新规,要求本科论文AI率不得超过15%、硕士不超过10%、博士更严。阈值越压越低,学生越来越慌,这就是现状。

那到底该怎么办?以下是几条真正有用的建议:

第一,把AI检测从”判决工具”降级为”参考工具”。AI检测结果不应直接等于学术不端的证据,应与人工评审、写作过程材料(草稿、笔记、修改记录、实验日志)一起综合判断。若AI检测显示”可疑”,必须给学生申诉和辩解的机会,而非直接扣帽子。不同学科、不同写作风格,评估标准也应差异化。

第二,强制要求检测工具公开技术标准。工具若要决定学生毕业命运,本身必须经得起审查。具体而言:核心检测指标的计算方式要公开,误判率和漏判率的准确性数据要披露,第三方机构要能独立验证。应建立”AI检测工具白名单”制度,只有通过验证的工具才能用于学术评估。

第三,禁止”检测+写作”利益闭环。同一平台不能既提供AI检测又提供AI写作或修改服务,裁判和运动员必须分开。监管层面应要求平台拆分这两块业务,禁止在检测报告里推荐自家修改服务,对违规平台处以罚款并纳入黑名单。

第四,允许学生声明AI使用情况,并将其纳入课程教育。AI已经来了,禁是禁不住的。与其纠结”有没有用AI”,不如关注”怎么用AI”。学生可在论文里声明哪些部分用了AI、怎么用的、自己的贡献是什么。评价标准从”是否使用AI”转向”最终成果的质量和创新性”,这才是正道。

第五,要求提交写作过程材料,配合口头答辩。可要求学生保留多次草稿、修改记录、提示词日志,证明是”人机协作”而非”AI代写”。同时结合口头答辩,让导师通过面对面交流判断学生的真实理解程度。AI检测看的是文本特征,但文本特征不能替代对知识本身的理解,这个判断只能靠人。

若一项技术本身就充满偏见和漏洞,却被用来决定学生的毕业命运,那它维护的不是学术纯洁,而是对技术崇拜的盲目迷信。

AI检测乱象的本质,是用一种不完美的技术去解决一个复杂的社会问题。AI生成内容确实带来了学术诚信的挑战,这一点必须承认。但应对方式不应该是”宁可错杀一千,不可放过一个”。

真正负责任的做法很简单:承认AI检测的局限性,建立多元、透明、可申诉的评估机制,引导学生正确使用AI而不是把AI当敌人,最重要的是别让商业利益绑架学术诚信。

数百万学生的毕业命运,不应该被不靠谱的算法和逐利的商业平台绑架。是时候用科学、理性、负责任的态度重新给AI检测定位了。否则,今天对AI检测的盲目推崇,明天就会变成对学生权益的系统性伤害。

END
责编:林思远
审稿:周志远
来源:综合自澎湃新闻、央广网、新华网、36氪、搜狐科技、IT之家等媒体报道