这两天看了很多篇中小学生作文,发现有很多作品让人眼前一亮:结构严谨、表达准确、语言流畅。还有些作品,构思之巧、认知之高、思考之深,让人惊叹。从个人有限的经验来看,我在他们这个年纪时,身边几乎所有人——包括我那个后来考上名校的优秀同桌,都没有这样的写作水平。
这是令人欢欣鼓舞的。有这么多认真观察、热爱思考、善于表达的花朵,未来一定可期。
这也是必然的。社会在进步,文明在发展,孩子们获得信息的渠道和方式越来越丰富,获取的信息也越来越多。这些信息进入大脑,不管是自发思考还是自觉思考,都大大有益于大脑的发育,写出高水平的文章也算理所当然。

然而,每当看到那些语句工整、逻辑严谨的文章,我就会怀疑:这是不是AI写的。这可能是我的认知局限:因为15岁以下的孩子很少阅读复杂文本,也不惯用复杂的长句,我认为他们是不具备这样的表达能力的。于是越是工整严谨程度高的文章,我的怀疑度就越高。有两篇,用网络工具检测了一下,结论是AI率100%。
这是要一票否决的,我必须慎重。又轻声读了几遍,终于确认:AI无疑——在那些工整的语句、华丽的语言和严丝合缝的逻辑里,你体会不到任何喜欢的或者憎恶的,明亮的或者灰暗的,开朗的或者抑郁的,昂扬的或者消沉的感情。
直到晚上,看到一条热搜:“朱自清散文AI率超60%”,我的第一反应是,这到底是人工智能还是人工智障?如果连《荷塘月色》都过不了检测,那这套工具究竟在测什么?它检测的是是否由AI生成,还是是否足够规范、足够严谨、足够漂亮?
《荷塘月色》当然有结构,有逻辑。但有两样东西,是所有AI检测工具都测不出来的:一样是,一个知识分子在1927年的夏夜,踱出门时“颇不宁静”的心境,写出来的文字,有压抑、有逃避,也有片刻的出神。那些句子,之所以动人,不是因为它们工整,而是因为它们表达了在那个特定时刻作者复杂的情感。
另一样是那个绝妙的修辞手法:通感。朱自清写荷花的清香,说那“缕缕清香,仿佛远处高楼上渺茫的歌声似的。”学这篇文章的时候,应该是高一。当我读到此句,立即惊为天人。初一初二时学他的另外两篇文章,已经觉得是天花板级别的,没想到,高中还有惊喜。真是知其好,却不知竟如此好。
我不知道这套检测工具背后的逻辑是什么。但如果只看遣词造句的模式,看句式的规整程度,看有没有过度流畅、过度严谨的嫌疑,那么,新文化运动以来,大部分作家的作品都可能不过关——毕竟普通话的语法规范,范本就是“典范现代白话文著作”;更别说《西游记》《水浒》以及传统章回体小说里,描写人物出场时那工整到有削足适履之感的大段文字了。估计AI率也可以飙升至100%。
我突然意识到一个问题:被我剔除的那两篇文章,是因为我怀疑它们结构过于严谨、逻辑严丝合缝,判断依据是没有感情。但AI检测工具的判断依据恰恰是我的怀疑点——工具是不讲感情的。也就是说,我和工具在做同一件事:把工整规范等同于AI。这难道不是一个悖论?
结果呢?结果是,一个孩子写出了工整规范的作文,他可能会受到惩罚——因为写得“太好”了。而一个真的使用了AI的孩子,只要学会一点点技巧——随机插入几个错别字、打乱几处语序、加一两句无厘头的废话,就可能轻松通过检测。
一股荒谬感油然而生。
我本来想防止作弊,结果却变成了一场“狼人杀”的游戏——看谁更会伪装。不会伪装的,作品越好越可疑;会伪装的,反而能安全过关。但那些真正在思考、在感受、在用自己的语言表达的孩子呢?他们可能会因为形式上的不严谨、不流畅,早早地就被筛掉了。
我突然有些不确定:我剔除掉的那两篇,真的是AI生成的吗?我又找来读了几遍,还是确认了它们无法入围下一轮的资格。
但是,当一个社会的写作标准被算法悄悄定义时,那些真正属于人的、带着温度和棱角的文字,会不会从我们的语言里消失?

本文纯手打,但写完时,我用的那个检测工具的免费次数用完了。等过了零点,我用它检测一下,在评论区公布本文AI率。
夜雨聆风