现在不管是学生交课程作业,还是新媒体小编写平台文案,甚至职场人做汇报材料,很多人用完AI生成内容之后,第一反应都是找个去AI工具过一遍,生怕平台检测出来内容是AI写的,要么打回要么限流,太常见了。

很多人觉得去AI工具是什么黑科技,其实原理说穿了也不复杂,早期的AI生成内容特征特别明摆着,句子长度大多均匀分布在20到30字之间,用词都是训练集里的高频组合,很少出现人类写作里常见的冗余词要不无伤大雅的小错误,甚至连语气词的使用频率都有固定的规律,普通的AI检测工具只要抓这些特征就能轻松识别。
现在AIGC模型更新得快,生成的内容慢慢接近真人的表达,原来的去AI逻辑也就跟着升级了,现在市面上去AI工具的核心逻辑,大多是先把AI生成内容里的典型特征全部擦除,比如把AI常用的那些规整书面表达,替换成更口语化的日常用词,故意把一部分长句拆成短句,再把几个短句合并成稍长的句子,打乱原来均匀的句长分布,有的工具还会故意往内容里加一两个不方便阅读的错别字,要不几个没什么实质带来的变化的冗余词,模拟人类打字时偶尔也会犯的小失误。

另外还有一部分工具会调整内容的用词概率分布,AI生成内容的用词都是按照训练数据里的出现概率来选的,同一个意思基本只会用最高频的那几个表达,人类写东西就不一样,有时候会蹦出来个冷门的说法,甚至会用点只有自己常用的习惯用词,去AI工具就会随机替换几个用词,把原来集中在高频区间的用词概率打散,变得更接近人类的写作习惯。
还有的工具会给内容加一点微小的逻辑跳跃,AI生成的内容大多逻辑特别顺,每一句话都紧跟前面的内容,完全没有偏差,人类写东西偶尔也会会跑一点神,比如讲着工作方法,突然带一句上次用这个方法踩过个小坑之类的无关具体环节,再拉回正题,这类小容易被忽略的地方加进去,检测工具就更难把内容和AI生成的特征对应上。
确实有用,但现在AI检测工具也在跟着更新,双方其实是在接连迭代的,没有哪个去AI工具能保证百分之百逃过所有检测。
大家都用的什么来审稿呢?
夜雨聆风