AI与文书系列之一:如何甄别AI生成的文书

本系列是2025年11月8日在26、27fall学生群组织的免费讲座的实录。

本系列重点是讲AI到底能不能用来写文书，或者说如果不直接使用AI写文书，申请的其他方面可不可以用得上AI。另一个关键点是，很多申请人很关心招生的老师或者学校，是否会采取一些手段来甄别文书是否由AI写作出来，如果甄别出来了，对录取有没有影响。以及除了文书以外，学校还会使用哪些科技工具来辅助录取(本科申请更常见)。这些话题有很多细节和故事，我计划分几篇文章说一说我看到的真实情况。

注意:想看AI文书的常见特点的直接转到第三部分!

一、AI已开始参与大学的申请审核:“AI初审+人工审核员”的混合模式

加州理工学院（Caltech）、纽约大学（NYU）已公开承认，其在招生流程中使用AI进行初步审核甚至筛选。结合公开及半公开信息，初审阶段可能被AI直接淘汰的申请资料，通常具备以下一项或多项特征：

1. 学术门槛不符

GPA、语言成绩（托福/雅思）、标化成绩（SAT/ACT）明显未达到学校基本要求。

2. 内容模板化或真实性存疑

材料叙述前后矛盾，履历真实性受质疑，文书内容高度同质化。需特别提醒的是，许多学校已建立历年录取文书数据库，盲目套用网络范文（包括中介公开的“成功案例”）风险极高。特别是，你在小红书上看到某个中介挂出来的录取范文，然后呢，你要求AI按照这个范文的写作风格给你改，他会把语言风格给你改成那个范文的样子。这样产生的文书极易触发学术不端的检测机制，即便不涉及直接抄袭，也可能因风格雷同被判定为“非原创”。所以，如果你想要修改文书的行文风格，最好自己动手，不要使AI来改。

3. 与学校匹配度低

选校策略模糊，申请材料未呼应目标院校的办学理念与文化。典型失误包括学院拼写错误、混淆校史人物、引用项目的课程错误（引用了其他学校类似的项目）等。

4. 活动背景缺乏辨识度

这里不是指活动的规模和名气，而是活动与申请专业相关性弱，或经历描述得平淡无奇，无法体现申请人的核心素质与差异化优势。

5. 被甄别为AI生成文书

AI检测工具可轻易识别的生成式文本，将直接影响录取评估。需明确的是，学校并非仅依赖单一工具的百分比数值（如80%生成概率）直接拒录，而是结合人工来复核。若文书内容机械生硬、缺乏人味儿，必然导致申请失败。此外，部分院校（如港大）已明确禁止使用AI撰写文书，申请系统中亦会有相关声明，违反将直接丧失申请资格。这一点小红书上有人总结过，你们可以搜到一些官网的描述。

关于AI的合理使用边界：

不建议直接指令AI“修改文书”，因为AI的修改通常是全局性的。即便你只是想针对某句话提出调整，它也可能会重构整段的语序、句式甚至语言风格。更稳妥的方式是：让AI评估文书质量并提出改进建议（如逻辑漏洞、表达冗余等），再由申请人基于建议自行完成英文修改。

二、关于AI检测工具的局限性与商业化困境

当前主流AI检测工具包括Turnitin（https://www.turnitin.com/solutions/topics/ai-writing/）、GPTZero（https://gptzero.me/）及针对中文的Decopy（https://decopy.ai/zh/ai-detector/）。但这些工具的可靠性存在显著争议：

以Turnitin为例，同一篇文书在9月初检测时AI生成率仅为3%，10月复测却升至30%以上，而文书内容未作任何改动。这种波动源于工具的算法更新，且部分检测平台存在商业化倾向。他们通过抬高AI生成率，诱导用户购买“降AI”服务，导致检测结果逐渐偏离客观标准。

为验证检测有效性，我曾用三款工具对同一篇文书进行测试：Turnitin判定98%为AI生成，第二款工具判定35.67%，第三款工具则完全未检测到AI痕迹。于是我用GPT进行深度分析，GPT给了我一个很长很长的回复，举出细节和例子证明该文书“AI生成可能性极低”。可见，当前检测工具的准确性尚未成熟，不同工具的判定逻辑存在显著差异。

三、易被检测为AI生成的文书特征

AI生成的文本在结构与表达上具有可识别的规律性，主要体现在以下五个方面：

1. 滥用层级性质的连接词

AI倾向于使用高度标准化的段落衔接词，如firstly, secondly, lastly, in conclusion。这类连接词虽符合语法规范，但会显著降低文本的个性化程度，暴露生成式特征。

2. 生硬的段落过渡

在新段落开篇时，AI频繁使用building on this foundation/experience等公式化表达强行衔接上文。这种过渡不仅冗余（如“基于这段经历，我开展了……”可直接简化为“基于此，我开展了……”或者“后来我参加了另一个类似的实习”），还会打断阅读节奏。因为有时根本就不需要先写上一段经历然后再说下一段，你直接说下一段的主题词就行了。更地道的衔接应依赖语义逻辑的自然延伸，比如，given based on such experience, prompt me, prompt me to do something. 或者，Similarly, 而Furthermore必须是与前文存在递进关系才能使用。

3. 长段落内的低效衔接

AI生成的段落常过度冗长（单段字符数超1500甚至3000），且频繁使用in addition, additionally, moreover, furthermore等递进词。需注意：后面两个词的使用有严格的场景限制，仅当两句间存在明确的时间、空间或逻辑递进关系时才适用。超长段落会稀释核心信息，招生官也许只看了topic sentence觉得这段没意思就不看了，那你写在段落中间部分的亮点是不是很容易被漏掉呢？有些学生还特别喜欢使用however等表示转折的词来引出段落的重点，可是招生老师3-5分钟以内就要看完一篇文书，然后你让人家努力去找某一段的重点，你觉得这现实吗？我觉得不太现实，所以一定要把每一段的段落控制在1200~1500 characters之间。

4. 缺乏native speaker的衔接逻辑

高级的文本衔接是通过语义逻辑直接过渡过去的，包括代词、从句与同义替换，而非重复前文提到的连接词。我这里有一份兰德智库撰写的关于人工智能对军事领域影响的summary，这个小文章非常典型地使用了多种句子链接的手段，我还把指代的部分标了出来，大家可以拿去看一看为什么这个文章一看就是native speaker写的，肯定不会是AI生成的。后面我会专门出一篇文章讲一讲这个小文章衔接上的精妙之处。比如用this uncertainty承接上一段的“高度不确定性”），用deficiencies总结上一段的具体缺陷），而非重复使用this experience等低级表达。

5. 语言抽象化与感性缺失

AI的逻辑链条短且直接（A→B→C），难以处理复杂的细节延伸与情感表达。例如，我经手的一个申请人申请发展经济学时，她原有的文书写到恒大地产暴雷，但是描述得十分抽象，使用了“信息不对称“、公司治理缺陷”和“系统性脆弱”“等抽象术语概括问题，这些部分AI很容易写出来，当然也有必要写明，但是发展经济学里面肯定还涉及到有关社会伦理方面的东西，我自己在修改的时候就联想到恒大暴雷可能影响到亿万家庭的住房、生存压力、以及货币的稳定性。这种对民生的共情，以及具体点出哪些系统性缺陷，是AI很难做到的，至少需要你给出非常详尽的提示词，那么既然这么麻烦，为什么不干脆自己思考自己写呢？

总之，AI这种“重理性轻感性”的特征，尤其不适用于商科社科（ESG、公共政策、经济学、社会学等等）等需要体现价值观与热情的专业文书。当你想要在正文里写一个生动的故事，那么AI给你的结果一定是令人失望的。

6. 罗列过多数据，严重时出现幻觉

这个是怎么被我发现的呢？因为我是经常看网上小说的，我发现有一些小说作者现在的文风跟以前不一样了，时不时冒出一个数据，冒出一个非常细非常细的细节，而且还跟他主题完全不搭，所以这个AI的幻觉怎么体现呢？就是这个AI系统，当它的参数调的不是很好，或者你选那个模型不对劲。那他调出来的结果就会产生一些幻觉，会希望用一些数字细节来证明你的论点。然后这些数字细节你没有输入给他，而是AI自己编造出来的，就会显得非常奇怪了或者说跟全文整体的架构不协调。

有时候，AI还他会搞混。比如你写了两段项目经历，第一段项目是2024年，第二段项目是2025年的。然后你的简历里面明明是2024年的你有一段什么98%的准确率，然后AI把它嫁接到另一个2025年的经历里面去了。这就跟你的简历矛盾了。再比如，当你想要计算的某个增长率，比如用今年预测明年的，但是我们一般很少去预测后年的。但AI可能会用网上最长搜索到的某一个复利公式，算出一个平均值，他用到了两年以上的数据，直接给你说，我用25年预测出27年的数据可能是怎么样，这不就很奇怪吗？

这种“数据过量”和“”推理过载“不仅无法支撑论点，反而会暴露生成式特征。真实文书中引用的数据应该与你的经历强相关，且经得起逻辑推敲。

四、不要迷信AI的逻辑能力

最后，我指出大家普遍对AI存在的误区，误认为AI的逻辑能力已经强过人类了。其实，远远还没有，尤其在需要深度推理的场景中，其输出往往难以满足文书的要求。

以文书开头写作为例：我曾经为一位工作多年的会计从业人员创作了一份文书，其开头是：“与大多数通过成就培养热情的候选人不同，我对会计的兴趣始于一次挫败感：我无法完全理解毕马威审计师在香港讨论复杂会计准则时所说的内容。当时我礼貌地点头，但坦白说，想成为内部审计师的愿望随即涌现。经过四年的工作经验，我确信会计与审计是一家公司的灵魂，也将成为我的毕生事业，这就是我申请硕士项目的原因。”

这段表述通过“挫败感→反思→职业目标”的逻辑链，清晰展现了申请动机的真实性。而某一位前来咨询的CS专业学生，把我给他做参考的这个开头直接扔给了AI，套用写出来的结果是：“与大多数候选人因惊叹于人工智能的完美表现而产生热情不同，我的兴趣是源于看到我的手写字符识别模型错误分类一些任何人都能立即识别的单词时的沮丧。这不仅仅是一个错误，它让我意识到机器在感知、理解和适应方面距离人类还有多远……”

对比可见，AI改写后的逻辑存在明显漏洞：“人工智能的完美表现”与“需要研究改进”自相矛盾。如果人工智能非常完美，flawless, perfect，那你还要研究它干嘛？不用研究，现在直接用人工智能就可以了对吧？就是因为它不是很完美或者有改进的余地，所以你才要去探索，这个逻辑才说得通嘛。另外，使用“距离人类还有多远”等抽象表述，替代了原版中具体的“无法理解会计准则”的个人体验，反而削弱了文书的说服力。

由此可见，AI仅仅是辅助工具，无法替代申请人的深度思考与个性化表达。使用AI后，务必进行人工复核与调整，避免因逻辑断层或表达空洞影响文书的整体效果。