杨建军、唐景霖:如何识别法学论文由AI生成?-夜雨聆风

杨建军、唐景霖:如何识别法学论文由AI生成?

杨建军

西北政法大学教授

《法律科学》主编

唐景霖

西北政法大学人工智能法治研究中心研究员

一、形式层面

（一）机械文风

（二）注释均匀

二、逻辑层面

（一）宏大叙事

（二）正确的废话

三、幻觉层面

（一）法条错误

（二）案例错误

（三）文献错误

一篇法学论文如由AI生成，通常可从以下几个方面来识别：

形式层面

AI输出是对训练数据里所有法学论文的语言风格的平均拟合，它会优先输出最通用、最常见、最符合学术论文“模板”的表达，天然规避个性化的行文语言。句子长度、段落结构高度均匀，多用“首先、其次、再次、最后”“申言之、质言之、进而言之”这类机械连接词，无任何长短句交错的自然节奏，无任何笔误、无任何个人化的表达偏好；注释分布极度均匀，每一段固定1—2个注释，完全不符合人类写作“引证以必要为原则”“论证需要才加注释”的要求。

（一）机械文风

【示例1】（语言平滑均一化+机械连接词+无个人行文节奏）

首先，数字人格权是数字时代人格权制度发展的全新领域，其核心是自然人对其数字身份、数字痕迹的支配与保护权利。其次，我国《民法典》人格权编为数字人格权的保护提供了基础规范框架，确立了人格权保护的一般规则。再次，司法实践中，各地法院针对数字人格权侵权案件作出了诸多有益的探索，形成了一批典型案例。最后，学界针对数字人格权的立法完善展开了深入的研究，提出了多种制度建构方案。

问题分析：

1.句子长度、段落结构高度均匀，每一句话都是相同的句式，无任何长短句交错的自然节奏，语言极度平滑，没有任何个人化的行文习惯与笔误，是AI生成文本的典型风格。

2.全程无任何实质信息，只是重复“数字人格权保护”的语义，无任何问题指向、无任何观点输出，两句话能说清的内容，用机械的“首先其次再次最后”反复赘述。

3.人工学术写作不会用如此机械的连接词堆砌，会直接点出核心问题。比如“数字经济的发展催生了数字人格权的保护需求，但我国《民法典》人格权编仅对个人信息保护作了原则性规定，未明确数字人格权的权利属性与保护边界，司法实践中出现了裁判标准不统一的困境”。

（二）注释均匀

【示例2】（注释分布机械均匀+为加注释而加注释）

（段落1）数字人格权是数字时代人格权制度发展的全新领域，其核心是自然人对其数字身份、数字痕迹的支配与保护权利[1]。

（段落2）我国《民法典》人格权编为数字人格权的保护提供了基础规范框架，确立了人格权保护的一般规则[2]。

（段落3）司法实践中，各地法院针对数字人格权侵权案件作出了诸多有益的探索，形成了一批典型案例[3]。

（段落4）学界针对数字人格权的立法完善展开了深入的研究，提出了多种制度建构方案[4]。

问题分析：

1.AI生成的注释分布极度机械，每一个段落固定1个注释，均匀分布，完全不符合人工学术写作的规律。

2.注释大多是泛化引用，和正文论证无强关联性；为了加注释而加注释，是AI生成文本的典型特征。

逻辑层面

由于上下文机制的限制，AI的注意力倾向于集中在最近的上下文，它更关心当下的句子和前一段是否通顺，而非关心这句话是否服务于整篇的核心命题。

一篇法学论文的核心命题，可能在AI生成到第3部分时，就已经被它遗忘。前文主张“个人信息侵权适用过错推定责任”，后文却用“无过错责任”的论据展开论证；前面批判了某学者的观点，后面又把该观点作为自己的核心论据；制度建构部分完全脱离了前文提出的规范漏洞，出现“提出的问题和解决方案完全脱节”的情况。

AI所有的“问题”都来自训练数据及数据库里已有的、别人提出过的问题，它无法真正理解“这个问题为什么重要，为什么值得研究”。所以AI的叙述都偏向宏大叙事，AI生成的法学论文，永远都在说“XX领域的发展对法律提出了新挑战”，却说不清楚“挑战到底是什么，现行法到底有什么具体的漏洞，司法实践中到底出现了什么无法解决的困境”。

大语言模型在预训练完成后，首先会经过有监督微调，学会遵从人类的基础指令，掌握基础的对话范式；在此基础上，通过基于人类反馈的强化学习或直接偏好优化，使AI倾向于输出更安全、更符合主流价值观、不出现争议性内容，从而避免犯错。AI基于以上对齐机制，后天习得规避有争议的、有锋芒的、可能出错的观点，优先输出最主流、最安全、最不会被质疑的内容。

这就是为什么AI写的论文，永远都是“正确的废话”，永远没有自己的核心立场，永远不敢对主流观点提出批判，更不敢提出突破性的、有争议的制度设计，表现出“无立场、无锋芒、无批判”的特征。

（一）宏大叙事

【示例3】（无问题导向+宏大叙事+无核心命题）

数字经济的快速发展，对我国的法律规制体系提出了全新的挑战。数字经济具有平台化、数据化、智能化的特征，传统的法律规范难以应对数字经济带来的新型法律问题。因此，我们应当完善数字经济的法律规制体系，推动数字经济的健康发展。

问题分析：

1.全程无任何具体的真问题，没有明确现行法到底存在什么漏洞、司法实践中出现了什么同案不同判的困境、理论上存在什么体系冲突，只有宏大叙事，完全没有学术论文必备的问题意识。

2.无任何核心命题，两句话能说清的内容，用重复的语义反复赘述，无任何信息增量，任何主题的论文都可以套用这套话术，是AI生成内容的典型特征。

（二）正确的废话

【示例4】（制度建构全是正确的废话，无任何落地内容）

针对我国数字经济反垄断的法律规制困境，应当从以下方面完善：第一，完善相关立法，填补制度漏洞；第二，加强执法力度，提升监管效能；第三，健全协同机制，形成监管合力；第四，强化国际合作，接轨国际规则。

问题分析：

无任何具体的制度建构内容，没有明确要修改《反垄断法》的哪一条、增设何种审查标准、完善何种执法程序、协同机制的主体与流程是什么；任何主题的论文都可以套用这套话术，无任何针对性。

幻觉层面

AI所有的法律领域的幻觉问题，都可以溯源至其基本技术原理。AI生成的基本逻辑是自下而上的逐token（词元）概率预测，它不会先想清楚整篇文章的逻辑，只会根据给定的提示词，从第一个字开始，每一步都只预测“在当前上文语境下，下一个出现概率最高的字词是什么”，实质是一场超长的、符合统计规律的文本接龙。

即使有后续的微调及对齐工作，从本质上看，AI仍然没有真正的语义理解能力，也没有真正的逻辑推理能力。

它不知道“民法典第1195条”的规范目的、构成要件、体系定位，只知道在训练数据里，“民法典第1195条”和“网络侵权责任、通知删除规则”这几个词高频共同出现，因而就会在生成时把它们拼接在一起。

由于AI的基本技术原理限制，当使用者提示词撰写不当时，AI极易出现“你让我引用案例又没要求必须与裁判文书网完全能对应，我编的案例也是案例”的逻辑谬误，或者出现当作者提示词撰写的感情倾向和结论倾向过于明显的时候，AI会出现“你让我结合案例得出某结论，我觉得没道理但你这么要求我也没办法”的逻辑谬误。

（一）法条错误

AI对于法条引用的错误主要是由于其训练数据落后，加之缺少法律逻辑训练导致的。

【示例5】（新旧法条混用）

2024年施行的新《中华人民共和国公司法》第47条规定，有限责任公司股东的认缴出资期限不得超过2年，超出该期限的出资约定应属无效。

问题分析：

1.2024年7月1日施行的新公司法第47条，明确规定股东出资期限不得超过5年，而非2年。

2.“2年出资期限”是2005年旧公司法的规定，早已被2013年公司法修订废止，AI训练数据滞后，混淆了新旧规范的核心内容，且对生效条文的表述完全错误。

3.针对2023—2025年新修订或出台的法律，AI极易出现此类滞后性错误，应成为审稿的核心核验点。

（二）案例错误

【示例6】（真案子，假结论）

最高人民法院第24号指导性案例（荣某诉王某机动车交通事故责任纠纷案），确立了“知假买假不影响消费者主张惩罚性赔偿”的裁判规则，为食品药品纠纷案件的审理提供了明确依据。

问题分析：

1.第24号指导性案例的核心要旨是“交通事故受害人的体质状况对损害后果的影响，不属于可以减轻侵权人责任的情形”，与知假买假完全无关。

2.“知假买假不影响惩罚性赔偿主张”的规则，见于最高法第23号指导性案例，AI张冠李戴，对指导性案例的核心内容完全不掌握，是人工专业写作通常不会犯的错误。

（三）文献错误

【示例7】（编造学者观点+虚构文献+跨学科强行绑定权威，张文显老师、王利明老师和张明楷老师是AI编造时偏好使用的名字）

学界通说认为，人工智能生成物的著作权归属应当适用“投资者优先原则”，这一观点得到了王利明、张明楷等学界权威学者的普遍认可（王利明，2025；张明楷，2024）。

问题分析：

张明楷教授是刑法学者，从未发表过关于人工智能著作权归属的民法学相关论文。上述表达属于AI跨学科强行绑定权威学者，完全虚构的引用。

文献错误还包括虚构注释。近期，某教师在核查一篇硕士学位论文时发现，文章虚构注释的比例，高达35%。最核心的原因是法学论文脚注格式高度规范化，且注重参考文献的权威性。这使得模型在训练中学习到，权威主体的引注似乎能让文本更符合学术要求，因此会主动拼接权威学者姓名、核心期刊名称、知名出版社，编造看似权威的引注，哪怕内容完全不存在。

说明：本文的【示例】由AI生成

图片来自网络

推荐阅读

点击上图，即可购书

《AI时代法律人智能手册：DeepSeek实用指南》

赵精武翁壮壮 / 著

法律出版社2025年版

中国法律评论

《中国法律评论》于2014年3月创刊，由中华人民共和国司法部主管、法律出版社有限公司主办。《中国法律评论》现为中国法学核心科研评价（CLSCI）来源期刊，中文社会科学引文索引（CSSCI）来源期刊，中国人文社会科学AMI综合评价核心期刊，全国中文核心期刊，“复印报刊资料”重要转载来源期刊。

《中国法律评论》秉持“思想之库府，策略之机枢”之理念，聚焦中国本土的法治问题，阐释法律思想，弘扬法律精神，凝聚法律智慧，研拟治理策略，为建设法治中国服务，为提升法治效能服务，为构建中国自主知识体系服务。

《中国法律评论》唯一投稿邮箱：

chinalawreview@lawpress.com.cn

（我刊编辑部从不收取任何版面费或发稿费，任何承诺发文的收费信息均为诈骗信息）

中法评微信公众号投稿邮箱：

stonetung@qq.com

刊号：CN10-1210/D

电话：010-83938198

传真：010-83938216