杨建军、唐景霖:如何识别法学论文由AI生成?

杨建军
西北政法大学教授
《法律科学》主编

唐景霖
西北政法大学人工智能法治研究中心研究员
目次
一、形式层面
(一)机械文风
(二)注释均匀
二、逻辑层面
(一)宏大叙事
(二)正确的废话
三、幻觉层面
(一)法条错误
(二)案例错误
(三)文献错误
一篇法学论文如由AI生成,通常可从以下几个方面来识别:
形式层面
AI输出是对训练数据里所有法学论文的语言风格的平均拟合,它会优先输出最通用、最常见、最符合学术论文“模板”的表达,天然规避个性化的行文语言。句子长度、段落结构高度均匀,多用“首先、其次、再次、最后”“申言之、质言之、进而言之”这类机械连接词,无任何长短句交错的自然节奏,无任何笔误、无任何个人化的表达偏好;注释分布极度均匀,每一段固定1—2个注释,完全不符合人类写作“引证以必要为原则”“论证需要才加注释”的要求。
(一)机械文风
【示例1】(语言平滑均一化+机械连接词+无个人行文节奏)
首先,数字人格权是数字时代人格权制度发展的全新领域,其核心是自然人对其数字身份、数字痕迹的支配与保护权利。其次,我国《民法典》人格权编为数字人格权的保护提供了基础规范框架,确立了人格权保护的一般规则。再次,司法实践中,各地法院针对数字人格权侵权案件作出了诸多有益的探索,形成了一批典型案例。最后,学界针对数字人格权的立法完善展开了深入的研究,提出了多种制度建构方案。
问题分析:
1.句子长度、段落结构高度均匀,每一句话都是相同的句式,无任何长短句交错的自然节奏,语言极度平滑,没有任何个人化的行文习惯与笔误,是AI生成文本的典型风格。
2.全程无任何实质信息,只是重复“数字人格权保护”的语义,无任何问题指向、无任何观点输出,两句话能说清的内容,用机械的“首先其次再次最后”反复赘述。
3.人工学术写作不会用如此机械的连接词堆砌,会直接点出核心问题。比如“数字经济的发展催生了数字人格权的保护需求,但我国《民法典》人格权编仅对个人信息保护作了原则性规定,未明确数字人格权的权利属性与保护边界,司法实践中出现了裁判标准不统一的困境”。
(二)注释均匀
【示例2】(注释分布机械均匀+为加注释而加注释)
(段落1)数字人格权是数字时代人格权制度发展的全新领域,其核心是自然人对其数字身份、数字痕迹的支配与保护权利[1]。
(段落2)我国《民法典》人格权编为数字人格权的保护提供了基础规范框架,确立了人格权保护的一般规则[2]。
(段落3)司法实践中,各地法院针对数字人格权侵权案件作出了诸多有益的探索,形成了一批典型案例[3]。
(段落4)学界针对数字人格权的立法完善展开了深入的研究,提出了多种制度建构方案[4]。
问题分析:
1.AI生成的注释分布极度机械,每一个段落固定1个注释,均匀分布,完全不符合人工学术写作的规律。
2.注释大多是泛化引用,和正文论证无强关联性;为了加注释而加注释,是AI生成文本的典型特征。
逻辑层面
由于上下文机制的限制,AI的注意力倾向于集中在最近的上下文,它更关心当下的句子和前一段是否通顺,而非关心这句话是否服务于整篇的核心命题。
一篇法学论文的核心命题,可能在AI生成到第3部分时,就已经被它遗忘。前文主张“个人信息侵权适用过错推定责任”,后文却用“无过错责任”的论据展开论证;前面批判了某学者的观点,后面又把该观点作为自己的核心论据;制度建构部分完全脱离了前文提出的规范漏洞,出现“提出的问题和解决方案完全脱节”的情况。
AI所有的“问题”都来自训练数据及数据库里已有的、别人提出过的问题,它无法真正理解“这个问题为什么重要,为什么值得研究”。所以AI的叙述都偏向宏大叙事,AI生成的法学论文,永远都在说“XX领域的发展对法律提出了新挑战”,却说不清楚“挑战到底是什么,现行法到底有什么具体的漏洞,司法实践中到底出现了什么无法解决的困境”。
大语言模型在预训练完成后,首先会经过有监督微调,学会遵从人类的基础指令,掌握基础的对话范式;在此基础上,通过基于人类反馈的强化学习或直接偏好优化,使AI倾向于输出更安全、更符合主流价值观、不出现争议性内容,从而避免犯错。AI基于以上对齐机制,后天习得规避有争议的、有锋芒的、可能出错的观点,优先输出最主流、最安全、最不会被质疑的内容。
这就是为什么AI写的论文,永远都是“正确的废话”,永远没有自己的核心立场,永远不敢对主流观点提出批判,更不敢提出突破性的、有争议的制度设计,表现出“无立场、无锋芒、无批判”的特征。
(一)宏大叙事
【示例3】(无问题导向+宏大叙事+无核心命题)
数字经济的快速发展,对我国的法律规制体系提出了全新的挑战。数字经济具有平台化、数据化、智能化的特征,传统的法律规范难以应对数字经济带来的新型法律问题。因此,我们应当完善数字经济的法律规制体系,推动数字经济的健康发展。
问题分析:
1.全程无任何具体的真问题,没有明确现行法到底存在什么漏洞、司法实践中出现了什么同案不同判的困境、理论上存在什么体系冲突,只有宏大叙事,完全没有学术论文必备的问题意识。
2.无任何核心命题,两句话能说清的内容,用重复的语义反复赘述,无任何信息增量,任何主题的论文都可以套用这套话术,是AI生成内容的典型特征。
(二)正确的废话
【示例4】(制度建构全是正确的废话,无任何落地内容)
针对我国数字经济反垄断的法律规制困境,应当从以下方面完善:第一,完善相关立法,填补制度漏洞;第二,加强执法力度,提升监管效能;第三,健全协同机制,形成监管合力;第四,强化国际合作,接轨国际规则。
问题分析:
无任何具体的制度建构内容,没有明确要修改《反垄断法》的哪一条、增设何种审查标准、完善何种执法程序、协同机制的主体与流程是什么;任何主题的论文都可以套用这套话术,无任何针对性。
幻觉层面
AI所有的法律领域的幻觉问题,都可以溯源至其基本技术原理。AI生成的基本逻辑是自下而上的逐token(词元)概率预测,它不会先想清楚整篇文章的逻辑,只会根据给定的提示词,从第一个字开始,每一步都只预测“在当前上文语境下,下一个出现概率最高的字词是什么”,实质是一场超长的、符合统计规律的文本接龙。
即使有后续的微调及对齐工作,从本质上看,AI仍然没有真正的语义理解能力,也没有真正的逻辑推理能力。
它不知道“民法典第1195条”的规范目的、构成要件、体系定位,只知道在训练数据里,“民法典第1195条”和“网络侵权责任、通知删除规则”这几个词高频共同出现,因而就会在生成时把它们拼接在一起。
由于AI的基本技术原理限制,当使用者提示词撰写不当时,AI极易出现“你让我引用案例又没要求必须与裁判文书网完全能对应,我编的案例也是案例”的逻辑谬误,或者出现当作者提示词撰写的感情倾向和结论倾向过于明显的时候,AI会出现“你让我结合案例得出某结论,我觉得没道理但你这么要求我也没办法”的逻辑谬误。
(一)法条错误
AI对于法条引用的错误主要是由于其训练数据落后,加之缺少法律逻辑训练导致的。
【示例5】(新旧法条混用)
2024年施行的新《中华人民共和国公司法》第47条规定,有限责任公司股东的认缴出资期限不得超过2年,超出该期限的出资约定应属无效。
问题分析:
1.2024年7月1日施行的新公司法第47条,明确规定股东出资期限不得超过5年,而非2年。
2.“2年出资期限”是2005年旧公司法的规定,早已被2013年公司法修订废止,AI训练数据滞后,混淆了新旧规范的核心内容,且对生效条文的表述完全错误。
3.针对2023—2025年新修订或出台的法律,AI极易出现此类滞后性错误,应成为审稿的核心核验点。
(二)案例错误
【示例6】(真案子,假结论)
最高人民法院第24号指导性案例(荣某诉王某机动车交通事故责任纠纷案),确立了“知假买假不影响消费者主张惩罚性赔偿”的裁判规则,为食品药品纠纷案件的审理提供了明确依据。
问题分析:
1.第24号指导性案例的核心要旨是“交通事故受害人的体质状况对损害后果的影响,不属于可以减轻侵权人责任的情形”,与知假买假完全无关。
2.“知假买假不影响惩罚性赔偿主张”的规则,见于最高法第23号指导性案例,AI张冠李戴,对指导性案例的核心内容完全不掌握,是人工专业写作通常不会犯的错误。
(三)文献错误
【示例7】(编造学者观点+虚构文献+跨学科强行绑定权威,张文显老师、王利明老师和张明楷老师是AI编造时偏好使用的名字)
学界通说认为,人工智能生成物的著作权归属应当适用“投资者优先原则”,这一观点得到了王利明、张明楷等学界权威学者的普遍认可(王利明,2025;张明楷,2024)。
问题分析:
张明楷教授是刑法学者,从未发表过关于人工智能著作权归属的民法学相关论文。上述表达属于AI跨学科强行绑定权威学者,完全虚构的引用。
文献错误还包括虚构注释。近期,某教师在核查一篇硕士学位论文时发现,文章虚构注释的比例,高达35%。最核心的原因是法学论文脚注格式高度规范化,且注重参考文献的权威性。这使得模型在训练中学习到,权威主体的引注似乎能让文本更符合学术要求,因此会主动拼接权威学者姓名、核心期刊名称、知名出版社,编造看似权威的引注,哪怕内容完全不存在。
说明:本文的【示例】由AI生成

图片来自网络
推荐阅读
点击上图,即可购书
《AI时代法律人智能手册:DeepSeek实用指南》
赵精武 翁壮壮 / 著
法律出版社2025年版

中国法律评论
《中国法律评论》于2014年3月创刊,由中华人民共和国司法部主管、法律出版社有限公司主办。《中国法律评论》现为中国法学核心科研评价(CLSCI)来源期刊,中文社会科学引文索引(CSSCI)来源期刊,中国人文社会科学AMI综合评价核心期刊,全国中文核心期刊,“复印报刊资料”重要转载来源期刊。
《中国法律评论》秉持“思想之库府,策略之机枢”之理念,聚焦中国本土的法治问题,阐释法律思想,弘扬法律精神,凝聚法律智慧,研拟治理策略,为建设法治中国服务,为提升法治效能服务,为构建中国自主知识体系服务。

《中国法律评论》唯一投稿邮箱:
chinalawreview@lawpress.com.cn
(我刊编辑部从不收取任何版面费或发稿费,任何承诺发文的收费信息均为诈骗信息)
中法评微信公众号投稿邮箱:
stonetung@qq.com
刊号:CN10-1210/D
电话:010-83938198
传真:010-83938216
夜雨聆风