作者信息

作者:陈新宇,清华大学法学院教授,博士生导师;
刘颖,清华大学法学院近代法研究中心研究人员。
内容提要
人工智能时代,探求AI与法律史的结合是摆脱法律史学科危机的一条路径。传统中国法律内含的一定体系性、形式性、逻辑性色彩,使人工智能可对法律史史料进行有限的计算分析。人工智能之于法律史研究,可更新史料的搜集方式,提供甄别法律史史料的新思路,拓展研究边界;之于法律史教学,可辅助法律史知识的理解与传播,培养学生的批判性思维。在践行AI法律史之际,欲维持法律史的人文学科根基以行稳致远,法律史学人必须从法律史的发现、理解、批判三重功能出发,坚守主体性,提升主动性,从而摆脱学科危机,实现中华法系复兴的时代使命。
全文首发在《法治社会》2026年第2期第67-80页。如需全文,欢迎扫码查看本文完整电子书,或在中国知网下载。敬请赐稿《法治社会》!

关键词
法律史 人工智能 中华法系
引用示例
陈新宇、刘颖:《AI法律史论纲》,载《法治社会》2026年第2期,第67-80页。
目录
引言
一、AI法律史为何可行?
(一)法学与史学的可计算性讨论
(二)法律史与人工智能结合的可行性
二、AI如何助力法律史研究?
三、AI如何革新法律史教学?
四、AI法律史何以致远?
结语


引言
自20世纪八九十年代法律史学科被指面临“危机”以来,相关的讨论在几十年间不断进行,并从最初的课程教学危机、21世纪初的科目危机,发展为今日的身份认同危机,即法律史作为法学与史学的交叉学科究竟应姓“法”还是姓“史”的问题。“危机”是否成立及程度如何见仁见智,但为了促进法律史学科的发展、提高学科认可度,法律史学者在多重路径上作出了尝试。在材料上,受海外法律史研究动向的启发,广拓以司法档案为主,包含案牍、日记、报刊等在内的多元史料;在方法上,深化考据等史学方法,并在法学方法方面多下功夫,尽量避免现代与古代、西方与中方的法学概念、体系、理念之间的简单套用,积极探索社会学、经济学、法社会学、法律人类学等多学科方法,拓展研究边界;在问题上,在保持学科独立性的前提下,以当今中国的具体法治建设问题为指向,深入寻求古今法律之间的联系,挖掘传统法律文化的当代价值和意义。陈寅恪先生在《陈垣敦煌劫余录序》中曾对时代学术的发展与创新提出见解:“一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流。”法律史学界不仅对新材料、新问题进行了探求,在新方法上也付出了努力。其中虽有应加以审慎之处,但仍可谓是在自我反思中不断寻求顺应时代潮流的学术之道。
然而,时代在科技的推动下瞬息万变,当下欲论法律史之危机,必无法跳开人工智能(AI)。人工智能的应用在社会全领域掀起了变革,深刻重塑着法学研究与实践的图景。面对法学与人工智能深度融合的时代趋势,法律史学界却相对沉默。人工智能的技术性无疑会对法律史的人文性造成冲击,然而若化被动为主动,法律史未尝不可将冲击转为助力之势:在新材料层面,可在挖掘新史料的基础上,借助人工智能整理数量庞大的旧史料,进行结构化和语义化处理,化“旧”为“新”;在新方法层面,人工智能作为新工具或可提升原有法律史研究方法的效能,例如将人工智能与量化方法结合,完成文献分类、格式转化等琐碎工作;在新问题层面,以原有在法律历史中寻找规律、理解当下问题的意识为核心,思考具有工具性的人工智能如何与具有人文社科性的法律史相结合,进而推动中华法系复兴的问题。
无论接受与否,人工智能都已成不可抵之势。因此,如何在法律史的研究与教学中利用好人工智能工具,通过材料、方法、问题等方面的革新,推动法律史的教与研迈向新阶段,跳出学科危机论,才是当下的关键。有鉴于此,本文拟提出“AI法律史”论题。所谓“AI法律史”,指在法律史研究、教学等工作中合理地使用人工智能,以拓展研究的广度与深度,革新教学的方式。具言之,本文将首先从“法律史可否被计算”这一问题上讨论AI法律史为何可行,其次从法律史的研究与教学的双重角度分析AI法律史如何践行,复次结合法律史的功能与时代任务探寻AI法律史何以行稳致远,最后对全文进行总结与引申。
一、AI法律史为何可行?
人工智能的技术发展建立在计算能力与算法之上,从长远来看,人工智能的目标就是要用算法技术达到高智能程度,使计算机等设备工具能够更为灵活和高效地感知、处理、运用数据等信息。虽然基于深度学习的人工智能和传统基于既定规则运行的计算相比具有动态性与创造性,但人工智能的本质仍是对信息的计算与处理。因此,探讨人工智能与法律史的结合是否可行,首先需要厘清法律史是否具备可计算性。
(一)法学与史学的可计算性讨论
相关讨论在法律史学界寥寥无几,但在法学界与史学界早已有迹可循。在法学领域,早期的计算法学采取法律形式主义的路径,认为规则可形式化为代码,法律可以用符号精确表达,从而彻底消除不确定性。然而,法律虽然具备形式化特征,但也充斥着无法被计算机理解的非程式化的话语,新法律问题的出现也让完全计算化不可行。随着自然语言处理和机器学习技术的兴起,计算法学出现了法律现实主义的转向。自然语言处理技术将合同等自然语言转换为符号语言,同时,机器学习能够处理模糊的语言,并通过数据训练和模型微调实现智能预测。在此阶段,人工智能技术与认知神经科学、心理学、社会科学等多学科方法相结合,计算立法与司法过程中的法律经验数据。法律奇点论是计算法学法律形式主义和现实主义进路的结合,其认为在数据可获得性大幅提升及机器学习方法持续改进的背景下,法律领域将逐步迈向法律奇点,法律的不确定性获得消除,法律体系将处于实证平衡与规范平衡的稳定状态,与罗尔斯“反思性平衡”相符。然而,认为法律可以被计算和预测从而完全消除其不确定性,只能是一种幻想。例如,如果出现新的法律问题或面临价值衡量的艰难抉择,人工智能判断的依据究竟是训练数据中的多数还是少数倾向,又或者是训练者在模型微调时的价值观念?此外,法律是由意义构成的系统,正是因为非绝对确定性,人们才能够辩论,追求个案正义,从而确保法治的核心价值。因此,法律仅在部分程度上能够被计算。
在历史领域,我国关于史学可否被计算的争论发端于1922年梁启超在东南大学史地学会作的“历史统计学”讲演。梁启超指出,“历史统计学,是用统计学的法则,拿数目字来整理史料推论史迹……严格地说:应该名为‘史学上之统计的研究法’”,用历史统计法来研究历史,将同类的事件搜集起来,有助于“看出全个社会的活动变化”。历史统计学虽然算不上严格意义的计量史学,但将统计学方法运用于史学研究领域的做法与当今计量史学相合,因此有学者认为梁启超之“历史统计学”实为今天计量史学的先行状态。在梁启超的倡导之后,民国史学界涌现了一批支持和践行统计学方法的作品,但此法也遭到了不少质疑。例如,何炳松指出用统计学方法作历史研究只能分析物质状况,不能得知人类内心动机,因而无法探知社会演化的真实原因;而且在运用统计方法的过程中,学者惰于收集材料导致伪造现象时常出现。计算历史之路在西方史学界也并非一帆风顺,尤其是20世纪后半叶,计量史学受到了众多批评。例如,1974年出版的《苦难的时代:美国奴隶制经济学》通过量化数据和数字模型得出了奴隶制下经济效率更高、奴隶主对奴隶的剥削率远低于普遍假设等颠覆传统道德判断的结论,其在数据的选取上存在错误与偏见,而且忽略了史学的语境与多元解释传统,由此引来了计量史学和传统史学的双重批判。现今,由于计算机和人工智能技术的发展,无论历史学者是否自认为是数字史学家,实际上皆已在使用在线档案、数据库等数字资源。史学的可计算问题进入了新阶段,关键在于在历史研究中要摒弃工具至上和数据崇拜的观念,正视现代史学面临的平衡传统与数字化进路的新挑战,对史学研究的方法和知识生产进行反思。
(二)法律史与人工智能结合的可行性
法学与史学是否可计算的讨论,为法律史可否计算的问题提供了理论支撑与启发。具有形式化特征的法律规则和司法实践产生的数据可以被技术捕捉和计算,长时段的社会结构与行为模式变化可以经由统计与建模等方式揭示,因而法学与史学都在一定范围内可计算。但法律系统内在的价值衡量与对于个案正义的追求,历史事件独特的语境及叙事的多元性,皆难以用数据和人工智能计算简单地表达。
作为法学与史学交叉学科的法律史同样可以进行有限的计算,法律文本与司法实践的规则性和程序性部分,法律思想及裁判模式的宏观变化和多时多地的比较,以及法律现象与社会事件之间的因果关系等部分具有广阔的可计算的空间。蒋舸指出,现代法律“总体而言以理性主义为基础”,而算法同样是基于理性主义,因此法律具有算法属性,算法和法律都通过形式化过程来降低认知负担和提升效率。然而,如果说现代法律是理性化和具有逻辑性的,中国传统法律却时常被打上“反逻辑”的标签,令人对人工智能可否提取其结构性特征和计算产生怀疑。但笔者认为,传统法律在一定程度上具备体系性和科学性,因而完全可尝试将人工智能算法用于法律史研究与教学之中。
首先,中国传统法律呈现出体系化、结构化的特征。一方面,中国古代具有多种法源,包括经义、制定法、案例法。其中,制定法包括多种形式,在适用的时候,这些法律形式的地位和效力有所分别。滋贺秀三将帝制中国的制定法区分为基本法典、单行指令和副次法典三种类型,基本法典如《唐律疏议》,单行指令如宋敕,副次法典则是对单行指令的整理和汇编,如宋代编敕、明清条例等。在适用的次序上,单行指令优于副次法典,副次法典优于基本法典。另一方面,制定法内部结构精妙,并经修改达至和谐。中国古代律典与近现代西方法典不同,不用数字对条文进行编号,不以民、刑等作为条文划分标准,但其采用的条标设置、分类方法与“例分八字”等规范连接词,推动行为类型化、后果责任化、分类科学化,使传统律典的逻辑性与体系性得到提升。清朝乾隆年间,还形成了“五年一小修,十年一大修”的修例定制,因而可以根据社会变化调整法律和政策,提高立法的协调性,减少不同法源之间的冲突。
其次,中国传统的司法审判存在一定的可被观测和结构化的逻辑。韦伯曾将中国传统的法律归为实质非理性法,并将中国传统的司法审判称为“卡迪司法”,但这种二元对立的分类标准也引发了学界的大讨论。从史实上看,传统法之“确定”与“不确定”皆有例证,且对理合常情的追求使得“权变”这类具有“不确定性”的行为在司法中能够被国人接受。于此,用西式标准评判中国传统之法律或有方枘圆凿之嫌。因主题限制,本文无意对此问题进行展开,然而必须指出的是,中国传统之司法虽难以符合“确定性”标准,但也非系随意进行。杨鸿烈在《袁枚评传》中曾将法学与数学作比,将二者说为清代科学方法的总源头:“数学之为科学方法,可毋庸多说;而法律的本身最是讲究条理的明晰,而在审判案件应用它的时候,又最注重搜集及调查证据。”一般而言,在具体的司法审判过程中,法律专职人员需要严格遵照规则处理案件,即刘颂所说的“主者守文”,由此展现司法中职业化与形式化的一面;必要时也通过“大臣释滞”和“君主权断”对法律进行便宜适用,此为法适用之相对性与模糊性所在。前者既须援引规则,便存在着以人工智能学习海量判词、总结司法判决规律的可能性。后者以经验方法为主,并非常制,不过也可考虑作为模型中的特殊参数加以处理。
一言以蔽之,中国传统法律内含的体系性、形式性、逻辑性为法律史可被计算提供了基础。当然,这并非等同于法律史的完全算法化。先人之“权变”与判词说理,融合了司法经验、理论功底、伦理判断,彰显了官员的个体修养和对地方民情的理解,人工智能无法计算出这些人类在法律历史中对意义与价值的判断。
二、AI如何助力法律史研究?
根据前述,从理论层面而言,运用人工智能对法律史进行计算分析已具备可行性。但可行只是前提条件,具体如何践行“AI法律史”,使人工智能对法律史的发展产生实际助益,是一个更为关键的问题。本文认为,结合人工智能的功能及现有研究来看,人工智能至少可从以下三个方面助力法律史研究:
其一,人工智能技术或可更新史料的搜集方式。欲想得出客观之结论,还原法律之事实,提高论证之信服,须尽可能广博地搜集各种相关史料,取舍得当。然而,面对数量庞大且分散的法律史料,搜索和整理工作耗时耗力,很难避免遗漏。如有检索功能强大的工具可以使用,搜集的效率和范围将会大幅提高及扩大。这类需求其实早已产生,相应地,古代已有对经典作系统整理以便于检索的尝试。例如,汪辉祖汇集“二十四史”中记载的人物,按姓氏标记,收录成册,依照韵部分类编排,完成《史姓韵编》一书。这类工具书是以个体之力助力古籍系统整理的有益尝试,不过较为零散,编纂方法也不够科学。近代出现了采用西方现代索引技术整理中国典籍的“引得”,其不仅能够帮助定位检索,还有助于分析和比较某个特定关键词或人物在一份文献中的发展态势,从而形成新的问题意识并实现思维开拓。1930年,在“整理国故”的号召下,从哥伦比亚大学毕业、在燕京大学执教的洪业提议并促进了哈佛燕京学社引得编纂处的成立。引得编纂处自1930年成立至1951年间编出引得64种,共81册,内容遍及经史子集。在法律典籍的引得方面,1964年庄为斯编有《唐律疏议引得》。《唐律疏议引得》涵括《唐律疏议》之律、疏议、注和问答诸条,提供单字部首索引,同一部首的各单字按笔画多少的顺序排列。引得按笔画编排,相同者则依照部首的次序决定先后。此外,《唐律疏议引得》还附有律名表,以便使用者能够在各不同版本的《唐律疏议》中快速定位。该引得帮助学者快速检索关键词和定位相关条目,为全面揭示唐律的术语含义和逻辑体系提供了极大便利,对唐律的纵深研究有重要价值。例如,若要从《唐律疏议》对“及”“准”等字词的使用评价其立法技术,对比研究不同罪名、处罚的适用,首先需要汇总出现此字的条目,然后根据引得相对快速地完成汇集工作。
从古代零星的检索工具书到近代走向科学的引得,可见不同时代学者在文献化“死”为“活”上所作的努力。但纸质时代的索引缺陷是显而易见的,可能存在错误、遗漏,同时也更新困难。数字时代的到来改善了上述情况,光学字符识别(OCR)技术的运用使纸本文献转化为可检索的数字文本,研究者可以直接搜索关键词进行定位。然而,使用古籍OCR技术生成数据与利用计算机技术对原始文本进行处理相比,虽然效率更高,成本更低,但数据的准确性也相应地有所降低。此外,电子数据库的检索范围虽然较纸质引得更广,但跨库的横向检索尚难实现。在人工智能时代,固然应持续推进古籍文献的数字化工作,提升OCR的古文字识别准确度,加强各大数据库之间的沟通。不过,更为重要的是建设智能数据库,推动数据库从“数字化”向“数智化”的转型,对人工智能进行训练以使其“理解”语义,对古籍中的人物、事件、制度等进行标注,从而构建知识要素之间的关联。除了数据库的应用,这类智能化语义技术还可在多方面辅助检索。目前,已有学者利用经过《四库全书》等语料预训练的古文模型“Sikubert”,通过预训练语言模型和对比学习目标的复合方法训练人工智能寻找古汉语语境下的引用关系。这一技术在法律史研究领域将有极大的适用空间。例如,中国古代有众多判词流传,这些判词是体现古代司法官员审判基本理念的重要载体。唐朝时期的判词尤为注重典故的运用。受个人风格影响,于成龙等官员在判词中也喜好引经据典。经典的运用使判词语义涵盖的内容极为丰富,此时引进人工智能技术溯源这些引文,有助于厘清判词的说理依据,加深对传统司法论证的理解。再以经典的“父为子隐”案为例,在养父子关系的情境下,对于养父藏匿犯下杀人罪行的养子应当如何裁断,董仲舒先后引《诗经》与《春秋》,作了如下推论:“甲无子,振活养乙,虽非所生,谁与易之?《诗》曰:‘螟蛉有子,蜾蠃负之。’《春秋》之义,父为子隐,甲宜匿乙,而不当坐。”其对《春秋》的引用意在否定藏匿罪对近亲属的运用,但对《诗经》的引用未必这么好理解。据《睡虎地秦墓竹简》记载,养父子关系与亲生父子关系有所差别,因此董仲舒或许意在引《诗经》来否定法律对父子是否亲生的区别对待。这个论证的过程是隐晦的,如果人工智能能够帮助研究者在简牍中自动比对语义关联,找到董仲舒的论证与《睡虎地秦墓竹简》相关条文的联系,研究者便能更为清晰地发现案件论证的逻辑路径。
其二,人工智能或可提供甄别法律史史料的新思路,尤其是辅助识别某一特定史料的作者身份。近期,上海海洋大学与上海外国语大学的研究团队提出了两种基于机器学习的作者识别模型,对《红楼梦》前80回与后40回是否出自同一作者这一“红学”上的经典问题展开了研究。此前,也有学者运用机器学习方法,结合预训练语言模型与深度学习模型对存在归属争议的程颐、程颢语录进行了判断。法律史文本同样存有作者归属问题,以上研究成果为法律史研究开拓了新思路。例如,法律史学界激烈讨论的《删除律例内重法折》归属问题,便可尝试以沈家本、伍廷芳二人的已知奏折、文章等作为样本训练人工智能模型,借用自然语言处理技术提取两人的常用词汇、句法结构、虚词等,从而对《删除律例内重法折》全文给出作者归属的概率判断。不过,人工智能存在解释“黑箱”,无法清晰地解释特征如何提取,判断的准确度也受训练样本的影响,因此只能作为研究的辅助工具使用,学者在比对多重史料后进行的严密论证仍旧具备核心价值。
其三,人工智能技术可与量化方法结合,扩展法律史研究的可能性。具有统计学色彩的量化方法无疑是对传统史学方法的变革。首先,可借助量化方法对史料进行辨伪。这种形式的辨伪区别于史料学、文献学,借由某种形式的计算完成。其次,量化方法还可帮助揭示历史中潜在的因果关系。以金观涛、刘青峰的研究团队为例,其一改从思想史的角度研究观念,通过建立数据库、运用数据挖掘的方式寻找表示特定观念的核心关键词,对其意义进行统计分析,由此发现中国近现代观念的起源和演变,及其与社会行动之间的关系。在观念与行动之间的因果关系之外,历史中还存在多重因果关系,量化方法能够利用数据对多种假说进行验证,从而提出更为真实的假说。不过当前法律史学的方法训练仍以传统方法为主,且量化方法存在技术壁垒,因而法律史学界在专业研究中使用量化方法的作品仍属少数。目前在中国用量化方法研究法律史的大多是经济史出身的学者,其研究给清代命案、妻妾买卖等法律史问题带来了新视角和新方法。对于法律史学者而言,量化方法仍是一片有待开发的蓝海。
人工智能为使用量化方法研究法律史提供了技术可能。一方面,量化需要将数据进行结构化处理,存在技术门槛,而且利用计算机处理数据需要大量人力,与法律史学界“单打独斗”的模式不符。如在对比中西方的不同诉讼档案时,以定量方法划分制度属性、进行标准化赋值和多维比较,可提高制度的可比性和说服力。然而,档案在语言、格式、叙事风格等多方面的差异,要求研究者进行翻译精校和人工数据标注等工作,需要较多人力与时间。人工智能的引入在一定程度上破解了上述困境,智能翻译和自然语言处理等方式有助于提升量化效率,减少人力需求,使研究者能够在更短时间内完成数据处理和关联发现。另一方面,在量化中引入人工智能还有助于突破主观的局限性,挖掘更多的研究主题。在以往的量化研究中,人工标注容易产生主观偏差。当前有学者基于监督机器学习的自然语言处理方法对《清实录》进行了数据处理,发现在量化处理数据的过程中引入人工智能,不仅大幅提高了量化数据的覆盖范围,而且以结合预训练和监督学习的方式实现高精度、无偏差的量化,避免了人工处理的主观性、前见性。此外,陈钰琪等学者的研究团队利用Transformer的嵌入模型在历史文本中进行心理测量,并建构了中国历史心理学语料库,尝试以模型模拟古人作问卷测试,展现心理反应。此类模型未尝不可用于法律史研究中,例如,通过嵌入模型分析《刑科题本》或地方司法档案,提取出法律条文适用与裁判逻辑背后的心理倾向,实现对影响裁判者作出判决的情感因素更为科学的考量。
三、AI如何革新法律史教学?
当今法律史之发展,研究与教学乃一体两面,如何以人工智能实现法律史教学的革新,同样值得探究。2017年国务院发布的《新一代人工智能发展规划》中强调,人工智能与法学学科专业教育要交叉融合。近十年来,各大法学院校对如何将人工智能与法学教育结合、培养现代化法治人才进行路径探索。通过设置数字法学的二级学科,开设数据法学等新课程,在传统法学课程中引入自动驾驶等智能时代下的法律问题,法学教育的人工智能化取得了一定进展。然而,与民法、刑法、劳动法等应用法学相比,法律史与平台用工等人工智能带来的法律应用问题相距甚远;与同属理论法学的法理学、宪法学等学科相比,法理学与宪法学尚可就人工智能是否具有主体地位等理论问题展开讨论,以史为纲的法律史学科却难以加入。但是,人工智能与法学教育的结合并非仅包括上述层面,人工智能对法学教学方式的变革同样值得探索。在法律史教学中,完全可以尝试引入人工智能技术,探索不同于以往文本研读和课堂讲授等形式的新教学方式。
从法律史教师的角度出发,人工智能可以代替教师完成琐碎的工作,提高教师课前准备的效率。教学是培养未来之才的关键之道,在力求建设教育强国的时代,教学质量更显可贵。然而,在当前的考核体系下,高校教师往往需要进行年度综合性考核、科研考核与教学考核。如果教师在完成制作课件等知识含量相对欠缺的任务上花费太多不必要的时间,则会舍本逐末,使教学质量和科研成果大打折扣。若有人工智能的帮助,在课前准备环节,教师完成教案后即可借助Kimi、Napkin等PPT制作工具智能生成课件,其本人仅需对细节作调整,无须再花费时间做排版工作。利用元典问达、AlphaGPT等依托大模型技术的智能系统,法律史教师也可快速寻找到便于进行古今对比的法律条文及案例。压缩备课时间后,教师得以更为潜心地打磨授课的核心逻辑与内容,与人工智能实现专业分工,由“全才”向“专才”转变。
从学生的角度出发,适用人工智能有助于初期法律史的学习,对人工智能生成内容的反思也有益于批判性思维的培养。既然法律史有“史”的一面,则基础的历史知识必不可少。此处之“基础”,首先为法典颁行时间等基础史实,此自不待多言。其次,法律史学习以原典阅读为依托,这也是为何多所院校坚持以读书会或研读班的模式进行教学。中国法律史原典的排布通常是从右至左、从上至下,以繁体写作,加之古文言简意深,阅读颇需花费一番功夫。法律史中“法”知识的一面,则以历代罪名、刑名、法律程序等为表征,辅以法律的实际运行、法律文化、立法指导思想等加深理解。为此,学生在法律史学习之初往往不知从何处下手,缺乏古文的阅读训练又导致对法律史文本有理解障碍。这些基础知识与技巧方法自然是法律史专业学习之必备,但在入门之初,借助人工智能可帮助学生对法律史有初步的了解,不至于畏难而退。例如,人工智能的句读划分、术语解释降低了原典阅读的难度,对官制、罪名等专业术语内涵的流变与对比使整体的学习脉络更为清晰,对某一法律史问题在古今中西的呈现则能够打通学习思维的时空局限。当前,国内多所高校的法学院皆创办了LL.M.项目,向全球招收学习中国法律的留学生。相较于其他中国法学学科,外国学生在学习中国法制史时面临的语言障碍更大,因为中国传统的很多制度、官职、法律思想等都难以在英文中找到对应的单词。人工智能一方面可以完成较为切合的语言翻译,另一方面也可以利用留学生熟悉的本国法律概念作为认知桥梁。例如,人工智能可以引导留学生类比“情理”与“衡平”,帮助留学生跨越语言障碍,更为深刻地理解中国传统法律文化的逻辑。此外,对于法学院校外的其他社会“学生”,人工智能亦提升了法律史知识的可得性,从学生到各行各业的从业者,皆可使用生成式人工智能就法律史问题进行提问,获得较为准确的回答。更重要的是,人工智能可以结合案例、图片进行回答,增添了法律史知识的趣味,更便于知识在公众间的内化与传播。将法律史知识向社会公众进行下沉式传播,未尝不是提高法律史影响力,进而化解学科危机的一种方式。
人工智能模型的运作本质是在大量训练数据的基础上进行概率预测,在进行数据处理和模式识别时可能出现偏差,从而产生“幻觉”问题。不过对于“幻觉”,既可用特定指令要求其提供依据,更可积极地加以利用,培养学生的批判性思维。具言之,询问人工智能某个案例始末或人物生平时,人工智能可能会混淆或杜撰信息,学生应查阅资料进行核实。此外,人工智能在解释传统法律时,也可能会不恰当地套用现代或西方的理论或观念,产生文化误读,这也提醒学生在学习法律史时不要以今度古、牵强附会。2025—2026年秋季学期,清华大学法学院本科生的“中国法制史学”课程布置了一次人工智能与法律史结合的作业,请同学们以小组为单位,结合人工智能对一个中国法律史问题展开研究。从展示的结果来看,大部分学生在进行文献与案例收集、综述、法条梳理等前期准备时,皆发现生成式人工智能能够快速和相对准确地梳理、分析、对比已有文献和案例,但普遍存在“幻觉”问题,其推荐的文献与案例需要人工溯源验证。而进入到内容的实质分析步骤,人工智能更存在着去语境化、分析浅显、价值评价单一等问题。例如,研究“原心定罪”的学生尝试用人工智能统计《通典·刑》当中出现的“义”“心”“志”语词,人工智能虽然完成了统计出现频次的任务,但缺乏对这些字词在不同语境中的区分与疏理;探讨施剑翘刺杀孙传芳案件的学生则指出,人工智能的分析具有“法律—政治”二元对立的倾向,同时缺乏对社会背景、施剑翘本人在舆论塑造方面的讨论。在带着法律史问题与人工智能多次对话的过程中,学生们不断进行质疑,对答案作修正,从而使批判性思维与问题意识得以强化。提问与修正需要以精读文献、辩证思考为基础,学生也因此更好地掌握了法律史的具体知识。
从师生与人工智能协同共进的角度出发,人工智能能助力传统法律史课堂向多智能体课堂转变。当前主要的课堂教学模式分为两种,一为传统的面对面式教学,二为以“慕课”等平台为代表的网络视频教学。近期有关教育智能体的研究创新,或许会引发课堂教学模式的变革,形成线上多智能体课堂,学生与多智能体通过窗口进行互动。智能体的特点在于能够感知环境并执行任务,教学环境表现为复杂的课堂教学情境,任务则包括知识讲授、思维引导、课堂互动与课后巩固等。在知识讲授层面,教师可上传课堂讲义、教材和其他教学资料等,形成自己的知识库,创建导师智能体,及时关注每位同学的学习进度,进行个性化指导。助教智能体则在课堂进行的过程中实时关注评论区,随时进行答疑,并负责课后的作业批改。在思维引导与课堂互动层面,具有不同学习风格的同伴智能体可以对老师的授课内容进行提问、质疑或总结。例如,清华大学试点推广的MAIC课程配备了“显眼包”“好奇宝宝”“笔记员”和“思考者”四种同伴智能体,分别负责活跃课堂气氛、提问、分享笔记及引导课堂深入讨论,打破了屏幕带来的隔阂。在课后巩固层面,可分设协作型智能体与对抗型智能体。协作型智能体作为学生的小组团队成员,与其共同完成课后作业;对抗型智能体则作为学生的竞争者或质疑者,在观点交锋中帮助学生回顾课堂知识。法律史以过去的法律为研究与教学对象,若能在老师、助教、同学等基础智能体之外设置诸类历史人物智能体,模拟传统或近代立法、司法等情景,可引导学生从不同社会角色、不同历史时期的角度思考问题,形成“沉浸—体验”式的学习环境。例如,在讲授清末变法修律时,可设置“修订法律大臣”智能体,使学生能够与其直接对话,理解当时法律草案起草者的想法;在讲授“杨乃武与小白菜”等法律史经典案例时,可引入“地方县令”与“刑部官员”智能体,使学生能够直接感受到在案件审理的不同阶段、不同层级的断案逻辑差别;在讲授儒家与法家的法律思想时,可分别设置两个学派的代表人物智能体,接受学生的提问,互相辩论。多智能体课堂的优势显而易见,当学生与这些智能体互动时,其也从法律史的旁观者成为亲历者。同时,智能体可以根据每个学生的发言判断其对知识的掌握程度,从而对讲解的难度和速度进行调整。
不过,当前智能体研究与应用的现状也反映出了一些问题。其一,教学的内容需要确保准确度和高质量,若只依托通用大模型设置教学智能体,智能体可能会生成不存在的法律条文,误导学生。因此,教学智能体的建构需要以知识库为基础,储存关于学生的学习进度、知识薄弱点等数据,以及教材、阅读材料等教学资源,并将智能体授课和答疑的范围限定在知识库的范围之内,依靠检索增强生成技术调用知识库的相关内容。可以说,智能体能发挥的功效与知识库建设紧密相连,而知识库的内容依靠教师上传和更新,在此意义上,课程的核心与方向把控依旧由教师负责。其二,通用大模型的训练主要基于现代语料,因而现有的语义模型很可能用现代法律知识解释传统律文,或以现代的价值观和法政逻辑回答学生的问题,难以打造真正的“沉浸—体验”学习情境。故而,在创设智能体时必须限定其回答的范围,并且在构建智能体Prompt(提示词)之时予以强调,使“修订法律大臣”“刑部官员”等智能体的回答更贴近历史上的可能。其三,人工智能具有安全机制,通过识别敏感词等方式过滤涉及暴力、血腥等有害内容,当学生向智能体询问凌迟等酷刑的具体执行方式,智能体有可能会因为触发安全机制而拒绝回答。以上缺陷在不同层面上影响智能体的教学应用价值,还需人工智能专家与师生们的共同探索,实现更为有效的人机协同。
四、AI法律史何以致远?
人类在工业时代便已领悟,技术在带来便利的同时也导致工具理性盛行,社会面临着多重风险。人工智能时代,新风险在新技术中孕育。当前,可被发现并需警惕的人工智能风险至少包括以下四种类型:其一,社会极化风险,并以就业结构性失衡、数字化加剧社会不平等为表现;其二,伦理与法律风险,涉及算法歧视、责任归属等难题;其三,技术黑箱风险,源自算法的不可解释性与复杂性;其四,人的异化风险,即人类的主体地位受到威胁。人工智能技术迭代的速度致使社会风险加速更新,为此,社会也在不断构筑多层防线,并探索以国家为主体的政策出台、立法规制及以平台为主体的算法自治方式。与此同时,社会各界也在尝试使用人工智能规范,在高等教育领域,清华大学于近期正式发布《清华大学人工智能教育应用指导原则》,明确了人工智能在教育应用中的底线,并将教育应用划分为教学与学术研究场景,反映了对人工智能应用积极而审慎的态度。此类指导原则的通用性虽使其难以针对性地指向包括法律史在内的某一学科,但无疑可提供方向上的指引。对于法律史而言,人工智能技术助增的工具理性可能降低法律史的人文温度,其带来的异化风险则可能导致法律史学者与学生在研究和教学中的主体性消亡。欲探寻AI法律史何以致远,即法律史在人工智能技术迅速扩张的时代如何维持自身的价值与精神根基,必须首先深入至法律史学的三重功能,即发现、理解与批判之中,在保持法律史学人的人文风骨的前提下实现人机协同。
法律史学的第一重功能为发现,即以严谨的考证发现历史的真相。何炳棣曾阐明其一生坚守的治史南针和步骤,即首先用周密平衡的理性思维去考证尽可能翔实多样的相关史料,其后依照概念架构逐步分析、论辩、诠释,最后达成综合判断。尤其是史学界存在多种通说,但“通”并不等于“真”。以《大清新刑律》的颁布为例,通说认为,法理派主张制定新刑律,礼教派反对新刑律,在制定过程中,礼教派阻挠新刑律的议决。然而,经多维史料比对,事实可能并非如此,反而是法理派为保证新刑律及时通过,以各种手段阻挠资政院议决。技术有时会给历史的真相再添一层迷雾,清末之际,岑春煊便因一张伪造的其与康梁的合影而受开缺。当下,人工智能技术的“幻觉”问题已非新鲜之事,以人工智能语义模型判断史料是否真实,也仅是一种概率推测,并不可直接信以为真。由是,对于人工智能挖掘或提供的史料线索,必须进行原始史料的溯源。同时,在要求人工智能检索与某一观点有关之史料时,可同时要求其寻找与之矛盾的史料,以免被困于算法的茧房之中。法律史学者还必须充分认识到,在所有史料数字化及各大数据库实现共享之前,未经数字化的实体史料仍然具备不可替代性。换言之,人工智能的输出并不等于历史事实,对史料的阅读、整理、比对、考据功夫仍是法律史学者不可或缺的能力。
法律史学的第二重功能为理解,即在史料考证的基础上对某一问题作出诠释。杜维运认为,史学方法上有几个重要的阶段,包括收集史料、考证史料以及消化史料。在消化史料阶段,必须将史料融会贯通以撰写历史,既将历史事件呈现给世人,称为“历史叙事”,又阐明历史发展之轨迹与意义,称为“历史解释”。叙事与解释虽以史料为基础,但如何整合史料,如何解读史料中的空缺、历史事件之间的联系,则依靠学者对历史的理解。理解与诠释要尊重历史之语境与规律,因而在中国的历史主义诠释传统中,常常讲究知人论世、设身处地。试举一简单小例,传统中国视斩刑比绞刑更重,因身体发肤受之父母,但今人从痛苦程度上则倾向于相反的理解。在法律史研究与学习中,若学者完全依赖人工智能生成历史叙事或进行因果分析,就缺乏将自身思想与情感投入历史之步骤,丧失通过史料回到过去产生共情之能力,对法律史的解释将面临被算法的逻辑侵蚀的危险。在使用人工智能时,固然可以借助提示词限定特定的历史语境,例如明确要求人工智能基于某一律典的律文逻辑进行分析,但这需要人工智能经受过大量相关语料的训练,而且算法解释的不可见性也导致分析逻辑的不可查证。故必须明确,人工智能可助力史料泛读与概括,可提升量化处理数据的效率,但深读必须由人来完成,对法律史的理解和诠释必须发挥人之想象,由是方可达至“了解之同情”,使对法律史之理解不被去语境化的算法所架空。
法律史学的第三重功能为批判,即无论是在做法律史研究抑或进行教学时,都必须具备批判性反思精神。分析法律历史得失,在其中寻找规律、理解当下,是法律史研究的核心追求。在此过程中,不可避免会涉及价值判断问题。人工智能的回答与判断以训练数据和模型为依据,而数据内含的偏见在数据筛选时无法完全排除,甚至可能在模型中受到固化或放大。在法律史领域使用人工智能,首先需要甄别使用过程中是否产生了官方史料偏见,忽视了法律多元性。官方史料相较于民间散落的契约、族谱、习惯法等史料更易于收集和进行OCR处理,后者的语言则更不规范,文字更难以识别,因此官方史料或许会被更多地用于人工智能的训练当中,但其撰写又不可避免地带有国家偏向性。其次,也需反思人工智能是否更多地以精英视角进行分析,而相对忽视了女性等历史边缘人物的声音。例如,抱告等传统法律制度限制女性进入诉讼,即便女性出现在了公堂之上,其证词和供词在诉讼档案中被记录下来,也可能因书写者的偏见及制度中潜藏的男权主义而并非以真实的样态呈现。如果缺乏相关的提示,人工智能不一定能够发现背后的偏差。最后,更需警惕人工智能不加区分地以近现代西方的标准对中国传统法律进行评价。人工智能的训练语料不会片面地只包括近现代西方或传统中国一方的法律理论与制度,但由于算法“黑箱”,我们无可知晓其究竟调用哪方语料对中国法律史展开分析。若以西式标准对中国传统之法律作评判,强化单一、西方中心的法律叙事,必然更为远离历史真实。故而在使用人工智能的过程中,法律史学人不可放弃提高独立思考的能力。
由内观之,法律史具备发现、理解、批判的三重功能;向外观之,新时代欲建构中国法学自主知识体系,必须深入挖掘中华优秀传统法律文化。法律史在面临学科性危机的同时,也肩负着中华法系复兴的时代使命。而复兴中华法系,既要推进基于其自身展开的研究与教育,也要增强其与世界的沟通,向外传播中国传统法治智慧,方可打破西方中心偏见,提高中华法系之影响。因而,人工智能时代欲保持法律史的人文内核,达至中华法系复兴的目标,还需法律史学人提升主动性。此一“主动性”,首先指主动借助人工智能跨语言、跨文化的能力,推动中华法系的国际化传播。例如,在中国传统法律术语、条文、案件的跨语言翻译,以及以数据建模揭示不同法律传统在处理相似社会问题时的路径等方面,均可利用人工智能,有效促进中外法律史研究的交流与对话。其次,“主动性”也包括法律史学人在人工智能建设中的参与性和积极性。尽管当下已有历代石刻、地方志等专门数据库,但以大规模、系统化、高标准标注的司法档案、案牍等为核心内容的法律史数据库稀缺,远不能满足研究需求。面对算法中可能存在的西方偏见,我们固然要以批判思维对待,但也要尝试建设法律史的专门语料库,将法律史本土知识转化为高精度的、机器可学习的知识,促使人工智能模型基于中国传统法治的内在逻辑展开分析,防止算法对中国传统法律的片面解读。而法律史学科的特殊性,决定了语料的标注、分类、编码体系必须纳入法律史专业学者。通过法律史学人的主动参与,推动以我为主的法律史知识重构,是新时代克服法律史学科危机,实现中华法系复兴,增强中国在国际的法治话语权之道。
结语
在人工智能的时代浪潮中,法律史学科可以通过积极探索“AI法律史”,抓住法律史学科破除危机、实现自我重塑的契机。AI和法律史研究的结合不仅具备理论上的可行性,亦能在多方面助益法律史的教学与研究。法律史学科的价值,在于回应当下、理解当下,更在于建构未来。面对中国自主法学知识体系建构和中华法系复兴的时代使命,法律史学者应以更具主动性的姿态,成为“AI法律史”的建设者。
但必须警惕的是,人工智能仅能作为法律史研究与教学的辅助工具,法律史学人方为主体。法律史传统的文本细读、史料互证以及历史人文关怀的价值,不会因技术迭代而消亡。法律史学者的人格风骨与批判精神,更无法被技术工具取代。对主体性的坚守,正是对陈寅恪先生“独立之精神,自由之思想”的呼应。陈先生对独立精神与自由思想的追求,贯穿于其治史之道中,尤其是力求避免被任何先入为主的框架所束缚。当然,即便是人工智能亦难逃训练数据中的偏见,但对此标准的追求也正是人之独特性与能动性所在,并且在人工智能时代尤为可贵。在严谨考证的前提下,尽可能地持有批判精神,经过充分思考以发挥人类的想象力与同理心。如此,方可真正实践好“AI法律史”,并达至“爱法律史”的境界,在新时代助力中华法系复兴的实现。
(责任编辑:刘 翔)
END
公众号编辑:吴茵梦
一校:郑锦洪
二校:陈锶林
终审:刘翔

相关链接
2.罗维鹏:“意思表示真实”的语义解构与重述——基于言语行为理论的分析
3.章诗迪:指导性案例的规范性及其适用——基于统一法律适用功能的视角
《法治社会》是由广东省法学会创办的公开出版发行的法学学术理论刊物。办刊宗旨为:立足广东、面向全国,及时报道广东及全国法学法律界最新研究成果,传播最新法治信息,交流最新学术思想,促进法学研究成果的转化应用,为我国社会主义法治建设和法学研究事业的繁荣发展服务,为建设法治中国、法治广东服务。
分享本文:
本刊微信号:fazhishehui-gdfxh
本刊微信二维码:



夜雨聆风