AI与法律史学研究的融合与碰撞-夜雨聆风

AI与法律史学研究的融合与碰撞

编者按：鲜有学者将代表未来科技的人工智能与代表厚重过往的法律史学置于同一视角下研究。此前在“行星法理学”领域已颇有研究的杨安卓老师此次又为我们提供了全新的法学研究视角。文章指出，AI的角色应从自动化书写工具，升级为辅助因果解释的逻辑推理引擎。通过构建融合规范与事实的双维度法律史本体论，并将史料转化为可计算的知识网络，该框架旨在实现历史可能性的受控推演与深度分析。杨老师认为，这标志着法律史研究迈向可计算、可解释、可批判的新范式。这种跳脱既有框架的研究视角或许可以带给法律史研究者们一些思考与启发。

文章原题： 人工法律史学家:一种人工智能介入法律史研究的元理论

文章来源： 《荆楚法学》2026年第2期，转载自“湖北省法学会荆楚法学”微信公众号

摘要：人工智能在法律史研究中的应用重点正在从历史写作的自动化,转向历史解释的算法化,这一转向的元理论框架是“人工法律史学家”,其核心原理是通过构建能同时编码规范性知识与社会性事实的法律史本体论,将非结构化史料转化为可计算的知识网络,实现对历史因果关系的推理分析。人工法律史学家的实现方法包括:运用自动化科学发现系统,将法律史知识形式化为结构化图谱;通过历史认识论揭示法律史知识的不完全真理性、对共通意见的依赖及永恒开放性;借助AI从处理外延性史料向理解内涵性概念的认知飞跃,通过语义场分析追踪概念演变并识别绝对预设。这一元理论整合了法律史学的多元方法,通过双维度本体论实现了规范逻辑与社会语境的统一分析。人机协作模式使法律史家专注理论阐释,AI的形式化要求促进法律史方法论反思,最终迈向可计算、可解释、可批判的法律史学新范式。

关键词：人工历史学家；法律史；元理论；法律史本体论

一、问题的提出

二、人工法律史学家的“推理世界”

三、从外延到内涵的认知飞跃

四、结论

人工智能(AI)浪潮正以空前的深度与广度席卷人文社会科学领域,以大型语言模型(LLMs)为代表的生成式人工智能,具有强大的文本处理与生成能力,有望成为历史学家的强力辅助。但是将AI仅仅视为更高效研究帮手或写作工具的视角,而忽视其背后更为深刻的知识论变革,以及潜在的窄化历史解释,固化算法偏见,则可能带来巨大风险。当代法律史学者应当超越对“自动化历史书写”的狭隘认知,为此我们创建了一个面向人工智能在中国法律史研究中应用的元理论框架。AI在法律史学当中的核心价值远不止是一种新型检索工具,而应当是辅助人类学者进行更深刻因果解释的逻辑推理引擎,我们将其命名为“人工法律史学家”(Artificial Legal Historian),并试图通过设计一种新的人机协同范式,以应对当前法律史学研究面临的深层困境,最终朝着可实现计算与可解释的法律史新形态迈进。

一、问题的提出

（一）一个思想实验

想象一下,当一位研究人员向一个先进的AI系统提出一个看似简单的法律史问题:“清代是否存在法治?”系统最可能产生的反应路径有两种,而这两种途径都将导致智识领域的失败。第一种路径是基于关键词的严格匹配,鉴于“法治”这一现代用语及其蕴含的权力制约、宪法至上等核心要义,清代的官方文献和法律典籍里几乎没有直接对应的词汇,AI借助扫描其庞大的数据库,很有可能得出一个简洁但错误的结论:“否,清代文献中没有‘法治’的相关记载。”这一表现暴露了AI处理历史概念时,对语词历时演变现象与跨文化转译的极大无知,它将一个繁复的历史问题,降格为一个简单的字符串匹配任务;第二种反应路径更为隐蔽,也更存在更强的误导倾向,AI大概会通过语义关联,从其知识库内找到像法制、国法、以法治国等相关词汇,且察觉到这些词汇在清代文献中与治理、秩序、惩罚等概念高频率共现。基于这种统计上的关联,它可能会生成一段看似合乎逻辑的论述,将清代重视运用法律作为统治工具的“以法为治”(rule by law)情形,错误地与现代意义上的“法治”(rule of law)相等同,这种混淆,未察觉到二者之间最本质的区分:“法治”的核心要义是法律成为限制统治权力的最高准则,而“以法为治”表示法律是统治者达成自身意志的有效手段。AI的这一失败,暴露出其在处理抽象概念时,难以从“外延”即概念所对应的具体样本,过渡到对“内涵”即对概念背后抽象属性和逻辑关系的深入理解。换言之,它能识别出“法”在清代被频繁运用这一“实情”,却无法领会这种运用背后的权力逻辑与价值预设。这一貌似简单的问答出现失败,构成了我们认识AI与法律史关系的一个切入点,它所体现的是当前主流AI范式在应对历史学这一特殊知识范畴时,面临的基础性认知困境。

澳大利亚历史哲学家玛尼·沃灵顿(Marnie Hughes Warrington)在她的新著《人工历史学家》中深刻揭示了这一困境,并指出一旦历史被凝结成文本、档案、数据这些可脱离作者独立存在的客体时,它天生就拥有了可被机器读取、分析和计算的潜质。法律史在这一点上表现得尤为显著,不论是法典、律例等严谨条文,还是汗牛充栋的司法档案,其高度文本化的表现特征都为算法的介入提供了最理想的物质基础。当今数字史学的发展,正清楚地呈现出两种不同的路径追求,如梁晨和李中清所概括的,分别为“求其实”(seeking facts)与“求其是”(seeking truth)。“求其实”的路径侧重于采用数字技术挖掘、整合并呈现大量历史事实,发现传统研究难以企及的宏观模式,通过精细的编码和数据库建设可以极大地提升文献分析的效率。当然,如果研究者沉迷于数据的挖掘与呈现之际,历史学也可能会面临被降格为一种应用数据科学的危险,对此成一农给出了警示:抛弃了人性的历史学没有存在的价值。纯粹的数据关联并非因果解释,相关性也不等于因果性。对史料的全面掌握,并不能自动生成历史洞见,这正是“求其是”路径所关切的焦点,即对历史变迁内部逻辑及因果机制的深刻认识与解释。

沃尔夫·坎施泰纳(Wulf Kansteiner)指出,现有的大语言模型在垂直记忆方面匮乏,它们无法将生成的某个论断溯源到具体的原始出处,甚至会编造看起来合理却完全不实的引文和脚注,这种“结构层面无法说真话”(structurally incapable of telling the truth)的特点,导致任何直接利用AI进行历史写作的尝试,都无异于一场智识上的冒险,这也是迄今为止主流历史学界面对AI尚存怀疑的原因。他们宁可将这种颠覆性技术视为一种更高效的资料整理工具,而不是一种有潜力改变研究范式的认知伙伴。

（二）人工法律史学家

基于上述立场,我们必须精准地界定本文所提的核心概念“人工法律史学家”。首先有必要通过一系列否定来厘清其边界。人工法律史学家不是一个意在通过图灵测试的拟人化实体,也不是一个谋求模仿特定史学大师写作风格的风格迁移工具,更不是一个可以自动生成一篇合乎学术规范论文的自动写作系统。所有这些基于模仿的想象,都把AI置于一个被动的、仅具工具性的,智识方面不诚实的位置,它们的核心目的是产出貌似由人类完成的文本,这种对表象的追求,是历史学作为一门求真的学科必须警惕的,直接把未经审视的大型语言模型输出用在学术写作中,不仅可能造成事实层面的谬误,而且在方法论层面的怠惰,极易将严谨的论证过程用算法黑箱代替,最终将造成历史解释能力的整体削弱。

人工法律史学家的应然形态究竟为何?它应成为辅助人类学者做严谨、结构化因果分析工作的“法律史推理引擎”,其核心任务不是历史撰述,而是计算与推理。它是为回答这样一类问题而设计的,即“在特定的法律史场景情境中,当某个关键变量出现变动时,历史进程最有可能性呈现出哪些可能路径,以及每种路径出现概率的大小如何?”在这一框架下,我们将之定位为一个与人类法史学者形成共生关系的认知伙伴。它凭借自身强大的算力,发现人类学者因认知局限而无法得见的宏观模式及潜在关联,从而与学者达成一种人机协作的共生模式,这是一种深度的人机共生的模式,它保留着人类学者在提出问题、设计框架、赋予意义等核心环节不可替代的主体身份,同时把AI处理复杂数据以及执行逻辑运算的非凡能力发挥到极致。

明乎此,则我们针对人工法律史学家这一元理论建构的研究边界亦随之变得明晰。以下的探讨将聚焦于可能性(possibility)而非现实性(actuality),我们不打算借助AI去还原唯一的历史真相,而是聚焦于AI如何帮我们开展对“历史的可能性空间”的探索。卢西安·霍尔舍(Lucian Holscher)在虚拟史学(virtual historiography)展开的论述中,分辨出两种不同的历史可能性探究:一种是反事实的,即“若X没发生,世界会变成怎样?”另外一种是虚拟的,即“倘若历史走向了当时人们所期待的另一个未来,我们现在会怎样看待过去?”我们的元理论大体建立在第一种,即反事实的逻辑之上,但我们赋予它更为严格的计算限制,依托海量历史数据、在严格逻辑限制下开展的受控反事实推演(controlled counterfactual inference),使其成为我们对历史因果关系深度反思的有力工具。其实这与人类学者自己的思维亦无不同——当我们估算历史上某部法律的效用时,我们一般首先想到的难道不是“若没有这一部法律,历史与社会进程将会发生怎样的变动”吗?

（三）人工法律史的元理论

法律史的固有学科属性为检验我们设想的人工法律史学家的各项能力,造就了一个近乎精良的、结构化的测试环境,这种独特性展现在三个层面。它们正好与当代中国法律史学界最关键的方法论关切相一致。

法律史研究所需处理的史料具有高度异质性。做一项法律史研究,也许需要同时处理结构化的法典条文、半结构化的司法判牍、非结构化的报刊评论、私人信件、商业契约乃至口述史料。马敏教授指出,数字史学以多样化的历史数据库作为基础,既包括提供原始文本的基础性历史文献数据库,还包括经过结构化优化的研究性历史量化数据库。突出的史料异质性,对AI的数据整合、信息提取与跨文本分析能力提出了挑战,一个可有效处理这般复杂数据组合的人工法律史学家,其技术框架必然会有高度的通用性及稳健性。

法律史解释本身蕴含着深刻的学科张力。当代中国法律史研究面对的一个核心困局,便是在法学化与史学化之间摇摆。前者强调法律的规范逻辑及自主特质,倾向于从法律内部寻找变迁的动力,其研究范式与法教义学相近;后者侧重于将法律视为社会经济结构的映照,从外部挖掘变革的根源,该研究范式接近于社科史学。加拿大法史学家西蒙·斯特恩(Simon Stern)通过对法律史期刊和普通法学期刊脚注的分析,采用量化办法清晰地揭示出这两种研究取向在引用材料方面的重大差异。这两种视角,对应着两种截然不同的因果解释模型。人工法律史学家,其设计起始的目的恰恰是要将这两种看似对立的路径归并到一个统一的分析框架里,令其既能像法学家那样,对《大清民律草案》条文进行精准的逻辑拆解,又能像社会史家一般,对《申报》中数千篇涉及土地交易的报道进行数量化统计。更重要的是,它能通过我们设计的思想实验去计算,若其中一个变量,例如法条被重新修订的时候,另一个变量,例如交易行为可能出现的反应,进而为我们判定两者间的因果权重,给出一种前所未有的、依托计算的决策辅助手段。这种把异质知识整合起来、执行混合推理的能力,令法律史成为验证AI能否融合两种不同推理逻辑的理想范畴。

法律史里的核心概念兼具稳定性与流变性,这为AI进行长时段的概念史量化分析提供了绝佳的研究对象,诸如权利、所有权、法人这类核心法律概念,在从西方传入中国的过程中,其文本的定义在一段时间里是相对稳定的。这为AI通过文本挖掘技术,精准跟踪一个概念的出现次数、传播途径和被引用网络提供了可能性。这些看似稳固的概念,进入中国具体的司法实践以及社会环境中后,其内涵又不停地出现演变与重构。正如金观涛、刘青峰教授对中国近现代政治术语的量化研究所展示的,探寻一个概念在不同语境下的出现频次与语义联系,可揭示其内涵的演变进程。稳定性与流变性的这种结合,为人工法律史学家提出了一个极具挑战又十分有价值的任务,它不仅需要识别出一个概念的文本形态,还应当能通过语境分析,呈现出其实践形态的动态变化。一个成功达成这项任务的AI,将协助我们理解法律全球化与本土化这一核心议题,提供绝无仅有、细腻的历史证据,约书亚·斯特恩菲尔德(Joshua Sternfeld)的研究表明,通过对元数据和搜索过程的分析,可评估数字历史所呈现的语境化程度,这同样可适用于不同数字档案语境中的法律概念的评估。法律史存在的这三重独特属性,让我们必须去面对历史学与法学最核心的方法论疑难,且尝试给出一个针对人工智能时代的全新答案。

二、人工法律史学家的“推理世界”

所有形式的推理,无论是人类心智的产物,还是机器算法的运算活动,都无法在脱离实际背景的情况下开展,推理的有效性,取决于它所依赖的背景知识体系的完备程度与结构特性。对一个旨在辅助历史因果解释的人工智能系统而言,构建这样一套背景知识体系,也就是我们称之为推理世界(World of Reasoning)的数字空间,是其得以成立的基础条件。这个推理世界并非对历史真实存在的镜像式复制,而是一个经过周密设计和编码的结构化知识集合,它为AI提供了一套关于其分析对象的世界观。

（一）从自动化科学发现到法律史本体论

近年来,AI驱动的科学研究正以前所未有的态势重塑知识生产的全部景象,从Alpha Fold实现对蛋白质结构的精准预测,到各类“机器人科学家”在功能基因组学、药物研发、材料科学等领域实现从假设提出、实验开展到结果阐释的闭环自动化,一种由AI赋能的科研新范式已然登场。这些前沿实践清晰地揭示了一个核心原理,即任何获得成功的自动化科学发现系统,其核心都内嵌有一个针对其研究领域的、形式化的世界模型或本体论,这个由人类科学家与AI协同构建的,包含特定概念、实体、规则及关系的结构化知识架构,形成了机器进行科学推理的全部基础。这使得AI的思考不是在毫无知识支撑的环境里开展,而是在其被赋予的知识本体的范围中,依据特定逻辑规则进行运算与探索。

这一从自动化科学发现中收获的启示,为我们构建人工法律史学家提供了直接的理论依据与技术方案。将特定领域知识形式化、结构化处理,是使AI可以处理该领域复杂问题的必要条件。但与自然科学相比,法律史学的知识形态更复杂,它缺少物理世界受普适规律所支配的那种确定性,其研究对象为法律文本、制度实践以及社会观念,呈现出模糊、多义的特性以及语境依赖。一个有真实应用能力的人工法律史学家,其本体论要超越简单的规则库或数据库,它需要可以直接面对并处理那些异质、矛盾重重的原始史料,且能在一个更加宏大、复杂的知识体系里进行推理,故而我们提出了法律史本体论(Ontology for Legal History)的概念,这是一个计算机科学范畴的概念。在计算机及信息科学的语境中,本体论是一种针对特定领域知识的形式化、显性化的规范说明,它明确了一个领域里的基本概念及其属性,以及它们彼此间的相互关系。利用这一技术框架,我们将“法律史本体论”定义为:一个将特定历史时空内全部相关规范、事实、观念以及这些复杂关系编码为一体的结构化知识体系。

这一定义的核心内涵是其结构性,传统历史文献数据库本质上依然是文本的集合,而法律史本体论的目标则是将非结构化和半结构化的史料,转换为一个由“实体”和“关系”搭建的庞大知识网络或者知识图谱。在这个网络中,每一个历史片段,哪怕只是一个法律概念,如法律人;一个历史人物,如沈家本;一个机构,如法律修订馆;一部法典,如《大清现行刑律》;一份档案,如巴县档案中的一份契约……所有这些皆被定义成一个独立的实体“节点”,而这些节点相互关联的中间,则依靠精确定义的关系“边”实现连接。通过结构化的表达,使原本零散于浩如烟海文献间的历史知识,变得可以被机器理解,可由算法遍历,可通过逻辑推理,从而使历史因果的计算分析得以实现。创制这样一个本体论的技术过程是繁复的,它需把命名实体识别、关系抽取和知识融合等多种自然语言处理技术整合起来,将巨量文本数据转化为形式化的知识表征。罗宾·瓦格纳·帕西菲西(Robin Wagner-Pacifici)等学者在研究大数据在社会科学的应用事宜时指出,在着手大数据分析之际,我们必须面对构成社会复杂本体论的诸多成分,诸如实体、行动者、行为、原因、意义、时间性与语境等。我们的法律史本体论恰是在法律史范畴内,对这些元素开展的一次系统性编码尝试。

这一本体论设计的理论旨趣直接回应,并试图整合中国法律史研究中长期以来的“法学化”与“史学化”路径之争。这场争论的实质核心,是针对法律变迁根本动力的不同解释样式,前者突出法律规范自身的逻辑演化与专业群体的能动性,后者强调社会经济结构与政治文化环境的决定性意义。一个相当强大的人工法律史学家,其本体论要能兼容这两种路径所依靠的知识类型和推理逻辑。我们把“法律史本体论”设计成具有双重维度:一个是以令典、律例、判例等为核心的规范维度,另一个是聚焦档案、契约、报刊、地方志等的事实维度。规范维度力求捕捉“书本上的法”的内在结构,它将法律视为一套具备相对自主性的规范体系,规则与原则构成其核心。在这一维度之内,本体论需要对法律文本进行深度解析及编码,例如在处理《大清律例》时,AI不仅会把它认定成一个文本实体,还会进一步把该文本拆解成更细微的规范单元。这一维度的构建,承认法律知识有其自身的生成逻辑与传播传统,这种对规范内在逻辑的重视,也与西蒙·斯特恩观察到的法律史研究中存在的近因果关系(proximate causation)偏好相匹配,即更愿意在法律领域内部查找法律变迁的直接动力。

与规范维度相对的是意在抓取“行动中的法”所处社会情境的事实维度,这个维度将历史视为由无数社会互动构成的复杂程序。法律实际运作的状况远比法条字面含义更丰富,且变化多端,其理论的起源能追溯到埃利希的“活法”。在这一维度中,本体论将致力于从海量社会经济史料中提取结构化的事实数据,并对这些变量在不同时间段、不同地域的分布模式及演变趋势进行量化研究。该维度呼应了以黄宗智、徐忠明等学者为代表的社会科学取向的法律史研究进路,强调必须将法律放在宏大的社会经济与文化语境中开展考察。

最终,我们搭建的法律史本体论将处于一个统一的架构中,推动二者的对话与融合,从而形成互动生成模型,在这一模型中,本体论可分别对规范与事实编码,还可以精准地捕捉并计算二者之间的相互作用,此一互动生成的机制,可在人工法律史学家的本体论里实施具体的计算和模拟。当本体论的事实维度对大量契约档案加以分析,发现一种新的商业交易模式在民间变得极为多见时,可以对规范维度引发一种“刺激”,AI接着可于判例数据库中开展检索,探寻司法官员处理相关纠纷的做法,它很可能会发现,法官们在给出判决结果时开始频繁引用情理、交易习惯等非正式规范,甚至采用创造性方式阐释现有法律。这是一个将事实变成规范的生成路径。一部新法典正式颁布以后,AI能够跟踪该法典在社会环境中的传播流程,并进一步分析其对司法实践所起的影响,这是一个从规范过渡到事实的影响路径。通过构建一个能模拟双向因果链条的交互模型,法律史本体论可以超越静态的数据库,成为一个能进行动态逻辑推理的推理世界。这不仅为解决法律史的法学化与社科化的争辩提供了一个综合性的分析框架,也为法律史因果逻辑的解释,铺就了坚实的本体论基础。

（二）法律史知识的逻辑属性

法律史知识作为一种特殊的人文知识,其形成、流变与被认可的途径,与自然科学知识存在着根本性的差异。如果不能精准地把握这些差异,任何借助算法处理历史的尝试,都可能陷入机械的数据主义的泥沼,故而有必要深入历史认识论的源头,系统梳理法律史知识固有的三大逻辑属性,即不完全真理性、对共通意见(Endoxa)的依赖关系,以及永恒的开放性。这三大属性共同决定了人工法律史学家的根本定位:它是个开放的、有凭据的、能识别语境的辅助系统,而不是那种封闭、自足的真理生成机器。

法律史知识首要的逻辑属性,在于其命题的不完全真理性(Imperfect Truth),这一属性的源头,并非单纯源于史料的不齐全或历史不可复现,而是深深扎根于历史命题自身的逻辑和语义结构中。任何孤立的单个法律史命题,其真值都高度依赖于它所处的庞大语义网络和复杂的历史语境,而其自身的语义是不完备的。以晚清宪制改革的一个关键命题为例:“1908年《钦定宪法大纲》的颁布确立了中国的君主立宪制。”从表面上看,这是一个能得到证实的“事实性”陈述,其“真理性”绝不是一个简单的“是”或“否”可判定的,一个真正把握此命题的智能系统,务必将其放到一个复杂的知识图谱中,去查看其与其他知识节点之间的多重关联。它需要理解“君主立宪制”这一概念本身的内涵,并能澄清《钦定宪法大纲》在多大程度上借鉴了作为主要蓝本的《日本帝国宪法》,特别是其“君权神授”与“天皇总揽统治权”的内核。这一命题的可靠性,不在于命题自身,而是由其在整个历史知识网络中的位置和关系共同赋予的,是一个意义流动的关系集合体。

知识论层面的不完整特性,直接明确了人工法律史学家在技术上必须遵循的根本规则,所有AI的输出都是有依据的,而不是自足的,这说明AI不能如同无所不晓的神谕那般直接给出结论,它的每一项判断、每一项陈述,都必须可以追溯至其所依据的原始史料,这从本质上否定了直接把大型语言模型用作历史知识生成器的可行性。

法律史知识的第二个核心逻辑要素,是对共通意见(Endoxa)的深刻依赖。在亚里士多德的《论题篇》中,共通意见意为被一个时代或者特定社群认可为不言自明的信念、价值观或前提,它们本身不一定是科学真理,却是一切辩证推理(dialectic)得以开展的起点。在法律史的语境中,共通意见构成特定时代法律思维的“底层操作系统”,它们是那些在司法判决、立法辩论或学术论著里被认为理所当然,无需再加以论证的前提,即历史哲学家柯林伍德(Collingwood)所谓“绝对预设”。就人工法律史学家而言,其核心任务不是评判共通意见的优劣,而是要精准地辨认出它们在具体历史论证中充当的论证前提角色。

晚清宪制改革的复杂进程,为观察共通意见的作用提供了绝佳的实例。在清末的政治和思想场域中,共存着多组相互冲突且彼此纠结的共通意见。一方面是牢不可破的传统儒家政治伦理,其核心共通意见涵盖家国同构、君权神授、祖宗之法不可易等;另一方面是通过西学东渐传入的新兴政治理念,其共通意见有主权在民、三权分立、宪法至上等。整个晚清阶段的立宪辩论,很大程度上是这些不同共通意见体系的相互碰撞。当以张之洞为代表的洋务派官僚提出“中学为体,西学为用”的口号时,他们实际上是把“维护儒家纲常伦理”作为一个毫无疑义的绝对预设,各类西方技术与制度的引入,都不能碰这个“体”。AI的任务是识别出在张之洞等人的奏折与论述中,“中体”是论证的终点而非起点,当他们论证为何不可推行完全的议会民主时,其最终理由一般会追溯到“圣朝家法”或“君主大权”。这在他们的论证语境中,是无需再借助更底层的法理以证成的。反之,当梁启超等立宪派人士在《新民丛报》上呼吁“开议院,设责任政府”时,其论证的绝对预设则为“国家富强必须以民权伸张为前提”,AI需要识别出在这些论述中,“民权”本身已经被赋予了一种不言自明的正当性。一个成熟的人工法律史学家,应当能够自动对一份历史文献的论证结构进行解析,并标注出其中哪些部分为事实陈述,哪些部分是逻辑推理,哪些部分是诉诸当时读者普遍赞同的共通意见。

法律史知识的第三个层次,也是最根本的逻辑属性,在于其永恒的“开放性”。历史解释永远在路上,不存在一个可以一劳永逸结束所有争论的终极历史。这种开放性源自两个维度,即史料的无限性与解读的多元性。一方面,新史料是层出不穷的,每一次关键的史料发现,都有可能重塑我们对某一历史阶段的认知。另一方面,人类学者用来探究历史的理论框架与问题意识在不断演变,哪怕面对同一批史料,不同学者也许会给出千差万别的、然而在各自理论框架体系内都能自洽的解释。以对清末宪制改革失败的原因分析为例,有的学者或许从制度设计的缺漏入手,有的学者则会强调满汉之间的权力对抗,另一些学者也许会归因于地方势力的崛起,还有学者大概会留意全球资本主义体系产生的冲击,这些解释路径共同营造出我们对这一复杂历史事件的多维度理解。这种深刻的开放性,从根本上决定了人工法律史学家的最终角色。它不应当被设计成一个追求提供唯一正解的封闭系统,而应当是一个助力人类学者进行开放式探索的辅助工具,即“可能性空间探测器”与“反思性镜鉴”相互统一。

如果我们将法律史AI视为可能性空间探测器,则其主要价值是帮我们探索历史的未然状态。既然历史不是被铁律决定的线性进程,那么在每一个关键的历史分叉点上,都存在走向各异未来的多种潜在机会。传统历史叙事因为线性结构的约束,大多只能聚焦那条最终成为现实的通道,却无法处理其他同样有实现机会但最终未能实现的选项。AI强大的算力带来的模拟功能,恰好可弥补这一缺失之处。以清末新政为例,我们可以通过人工法律史学家来进行一系列“受控反事实思想实验”。例如,我们可以提出问题:“如果1908年的《钦定宪法大纲》给了资政院更大财政监督权,1908-1911年间清廷财政状况和中央地方关系会怎样演变?”AI可借助其本体论,调取有关当时清政府财政收入结构、地方督抚财力状况、立宪派政治诉求、社会舆论反应等海量数据,模拟不同政治力量间的角逐,并算出一系列可能的结果以及其概率数值。这种分析无法让我们弄明白“真实的历史会怎样变化”,但它能极大地提升我们对历史因果链条复杂性的理解程度,使我们明白制度设计里微小变动或许产生的巨大影响,从而更透彻地把握历史偶然性和结构性力量之间的内在关系。

如果我们将法律史AI视为反思性镜鉴,则其更价值在于它迫使人类学者将自己头脑中那些隐性的、日常惯有的史学理论与方法论前提对象化与形式化。在创立法律史本体论的过程时,我们应当回答一系列最根本的史学方法相关问题:我们怎样给一个事件下定义?我们怎样去区分原因与条件?我们要怎样评判不同证据来源的权重?我们怎样去划定法学化与社科化解释路径的边界?在传统的历史写作期间,经常是以一种隐现、凭直觉认知的方式去处理。但要使AI可以“理解”,我们得把这些模糊的直觉,转换为精准的、机器可读用的规则与代码。该转译的进程阶段,本质上就是一次深刻的史学理论反思。在我们对AI提供指导的阶段,依旧无法有效判别梁启超笔下“权利”与现代西方法学里的rights时,这个失败清晰地反映出我们在概念史研究中可能存在的理论盲区。AI的困惑与错误,成了诊断我们自身知识结构短板的探针,通过不断与AI进行调试与对话,我们不仅是在教导AI怎样研究历史,还在这样的过程中不断地澄清并深化我们自身对法律史学学科本身的理解。这是一种更高层级的人机协作,它把AI从一般意义上的工具,提升为一个能促进学科自我反思的智识伙伴。这样的人工法律史学家本质上可以视为一个以证据作基础、可把握论证结构且服务于开放性探索的辅助系统。

三、从外延到内涵的认知飞跃

为人工法律史学家的推理世界奠定本体论基础以后,可知任何历史知识都体现出不完全真理性,且其确证需依赖共通意见,这从哲学层面确立了AI处理历史信息时必须遵循的开放性与语境性要求。从本体论的思索走向算法的达成,AI还必须越过一道更为棘手的鸿沟,也就是从处理外延(Extension)到理解内涵(Intension)的认知跨越。这一过程是区分一个高级数据处理器与真正的智能历史分析伙伴的根本标志,也是人工法律史学家能否从一个可行的构想,走向具有深刻智识价值现实的关键所在。

（一）人工法律史学家的双重认知任务

处在逻辑哲学与语言哲学的传统环境里,外延与内涵是一组核心概念,最早由戈特洛布·弗雷格以能指与所指(Sinn/Sense)的形式进行了系统阐释。一个概念的外延,是该概念所能代表的全部对象的集合,它回答的是“哪些是?”的问题。例如,法律概念体系中“典权”的外延,是指历史上所有可以被归类为“典权”的具体契约、判例及制度规定的总合。处理外延的任务本质上是一种识别、分类且关联史实的工作。而一个概念的内涵实质,即该概念所蕴藏的抽象属性、本质特征以及它与其他概念之间的逻辑关联,应对的是“是什么”和“为什么是”的问题。“典权”的内涵界定,则涉及它作为“活卖”与“绝卖”两者之间的一种中间形态的物权,其背后所反映的是乡土社会土地流转的灵活要求、所有权观念的不完备性,以及与“押”“当”等相关概念的区别与联系。

对人工法律史学家而言,这意味着它必须同时承担双重认知任务,就外延层面而言,它需要扮演一个史无前例的超级档案员,能够彻底性地收集、整理并对大量法律史料进行量化分析,揭示事实层面的宏观模式及关联;在内涵这一维度,它需要成为一个概念阐释者,通过对文本的深度钻研,去掌握那些复杂法律概念背后的抽象逻辑和文化内涵。这一挑战的实质,是语义模糊、文化编码化以及语用情境化的多重困境,若需理解情理这一中国法律史中的核心概念,AI不但要处理它在不同判决中模糊多变的含义,更需把握它背后所体现的一整套关于天理、人情、乡俗的文化观念系统,以及清代官员在判决里中揆诸情理时那种争取裁量余地、尝试修辞说服的复杂语用情境。

（二）作为概念阐释者的AI

如果说AI作为超级档案员,在法律史外延的处理上展现出强大计算能力,当它试图从外延迈向内涵阶段时,才真正面临其核心挑战,这一跃升需要将AI打造成一个理解概念抽象属性和逻辑关系的概念阐释者。这一任务的艰巨性,在处理那些遭受剧烈历史变迁以及跨文化转译的核心法律概念时显得格外突出。为剖析这一挑战,我们将焦点转到更具近代意义的法律史实例,即近代中国语境中的宪法概念。不难发现,一个概念的内涵远非一个固定的定义,而是一个在特定历史时空与话语权力网络中不断被塑造、争夺、再度定义的动态过程。对于一个习惯于在海量数据中探寻统计模式的AI来说,理解这种动态、多义且极具张力的内涵的能力,是评判其认知能力的重要标准。

挑战的要害在于AI如何理解宪法这个概念背后复杂的历史与文化意义。考察晚清语境中“宪法”一词的内涵变迁,从外延角度看,可以较为容易地训练AI去识别所有与宪法相关的具体文本、制度设计以及历史论述。它可以将1908年清政府颁布的《钦定宪法大纲》、之前日本顾问呈交的草案、梁启超等立宪派在《新民丛报》等刊物刊发的系列文章,以及革命派在《民报》上针对立宪派的批判,识别、归类并再关联起来,形成一个有关“宪法”的外延知识集合。但当AI企图从这些外延集合中总结出“宪法”的统一内涵时,就会立刻陷入窘境,因为在晚清这一特定的历史阶段,对“宪法”的内涵并未形成统一共识,而是一个饱含激烈争夺的概念空间。从以张之洞、载泽为代表的清廷官僚角度看,“宪法”包含的实质意义是维系现有权力结构的法宝,其核心要点是君权。与此相对,对于以梁启超为代表的立宪派知识分子而言,“宪法”的内涵实质,却在于通过设立国会、明确国民的权利范围,以此来限制君权、保障公民的权利,最终达成国家从君主之国过渡到国民之国的转型, 宪法是重塑权力架构的路线图,其重点是民权。如果AI只靠统计词频,会发现宪法一词在官方文件中与君上大权、圣裁、统帅权等词汇高频共同呈现,而在立宪派主办的报刊文章里,则与国会、责任内阁、权利、自由等词汇紧密相连。这两种差别十分明显的语义场,说明了“宪法”概念在晚清的内涵,并未形成单一的明确定义,而是在两种政治力量以及两种对未来中国的想象之间反复激荡。AI可描绘出这种激荡的结构与过程,但要真实体悟这场权力与思想的对抗,则需要突破简单的文本模式识别。

面对理解内涵的巨大困境,我们应怎样设计一种可行的计算路径,令人工法律史学家最大限度地接近实现这一目标呢?一种主要的方法是,系统性地追踪一个概念在不同文本语境中的语义场(Semantic Field),某个概念的内涵实质,并非孤立地处在它的定义中,而是由它与相关概念组合成的整个网络一起体现的。AI擅长处理的,是通过对海量文本的分析,将这个隐现的词汇网络清晰显性化,并呈现出其在特定历史阶段的完整意义图景。该工作的技术基础,是计算语言学中的词嵌入模型(Word Embedding Models),从早期的Word2Vec、GloVe,到更强悍的语境化词向量模型BERT等。这些模型可把词语映射到高维向量空间中,从而通过考察诸词语之间的空间距离,反映出它们在语义上的关联强弱,经过分析目标概念在向量空间内的近邻词汇,我们大体上可以勾勒出其语义场的结构。

（三）挖掘法律史中的绝对预设

如果说概念的内涵是AI从外延迈向理解的第一步,那么尝试挖掘和辨认潜藏于整个法律知识体系之下的绝对预设(Absolute Presuppositions),则是此次认知飞跃的终极探索。这一过程标识着人工法律史学家也许可以从一个概念阐释者,进化为一位挖掘历史思维最底层深层结构的“思想考古学家”。

英国历史哲学家柯林乌在他的晚期代表作《形而上学论》里,系统地阐述了他的“绝对预设”理论。柯林乌认为,任何一条陈述,都是针对某问题给出的回复,而任何一个难题,皆起始于背后的某个预设。当我发问“这辆车的最高时速是多少”之际,此问题本身就预先假定了“这辆车有最高时速”这一前提。柯林乌指出,我们可以接连不断地对预设进行追问,造就一个问答链条。不过这条链条并非无限延展,在任何一个特定的知识范畴或历史阶段中,都有一些最基础的、支撑起整个问答体系,然而其自身既不接受追问,也不接受证明的“绝对预设”。它们并非可被判定为“真”或者“假”的命题,因为它们是使真与假判断得以开展的最根本前提。

在法律的历史阶段中,也存在着此类绝对预设。它们一般不是以明确清晰的法律条文形式现身,而是作为一种心照不宣的“常识”或“天理”,深深地塑造法律制度设计与司法实践的内在逻辑。一个人工法律史学家应怎样去发现这些往往处于隐藏状态、不言而喻的绝对预设?这形成了对其智能的极大挑战,其关键任务是找出文本中的论证终点,即AI需要拥有强大的论证挖掘(Argumentation Mining)能力。这是计算语言学的一个前沿领域,聚焦于让机器自动辨认自然语言文本中的论证结构,包含前提、结论、论据以及彼此间的逻辑关系。

不妨设想这样一个工作流程:把大量历史司法判词或学术论辩文本喂给AI。它把论证挖掘引擎开启,然后将一份文本解析成一个或多个呈形式化的论证链条。例如,就一份分析“子殴父”案件的清代判文而言,AI会将其核心论证归纳为如下结构:

结论(Claim):判处被告张三凌迟处死。

前提1(Premise 1):因为,张三实施了殴打其父的行为。

前提2(Premise 2):并且,根据《大清律例》,“恶逆”者处凌迟。

前提3(Premise 3):并且,殴打父亲的行为,构成“恶逆”。

随后AI会继续针对每个前提做递归式追问,试图找出支撑这些前提的、更深一层的前提。就前提1而言,案卷中的证人证言、伤情检验报告等“事实证据”可对它起到支撑作用;就前提2而言,它可以被《大清律例》的文本自身所支撑;但若当AI开始对前提3进行追问:“为何殴打父亲要认定为恶逆”时,它会发现多数判决书以及法律论著里面,该论证链条在这儿陡然停止了。作者们不再对这一连接做任何理性的辩护与解释,而是直接将其当成一个不容置疑、无需多言的真理来采用,它在论证时永远充当“因为……”的角色,却几乎从不充当“所以……”的角色。当AI实施对数万份文本的分析操作,查明某个核心观念,如“父子之伦即君臣之义”有系统性地体现出“仅作前提,不作结论”的逻辑模式时,它就有很大把握地将其标记为一个绝对预设的候选者。

此过程的理论意义在于,它可以作为人类法律史家的一面反思性镜鉴。AI有能力发现绝对预设,这一能力的意义,与其说它证明了AI变得多么聪明,不如说是它逼着我们人类学者,对自身那套模糊的、直觉式的史学技艺,进行了一次前所未有的、完整的形式化工作与自我反思。为了让AI学会识别论证的终点,我们必须先清晰地采用可计算的语言,来界定我们自己在阅读时是怎样察觉到“作者觉得这是理所当然的”这一情况的。是因为他采用了不容置疑的修辞,还是因为他在某个关键节点处停止了追问,抑或是因为他的论证中存在一个无需多言的逻辑跳跃。将这些原本属于法律史学家“心通意会”的技艺,变成AI可执行的算法,这一进程本身,是对法律史学研究方法体系的一场深刻的革命。AI成为映射我们自身思维结构及知识预设内容的一面镜子。它使我们从一个“日用不察”的知识运用者,转变为一个对自身知识前提开展批判性审视的元认知者。这凸显着人工法律史学家的研究活动,从理解所言说的内容的语义层面,真正转变到理解为何这样言说的认识论层面,从而可以深入历史思维最隐秘的底层结构。

四、结论

人工法律史学家可给AI时代的法律史学引擎,提供一个恰当的分析框架。它预示着一种人机协作的法律史学新范式即将涌现,其核心特征可总结为:可计算、可解释与可批判。这三个特征将法律史学从一门极为依赖个人学识与文本解读的艺术,在一定程度上转变为一门可通过数据开展大规模验证、论证过程更清晰、理论前提更容易检验的科学。进而在留存人文学科深刻价值的同时,提高其知识生产的严密性与公共性,并揭示人类历史言说中的内在逻辑架构与修辞手段。如沃灵顿所揭示的,不论人类还是机器,其历史创造活动都按照某种历史的逻辑。而人工法律史学家的终极职责,就是将这种原本隐藏于人类史学实践当中的复杂逻辑,从呈现出对共通意见的依赖,直至对“绝对预设”的无意识坚持。用一种可做计算、可实现可视化的方式呈现出来,以此把法律史学研究,从对“历史相关内容”的探索,提升到对“历史形式”的批判性反思。基于这一元理论,我们有理由盼望未来出现一种人机深度互助、可计算、可解释、可批判的法律史学新范式。该范式由作为“元史学引擎”的AI架构驱动,具有可计算性,它表明法律史中那些似乎只能靠意会的“叙事”与“论证”,能够在AI的辅助下被解析为可供量化分析的结构性部件,以探寻海登·怀特(Hayden White)所揭示的历史叙事转义结构。