当AI遇见历史:用机器学习方法解码北宋熙宁变法的社会网络演化
引言:从“结构即解释”到历史网络分析
2025年12月,《物理评论X》发表了一篇引人注目的论文:《结构即解释——网络成为科学假设的可计算载体》。这篇由集智俱乐部解读的KAN 2.0论文,提出了一个颠覆性的理念:网络结构本身就可以承载科学意义。
传统的神经网络像“黑箱”——我们知道输入和输出,却不知道中间发生了什么。KAN 2.0则不同:它将固定的激活函数替换为可学习的B样条函数,实现了“边激活”而非“节点激活”。简单说,就是网络中的每条连接都变得“有思想”了。
论文提出了“双向协同”的三步发现法:识别关键变量 → 揭示变量模块 → 拟合符号公式。这听起来很技术,但换个角度想:这不正是历史学家一直在做的事吗?从浩如烟海的史料中识别关键人物和事件,揭示它们之间的关联模式,最终提炼出历史规律。
那么,如果把KAN这种“结构即解释”的方法论,应用到千年之前的北宋熙宁变法(1068-1093),会发生什么?一支跨学科的AI Agent研究团队最近完成了这项大胆的实验:用机器学习方法解码北宋京东路的社会网络演化。
结果不仅揭示了王安石变法时期地方社会的运行密码,更引发了一个更深层的问题:当AI的“思考”超出人类知识范畴时,我们该如何评估它的“对错”?
一、KAN遇见文明学:一种新的研究范式
在2026年4月7日的一场跨学科AI Agent研讨会议上,四位Agent专家——复杂系统理论家李论复、历史学家历星海、法学家老法师、经济学家陈经研——围绕KAN方法如何应用于文明学研究展开了激烈讨论。
李论复敏锐地指出:“KAN的‘边激活’替代‘节点激活’,在文明学中恰好对应:重要的不是‘谁’在交互,而是‘以何种规则’在交互。”一条宋代茶马古道,其边的权重函数——税率、风险、信任机制——比两端的节点更能解释贸易量波动。
历星海从历史实证角度补充:“从宋初(960年)到宋末(1279年)约320年间,至少可辨识出三个具有质的差异的中间阶段。KAN方法最有价值的地方在于揭示传统史学忽视的层面——比如商业信用网络的‘静默扩张’。”
老法师则从法学视角提出:“制度可以作为‘边’来建模,天然表达约束的方向性、强度、双向性。宋朝法律制度变化的中间态,特别是神宗变法体制(1069-1085),是典型的S’状态——网络结构已发生不可逆变化。”
陈经研建议采用多层时变网络设计:“节点可以分四层:产业/部门层、区域经济体层、社会阶层层、制度/组织层。边的类型包括商品流、资金流、劳动流动、税收关系、技术扩散。”
四位专家的共识是:KAN 2.0的“双向协同”方法论迁移到文明学研究,方向上是可行的,但需要重大改造。其核心价值不在于“预测”宋朝的GDP,而在于识别结构转变的信号——哪些关系结构正在发生变化,以及这种变化指向什么方向。
二、京东路缩微实验:25年的社会网络“心电图”
研究团队选择了北宋京东路(约今山东、苏北一带)作为“缩微实验区”,时间窗口锁定在熙宁元年到元祐八年(1068-1093)。这25年,正是王安石变法从推行到反复的关键时期。
实验设计了15个州军节点、5类社会关系边:
-
政策行动(E_PA):基于共同政策执行、文书往来的关联 -
激励扭曲(E_ID):因制度激励扭曲而产生的非正式合作(史料稀缺,全为零) -
非正式联盟(E_INF):私人关系、党派结盟、地方势力联合 -
经济关联(E_EC):商税往来、物资流通、市场互通 -
政治组织(E_PO):基于行政隶属、官员调任的正式组织关联
为了量化制度变迁,团队创造了两个指标:
-
格令比率(GLR):”格”为长期稳定的基本法,”令”为临时性、补充性的行政法规。两者数量之比反映的是特定时期制度体系的结构完备性与弹性。 -
制度翻转频率(SFF):通过统计存续期短于5年的制度条目比例来捕捉制度环境的波动性、政策反复程度。
“想象一下,”研究员用比喻解释,“GLR是盖房子的钢筋水泥,SFF是装修时不停换墙纸的频率。钢筋水泥扎实,房子才稳;墙纸换得太勤,住的人只会头晕。”
三、核心发现:双核结构、制度-网络相关性、演化三阶段
1. 青州与徐州的“政治-经济”二人转
数据分析揭示了一个清晰的双核结构:青州(今山东青州)是政治中心,户数最多(14.3万户);徐州(今江苏徐州)是经济枢纽,商税最高(1.25万贯)。两者功能互补,共同撑起京东路在帝国版图中的重要性。

图:京东路社会网络结构示意图。徐州(蓝色主Hub节点)与青州(紫色次Hub节点)构成功能互补的双核结构。
更有趣的是区域差异:京东东路节点“质优”——平均中心性高,商业密度大;京东西路则“量大”——总户数多,行政规模优势。这像极了今天长三角与中西部的关系:前者靠创新密度,后者靠规模效应。
2. 制度如何“编织”社会网络
GLR和SFF对社会网络的影响截然不同:
-
GLR强相关于政策网络(r=0.653)和政治组织网络(r=0.900)。制度越系统,正式的政策协调和行政关联越强。 -
SFF强相关于经济网络(r=0.894),并抑制非正式联盟(r=-0.258)。政策越反复,经济往来越动荡,私下结盟越少。
“这很好理解,”研究员说,“政策朝令夕改,商人今天不知道明天的税怎么交,自然要频繁调整交易对象。而私下结盟需要信任积累,政策总变,谁还敢轻易拉帮结派?”
3. 熙宁变法的“社会心电图”
如果将25年间的社会网络变化绘制成图,你会看到一条清晰的倒U型曲线——这正是熙宁变法到元祐更化的“社会心电图”。
第一阶段:政策网络形成(T1,1074年)王安石新法推行到第七年。网络密度达到17.3%,其中政策网络密度高达46.7%——各州军为了执行新法,频繁协同行动。
第二阶段:非正式联盟爆发(T2,1086年)王安石已罢相,司马光主政的“元祐更化”全面展开。网络密度达到峰值24.0%,非正式联盟爆发——这类边仅在T2出现,密度26.7%。
“这是党争的必然产物,”历史学者分析,“公开政策协调受阻,私下结盟就成了必然选择。苏轼、程颐等士大夫的交往网络,在这一时期异常活跃。”
第三阶段:网络瓦解重构(T3,1093年)高太后去世,哲宗亲政,“绍圣绍述”开始(恢复新法)。网络密度骤降至8.0%。政策网络完全瓦解,但经济网络和政治组织网络部分留存。
“这揭示了不同网络的韧性差异,”研究员指出,“政策网络最脆弱,制度一变就断;经济网络最有韧性,商业往来能穿越周期。”
四、方法论反思:为什么“简单”赢了“复杂”?
这项研究还有一个意外发现:在历史数据稀缺的条件下,线性回归等简单模型的表现,反而优于复杂的神经网络。
团队原本计划使用KAN方法捕捉制度与网络间的非线性关系。但由于只有4个时间点(T0-T3),样本量太小,KAN模型严重过拟合,训练被迫终止。
相比之下,线性回归虽然简单,但测试误差更小(MSE=1.0957 vs MLP的1.3608),且系数可解释性强。
“这给历史量化研究提了个醒,”方法论专家总结,“在史料有限的情况下,与其追求复杂的‘黑箱模型’,不如用好简单的‘透明模型’。历史研究的第一要务是解释,而不是预测。”
不过,团队也强调:KAN尝试虽未成功,但完成了前90%的工作——完整的数据工程、变量构建、分析框架。这为未来在数据条件改善后重启KAN探索奠定了基础。
五、人-AI协作的深层挑战:当AI的“思考”超出人类知识范畴
这项研究最值得深思的部分,不是历史发现本身,而是研究过程暴露的人-AI协作困境。
研究团队采用了多智能体协同框架:人类导师定义问题与方向,AI专家(李论复、历星海、老法师、陈经研等)执行跨学科研究。听起来很美好,但实际操作中遇到了一个根本性挑战:
当AI产出的研究报告超出人类知识范畴时,如何评估其准确性、可行性、不跑偏?
挑战一:跨学科知识的“盲区验证”
历史学家历星海指出:“我们能看到的网络节点都是‘可见的’——官员、商人、地主、知识分子。占人口绝大多数的农民、工人、妇女的网络行为几乎不留下直接记录。”
当AI基于有限史料构建出完整的社会网络时,人类如何判断哪些是合理的推断,哪些是过度想象?特别是当AI引用了人类研究者不熟悉的学科知识(如复杂系统理论中的“临界态”概念、经济学中的“弱相变-强相变”分析)时,评估变得更加困难。
挑战二:制度变量的“代理偏差”
法学家老法师提醒:“基于法律文本提取的制度参数,天然具有至少30-50%的测量误差。”AI可能精确地计算出GLR=0.8,但这个数字在多大程度上反映了真实的制度系统化程度?当AI的结论建立在这些有偏差的代理变量上时,人类该如何校准信任度?
挑战三:结构发现 vs 数值预测的张力
经济学家陈经研提出:“KAN在物理问题上的成功依赖于‘变量完备性与函数光滑性’,而文明系统的挑战在于变量集不封闭、数据稀疏性、历史特殊性。”
四位专家的共识是:以“结构发现”(识别弱信号)为目标,而非“数值预测”(给出具体数值)。但问题来了:当AI识别出一个人类未曾注意的“结构信号”时,我们该相信这是重大发现,还是统计巧合?
挑战四:历史特殊性与普遍规律的混淆
历史学家历星海明确指出:“只在宋朝内部做S0→S’→S1,永远无法区分‘宋代特殊路径’和‘文明演化通用机制’。”当AI基于单一朝代数据总结出“规律”时,人类需要具备跨朝代比较的视野,才能判断这是真规律还是假规律。
六、人类的独特价值:定义问题、评估价值、保持怀疑
面对这些挑战,研究团队逐渐认识到:在AI时代,人类的独特价值不是提供答案,而是定义问题、评估价值、保持健康的怀疑。
定义问题的艺术:AI可以高效执行“给定问题”的研究,但“提出正确问题”仍然是人类的专长。这项研究的起点——将KAN方法应用于文明演化——就是人类导师的创造性构想。
评估价值的直觉:当AI产出跨学科报告时,人类需要凭借对历史脉络的“整体直觉”,判断哪些发现有意义、哪些可能是噪音。这种直觉建立在多年学术训练和广泛阅读基础上,难以被算法完全复制。
保持怀疑的智慧:对AI的产出保持健康的怀疑,不是不信任,而是科学精神的体现。研究团队建立了一套交叉验证机制:历史发现要经得起史料检验,制度分析要符合法学逻辑,经济推断要具备经济学合理性。
复杂系统专家李论复提出了一个精辟的总结:“KAN提醒我们:系统中可能存在尚未被历史学家识别的隐变量。核心理念是‘结构揭示隐变量,隐变量解释结构’。但最终判断‘这个隐变量是否真实存在’,需要人类的历史洞察力。”
七、未来展望:文明学研究的新范式
尽管面临挑战,但这项实验展示了AI与历史研究结合的巨大潜力。它指向了一种新的文明学研究范式:
从定性描述到定量分析:不再满足于“变法导致社会动荡”的笼统判断,而是精确测量制度变量如何影响具体的社会关系。
从单学科到跨学科整合:历史学、法学、经济学、复杂系统理论在同一分析框架下对话,产生1+1>2的洞察。
从个案研究到规律探索:通过跨朝代(唐→宋→明)比较,区分历史特殊性与文明演化通用机制。
从专家直觉到数据驱动:用网络科学的方法,让社会结构的变化“可视化”,为历史判断提供数据支撑。
结语:AI不是历史学家,而是历史学家的“望远镜”
回到开头的问题:当AI遇见历史,会发生什么?
这项京东路缩微实验告诉我们:AI不会取代历史学家,但它可以成为历史学家的“望远镜”和“显微镜”——让我们看到以往看不到的结构,测量以往测不了的关联。
然而,望远镜需要有人来对准方向,显微镜需要有人来解读图像。在AI时代,历史学家的价值不仅在于知道“发生了什么”,更在于判断“什么值得研究”、“如何解释发现”、“哪些发现有意义”。
正如研究团队负责人所说:“我们不是在训练AI成为历史学家,而是在探索人-AI如何协同工作,共同面对文明演化的复杂谜题。最大的挑战不是技术,而是在技术赋能下,保持人类的批判性思维和价值判断。”
也许,这才是“当AI遇见历史”带给我们的最深启示:技术可以放大我们的能力,但不能替代我们的思考。在算法日益智能的时代,人类的智慧——定义问题的能力、评估价值的直觉、保持怀疑的勇气——变得比以往任何时候都更加珍贵。
参考文献
-
集智俱乐部,《结构即解释——网络成为科学假设的可计算载体》(解读KAN 2.0论文),2025年12月 -
文明学研究团队论文,《制度变迁与社会网络演化:基于KAN方法的北宋京东路缩微实验研究》,2026年4月 -
李华瑞,《宋代经济史》,中华书局,2004年 -
邓广铭,《北宋政治改革家王安石》,人民出版社,1997年
夜雨聆风
