你从裁判文书网下载了200份判决书,挨个读完了,把想要的信息摘出来填进了Excel表。然后你卡住了——数据有了,但怎么分析?你听别人说要用SPSS、Stata或者Python,头都大了。你是不是觉得,没有这些专业工具,就没法做实证研究?
不是的。法学论文里90%的实证分析,Excel就能完成。你不会的那些复杂统计,大概率压根用不上。
今天沐轩不教编程,只教Excel。5类法学论文里最常用的统计操作,一步一截图放在资料包里了,你跟着做就行。这篇推文讲清楚每类统计在什么场景下用。
一、准备工作:把你的数据变成Excel认识的“表格”
在开始任何分析之前,先确认你的数据结构是否正确。Excel能分析的数据,必须满足一个条件:每一列是一个“变量”,每一行是一份“判决书”。
常见的错误是:你把所有信息塞进一个单元格里,比如“(2023)京01民终1234号,北京,支持,2023”,这样Excel读不懂。
正确做法:拆成多列。案号一列、年份一列、地区一列、裁判结果一列、赔偿金额一列。每一列的值必须是单一的、可分类的。比如“裁判结果”这一列,只能填“支持”或者“驳回”,不能填“支持,但金额打了八折”。
做好这一步,后面所有的分析都是点几下鼠标的事。
二、第一类:频次统计——看看“哪个最多”
这是最简单的统计,也是最有用的。你想知道这200份判决书里,法院支持原告诉请的有多少件,驳回的有多少件。或者不同裁判立场的分布情况。
操作步骤:
选中“裁判结果”这一列的任意一个单元格 点击Excel顶部菜单的“插入”→选择“数据透视表” 在弹出的窗口中,确认数据范围已自动选中,点击“确定” 在右侧出现的“数据透视表字段”中,把“裁判结果”分别拖进“行”和“值”区域
表格会自动告诉你:支持的有83件,驳回的有117件。不用算,不用写公式。
进阶用法: 把“年份”拖进“列”,把“裁判结果”拖进“行”和“值”,你就能看到每一年的支持/驳回数量分布。这就是你论文里“裁判倾向的时间演变”那一段的数据基础。
三、第二类:百分比计算——用“百分比”说话
光有数字不够,读者想知道比例。Excel的透视表默认显示“计数”,你可以改成“行总数的百分比”。
操作步骤:
在数据透视表的“值”区域,右键点击“计数项:裁判结果” 选择“值字段设置”→点击“值显示方式”→在下拉菜单里选“行总数的百分比” 点击“确定”
现在你看到的不是83件,而是83/200=41.5%。这比“83件”更有说服力。
适用场景: 展示各类立场的占比、不同法院的支持率差异、认罪认罚案件的适用比例。
四、第三类:均值计算——算“平均赔偿额”“平均刑期”
你想知道认罪认罚案件的平均量刑折扣是多少,或者个人信息侵权案件的平均赔偿额是多少。
操作步骤:
选中“赔偿金额”这一列的任意一个单元格 插入→数据透视表 把“裁判结果”拖进“行”区域 把“赔偿金额”拖进“值”区域 在值区域右键点击“计数项:赔偿金额”→选择“值字段设置”→在“计算类型”里选择“平均值”→确定
现在你看到的是:支持原告诉请的案件中,平均赔偿金额是3.2万元;驳回的案件中平均赔偿额是0(因为没有赔偿)。
适用场景: “认罪认罚案件的平均量刑折扣比非认罪认罚案件低XX%”“经济发达地区的赔偿金额比欠发达地区高XX元”。这些数字是你论文里“实证发现”的核心。
五、第四类:分组对比——“A组比B组高还是低?”
这是实证论文里最有价值的分析,也是最简单的。你想知道:不同地区的法院,支持率有没有差异?或者不同年份,赔偿金额有没有变化?其实Excel的透视表已经自动帮你分组了。
操作步骤:
数据透视表的“行”区域放“地区” “列”区域放“裁判结果” “值”区域放“裁判结果”(计数),并把值显示方式设为“行总数的百分比”
你直接得到一张表:北京的赔偿金额是多少、平均刑期是多少。如果北京是3.2万,广东是2.4万,你就知道差异是什么。不需要算标准差。北京比广东高27%,这个数字直接写进论文。
适用场景: “一线城市的赔偿金额显著高于二三线城市”“东部地区的认罪认罚适用率高于西部”。
六、第五类:时间趋势图——把“变化”画出来
你想展示“过去五年,法院的支持率逐年上升”。Excel把它变成折线图,点几下就行。
操作步骤:
先按第三类的方法,做一张透视表:“年份”在行,“裁判结果”在列,值是行总数的百分比 选中透视表生成的数据区域 点击“插入”→选择“折线图” Excel自动画出一条线,X轴是年份,Y轴是比例
如果2020年是30%,2024年是55%,你画出的是一条向上的线。不用SPSS,不用Python。
适用场景: “认罪认罚从宽制度的适用比例逐年上升”“惩罚性赔偿的支持率在司法解释出台后显著提高”。
七、一个常见错误:把“相关性”当成“因果”
Excel做不出来因果推断。你的数据只能告诉你“A和B相关”,不能告诉你“A导致了B”。
从网上购物到阅读学术文献,我们都习惯了对数据进行横向比较。但法学实证研究里,你发现“广东的量刑折扣比北京高”,这是一个相关关系。你不能直接说“因为广东的经济更发达”。可能的原因有很多:法官的自由裁量偏好、当地的司法政策、样本本身的偏差。
写论文的时候,正确的表述是:“数据显示,广东的量刑折扣显著高于北京。这一差异可能与……有关(提出假设),有待进一步研究验证。”而不是“广东的制度更完善,因此”。
八、你的“会了”与“不会”
做完上面五类统计,你的实证部分已经超过了绝大多数法学论文。不需要学SPSS,不需要学Python,不需要学回归分析。法学论文的审稿人不会因为你不会因子分析而拒稿,但会因为你连“支持率”都没算出来而拒稿。
我做好了《法学Excel实证操作手册》,每一类统计都配了详细截图(从原始数据到生成图表的每一步),你打开Excel,手册放旁边,跟着点就行。另外还有一份《论文数据汇报模板》,你的统计结果可以直接填进这个模板,变成“实证发现”那一节的标准文字。
关注领《法学论文AI写作指令库》——包里有今天的Excel操作手册(含截图)、数据汇报模板,以及我之前整理的图表决策卡、争议焦点地图模板、研究方法速查卡、非正式出版物引用速查卡。
不喊口号,不卖焦虑,只交付你明天写论文就能用的东西。欢迎来交流。
夜雨聆风