乐于分享
好东西不私藏

【统计分析软件SPSS】63、百分位数

【统计分析软件SPSS】63、百分位数

本系列(基于SPSS 31版本)文章配套数据可通过百度网盘获取:

链接:https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj 提取码:mnsj

由于微信公众号已发布文章的内容及排版顺序无法二次编辑,为了方便大家后续查阅、检索,同时便于我对内容进行补充更新与完善,我会将所有已发布的推文,在个人网站上以结构化文档的形式重新整理、归档。欢迎前往查看:

https://www.mizhushare.com/docs/
01
应用场景

在数据分析中,我们不仅关注“平均值”,更希望了解某个数据在整体中的相对位置——例如,某学生成绩是位于前10%,还是后50%?这时就需要用到百分位数。

  • 百分位数:

百分位数(Percentile)是描述数据分布的重要统计量,用于表示某一数值在整体数据中所处的位置。例如:

  • P25(第25百分位数):有25%的数据小于或等于该值,也称为第一四分位数(Q1)

  • P50(第50百分位数):50%的数据小于或等于该值,即中位数

  • P75(第75百分位数):有75%的数据小于或等于该值,也称为第三四分位数(Q3)

SPSS提供了两种常用路径来获取百分位数,可根据分析需求灵活选择:

  • 频率】功能:该功能主要用于生成频数分布表,百分位数为其可选输出项之一。可在同一输出中同时获得均值、标准差、频数、百分比等多类统计量,适合综合性描述分析。

  • 百分位数】功能:专门用于计算百分位数的功能模块。操作简洁,结果聚焦,适合快速获取特定位置的统计值,效率更高。

02
操作步骤
加载示例数据【demo.sav】(软件自带样本数据)。

点击顶部菜单栏的【分析→描述统计→百分位数】,在打开的对话框进行相应设置:

  • 主对话框:

  • 变量:需要分析的数值型变量。可同时选多个变量,SPSS会分别计算。

  • 百分位值:系统提供了三种灵活的设定方式,可以根据研究需求进行选择。

选项
含义
默认值

默认会显示第5、10、25、50、75、90和95百分位数的值。

定量变量的值将有序数据划分为不同的组,使得一定的百分比位于该值之上,而另一百分比位于该值之下。

四分位数

即第 25、50 和 75 百分位数,以描述偏态分布数据的离散程度。

定制

如果需要特定的切分点(例如在项目分析中需要27%和73%作为高低分组的临界值),可以勾选该选项,并在下方的输入框中手动输入0 – 100范围内数值,使用「添加、更改、移除」按钮来操作百分位数值列表中的值。

  • 百分位数方法:系统提供了多种数学算法(如HAVERAGE、加权平均等)。默认情3况下,使用「HAVERAGE」方法来计算百分位数。对于大多数常规分析,保持默认即可。关于其他方法的详细信息,可以参阅以下官方文档:

https://www.ibm.com/docs/en/spss-statistics/31.0.0?topic=examine-percentiles-subcommand-command
  • 缺失值对话框:

该对话框主要用于控制对缺失值的处理方式。

  • 列表方式:如果任何指定变量存在缺失值,该个案(即数据行)将从所有分析中排除。

  • 按变量:逐个变量地排除具有缺失值的个案。即在进行特定变量的分析时,仅排除该变量缺失的数据,而不影响其他变量的分析。

03
输出结果

计算完成,SPSS会自动弹出输出窗口,主要包含两个输出表格:

  • 输出结果一:个案处理摘要

展示参与分析的有效样本数量和缺失值情况。用于估数据完整性,确认有多少个案被纳入分析。

  • 输出结果二:百分位数表

该表展示了SPSS对所选变量进行百分位数分析的结果。

需要注意的是,表格中出现了两种不同的计算定义,这是SPSS默认输出的特征:

  • 加权平均(定义 1): 这是SPSS的标准默认算法。它通过对相邻观测值进行加权插值来计算,因此会看到它提供了所有请求的百分位数(包括 90)。

  • 图基枢纽(Tukey’s Hinges): 这是由统计学家Tukey提出的一种计算四分位数的方法,常用于绘制箱线图(Boxplot)。需要注意的是,图基枢纽只计算25、50、75这三个位置。因此,在表格中,图基枢纽对应的90这一列是空白的。