乐于分享
好东西不私藏

【统计分析软件SPSS】59、频率分析中的四大统计模块

【统计分析软件SPSS】59、频率分析中的四大统计模块

本系列(基于SPSS 31版本)文章配套数据可通过百度网盘获取:

链接:https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj 提取码:mnsj

由于微信公众号已发布文章的内容及排版顺序无法二次编辑,为了方便大家后续查阅、检索,同时便于我对内容进行补充更新与完善,我会将所有已发布的推文,在个人网站上以结构化文档的形式重新整理、归档。欢迎前往查看:

https://www.mizhushare.com/docs/

在 SPSS 中进行频率分析时,统计按钮里有四大模块:

  • 百分位值 → 看位置

  • 集中趋势 → 看中心

  • 离散 → 看波动

  • 分布 → 看形状

这些选项分别从不同角度刻画变量的特征。本文将系统解释这四部分各自的含义,以及它们在数据分析中的作用。

01
百分位值
  • 含义:

表示数据中某个位置上的数值,回答“数据在不同位置上的分布情况”例如:第25百分位数表示有25%的数据小于或等于这个值。

  • 具体选项:

选项

说明

四分位数(Q)
自动输出三个关键百分位数:
  • Q1 = 第25百分位数
  • Q2 = 第50百分位数(即中位数)
  • Q3 = 第75百分位数
常用于计算四分位距(IQR = Q3 – Q1),衡量中间50%数据的离散程度

分割点(U)

将数据分成相等组,如输入“10”表示把数据分成10个等份,输出每个分界点的数值(即十等分点)

百分位数(P)

可自定义任意百分位数,如输入90(点击添加),表示求出第90百分位数(即90%的人低于此值)

  • 实用场景:
  • 分析收入时,看“前10%高收入人群”的门槛是多少;

  • 研究成绩分布时,找“前25%优秀学生”的分数线。
02
集中趋势
  • 含义:

反映数据“中心位置”或“典型水平”的指标,回答“数据的典型值是多少”。

  • 具体选项:

选项

说明

平均值(M)

所有数值之和除以个数(算术平均)
  • 适用于连续变量
  • 易受极端值影响(如一个超高收入拉高整体平均)

中位数(D)

数据排序后位于正中间的值
  • 不受极端值影响,适合偏态分布(如收入、房价)
  • 是稳健的集中趋势度量

众数(O)

出现频率最高的数值
  • 适用于分类变量或连续变量
  • 多峰数据可能有多个众数

总和(S)

所有数值的加总结果
较少单独使用,常用于计算均值
  • 实用场景:

对连续变量,同时看平均值和中位数,若两者差异大,表明数据偏斜严重,优先用中位数描述典型水平

03
离散趋势
  • 含义:

反映数据之间的差异程度或波动大小,回答“数据分散得有多大”。

  • 具体选项:

选项

说明

标准差(I)

最常用的离散指标,表示数据偏离均值的平均距离。

数值越大,说明个体差异越大

方差(V)

标准差的平方

范围(N)

极值范围(最大值 – 最小值),简单但易受异常值影响

最小值(I)

数据中的最小观测值

最大值(X)

数据中的最大观测值

标准误差平均值(E)

表示样本均值的抽样误差,用于推断总体均值的置信区间

  • 实用场景:

收入标准差为50千美元:表示平均每人收入与均值相差约50千美元。

04
分布特征
  • 含义:

描述数据分布的形状特征,回答“数据分布形状是怎样的”。

用于判断是否接近正态分布,从而决定后续分析方法的选择。

  • 具体选项:

选项

说明

偏度(W)

衡量分布对称性:
• >0:右偏(长尾在右),如收入、房价
• <0:左偏(长尾在左)
• ≈0:近似对称

峰度(K)

衡量分布尖峭程度:
• >0:比正态更尖(尖峰厚尾),风险更高
• <0:比正态更平(低峰薄尾)
• ≈0:接近正态分布
  • 实用场景:

偏度/峰度接近0时,数据才可能满足参数检验的前提条件(如t检验、ANOVA)。实际中常用直方图+正态曲线辅助判断。