乐于分享
好东西不私藏

SPSS实操 | 如何利用SPSS软件进行Spearman相关分析

SPSS实操 | 如何利用SPSS软件进行Spearman相关分析

 1、定义: Spearman等级相关系数(Spearman’s rank correlation coefficient),又称秩相关系数,记为ρ(rho) 或 rₛ,由英国心理学家Charles Spearman于1904年提出。
2、对比Person相关适用条件

条件

Pearson积差相关

Spearman等级相关

变量类型

连续变量(等距/比率)

有序分类变量或连续变量

分布要求

双变量正态分布(严格要求)

任意分布(无分布限制)

线性关系

线性关系(散点图呈直线趋势)

单调关系(单调递增或递减即可)

异常值敏感性

敏感(一个极端值可显著改变r

稳健(对异常值不敏感)

数据特征

原始数据精确值

等级资料、半定量数据

样本量

通常n≥30

n≥8即可,小样本也可用

3、Spearman相关适用场景
    (1)有序分类变量(Ordinal data)。医学实例:疗效等级(痊愈、显效、有效、无效)与副作用等级(无、轻、中、重)
    (2)数据不满足正态分布。医学实例:血清抗体滴度(1:10, 1:100, 1:1000…呈倍数关系)、偏态分布的生化指标
    (3)存在极端值或离群点。医学实例:收入与健康状况研究(少数高收入者)
    (4)数据一端或两端有不确定值。医学实例:实验室检测”<0.01″或”>100″(超出检测限的数据)
    (5)总体分布类型未知:新发现的生物标志物,尚未明确其分布特征。
核心思想:
    不直接使用原始数据的数值,而是利用数据的秩次(rank,即排序后的名次)进行相关分析,将原始变量X和Y分别转换为秩次变量Rₓ和Rᵧ,然后计算这两个秩次变量的Pearson相关系数。属于非参数统计方法(non-parametric method),对总体分布不作正态性要求。
4、SPSS软件操作
   示例:研究健康成年人的BMI和甘油三酯(TG)的关系,测得50名健康成年人的BMI和甘油三酯,拟探讨健康成年人的BMI和甘油三酯是否有关。两个变量均为定量变量,可以采用Pearson相关性分析或Spearman相关性分析。
   验证条件包括:条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。条件2:两变量之间为单调关系
    (1)验证条件1:两个定量变量中至少有一个为非正态分布或总体分布未知或为等级资料。
    ① 选择“分析”—“描述统计”—“探索”。
    ②在“探索”对话框中将变量“BMI”和“TG”选入右侧“因变量列表”。
    ③ 点击“图 ”,在“图 ” ,勾选“含检验的正态图”,点击“继续 ”“确定”。
    ④ 结果显示变量BMI的正态性检验的P值均<0.05,提示不满足正态性要求。
    (2)验证条件2:两个变量之间为单调关系。
    ①选择“图”—“旧对话框”—“散点图/点图…”
    ②在“散点图/点图…”对话框中选择第一种“简单散点图”,然后点击“定义”,出现主对话框。
    ③在“简单散点图”主对话框中将变量“TG”选入右侧Y轴中,将变量“BMI”选入右侧X轴中,点击“确定”。
    (3)Spearman相关分析(假定演示数据符合2个条件!)
    ① 选择“分析”—“相关”—“双变量”
    ②在“双变量相关性”对话框中将变量“BMI”和“TG”选入右侧“变量”框,选择相关系数中的“斯皮尔曼(S)”,点击“确定”。
结果解读:
    两组Spearman相关系数r=-0.040,P=0.784。可知本研究样本的BMI与TG之间不存在线性相关性
经验之谈 
(1)”降级使用”问题。
    误区:”Spearman是非参数方法,适用范围更广,所以一律用Spearman”。正解:数据满足Pearson条件时,应优先使用Pearson(统计效能更高)。
(2)相关系数大小误解。
    Spearman rs通常比Pearson r略小(因损失了数值信息),若Spearman >> Pearson,提示数据中存在异常值或非线性单调关系
(3)零相关≠独立
    Spearman rs=0 仅表示无单调关系,变量间可能存在曲线关系(如U型关系)
(4)样本量误区
    小样本(n<10)时,Spearman的抽样分布不稳定,P值解释需谨慎。通常情况下,医学研究中n≥30较为可靠。