链接:https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj提取码:mnsj
https://www.mizhushare.com/docs/
在这个数据分析时,我们经常会遇到这样的尴尬:例如,想研究三种“教学方法”对学生成绩的影响,结果发现这三组学生的初始基础根本不一样。这时候,如果直接用方差分析,初始基础差的那组可能怎么努力也追不上基础好的,结论自然就不够客观。
此时就需要使用【协方差分析(ANCOVA)】,它能帮我们“剥离”干扰变量的影响,让组间比较更公平、结果更精准。
协方差分析:
简单说,协方差分析是“方差分析+回归分析”的结合体——它既保留了方差分析“比较组间差异”的核心功能,又加入了回归分析“控制连续变量”的优势,专门用来处理有干扰因素的组间比较问题。
举例说明:
例如,我们想研究3种教学方法对学生期末数学成绩的影响,每种方法各10名学生。但这些学生的“入学摸底成绩”参差不齐——有的基础好,有的基础弱,直接比较期末成绩,很可能把“基础好”当成“教学方法有效”。
这里的核心逻辑的是:我们真正想比较的是“教学方法”的差异,但“入学成绩”这个连续变量一直在干扰结果。
协方差分析的作用,就是先“扣除”入学成绩对期末成绩的影响,再比较3种教学方法的真实效果——相当于给所有学生“拉到同一起跑线”后,再公平打分。
需要注意的是,协方差分析在满足独立性、方差齐性的基础上,还需满足平行性假设(无交互作用),即协变量对因变量的影响在各组中应该是一致的。如果交互作用显著(P<0.05),说明各组“起跑线”不仅不同,连“加速度”都不一样,此时不能强行做协方差分析。

加载数据:

交互作用检验:
点击顶部菜单栏的【分析→一般线性模型→单变量】,在打开的对话框中进行相应设置。
因变量:最终比较的指标,必须是连续数值型,本例中为「after(治疗后血压)」;
固定因子:想检验的影响因素,必须是分类变量,本例中为「group(组别)」; 协变量:干扰结果的干扰因素,也是要剥离的变量,必须是连续数值型,「before(治疗前血压)」。

点击「模型」按钮打开「单变量:模型」对话框。
指定模型为「构建项」;
将「构建项」设置为「主效应」,分别将「group(组别)」、「before(治疗前血压)」移入「模型」框中;
将「构建项」设置为「交互」,将「group(组别)」、「before(治疗前血压)」全部选中,然后移入「模型」框中,此时会将交互项加入模型。

点击「选项」按钮打开「单变量:选项」对话框,勾选「方差齐性检验」。

设置完成,点击确定。
结果解读:
输出结果一:方差齐性检验

输出结果二:主体间效应检验表
重点关注交互项行(group*before)的显著性P值。如果P>0.05,说明没有显著交互作用,满足平行性假设,可以继续下一步协方差分析;如果P<0.05,说明存在交互作用,不能进行标准的协方差分析。


确认满足平行性假设后,我们需要重新跑一次模型,但这次要剔除交互项。
操作步骤:
点击顶部菜单栏的【分析→一般线性模型→单变量】,在打开的对话框中进行相应设置。
因变量:最终比较的指标,必须是连续数值型,本例中为「after(治疗后血压)」;
固定因子:想检验的影响因素,必须是分类变量,本例中为「group(组别)」; 协变量:干扰结果的干扰因素,也是要剥离的变量,必须是连续数值型,「before(治疗前血压)」。

点击「模型」按钮打开「单变量:模型」对话框。
指定模型为「构建项」,将「构建项」设置为「主效应」,分别将「group(组别)」、「before(治疗前血压)」移入「模型」框中。

点击「EM均值」按钮打开「单变量:估算边际平均值」对话框。该对话框主要用于获取经过调整后的各组均值以及进行相应的比较。
本次将「group(组别)」变量移入「平均值」框中。本次无需勾选「比较主效应」选项,因为本次示例只有2组,无需两两比较。

点击「选项」按钮打开「单变量:选项」对话框。该对话框涵盖了统计量、诊断图以及稳健标准误等高级设置。
本次勾选「描述统计」(输出各组的样本量、均数、标准差,方便直观观察数据)。

设置完成,点击确定。
结果解读:
输出结果一:主体间因子表
该表为分析基础信息表。可以看到,本次研究共有两个组别(药物A、药物B),每组样本量均为 15 人,总样本 N=30,样本量均衡。

输出结果二:描述统计表
该表展示的为原始均值(未修正)的描述统计结果。

输出结果三:主体间效应检验表(核心结果)
该表为协方差分析的核心输出结果。
模型整体显著性(修正模型):F=5.552,p=0.010<0.05,说明整个协方差模型是有效的,「协变量+组别」一起对治疗后血压有显著影响。调整后R²=0.239,说明组别和初始血压共同解释了治疗后血压约23.9%的变异。
协变量:F=5.305,p=0.029<0.05,说明治疗前血压(协变量)对治疗后血压有显著影响,这也验证了使用协方差分析的必要性——基线血压会显著影响结局,不控制的话会干扰药物效果的判断。
自变量:F=6.763,P=0.015<0.05,说明在控制了治疗前血压的影响后,两种药物的降压效果仍存在显著差异。这里的差异已经排除了“两组基线血压不一样”带来的干扰,是更纯净的药物效应。

输出结果四:估算边际平均值(调整后均值表)
该表是控制协变量后,两组治疗后血压的 “调整后均值”,即边际均值。
本次示例中,估算边际平均值显示,在校正初始血压差异后,药物A组的治疗后血压修正均值(133.408)低于药物B组(141.792),表明药物A在降压临床表现上优于药物B(调整后均值差约8.38)。



夜雨聆风