【统计分析软件SPSS】77、单样本t检验

本系列（基于SPSS 31版本）文章配套数据可通过百度网盘获取：

链接：https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj 提取码：mnsj

由于微信公众号已发布文章的内容及排版顺序无法二次编辑，为了方便大家后续查阅、检索，同时便于我对内容进行补充更新与完善，我会将所有已发布的推文，在个人网站上以结构化文档的形式重新整理、归档。欢迎前往查看：

https://www.mizhushare.com/docs/

应用场景

在数据处理时，我们经常会遇到这样的场景：手里样本数据的平均值，和某个“标准值”或者“理论值”到底有没有显著差异？例如：

这种用来检验“样本平均值”与某个“已知的或假设的数值”之间是否存在显著差异，就是单样本t检验的用武之地，它是SPSS中最基础、最常用的统计方法之一。

简单来说，单样本 t 检验是用来推断样本均值与已知总体均值（通常是一个常数或标准值）之间是否存在显著性差异的统计方法。

需要注意的是，该方法理论上要求数据服从或近似服从正态分布。不过t检验其实很“皮实”（稳健），只要不是极端偏态，通常都没问题。若数据非正态，可考虑非参数检验。

操作步骤

加载示例数据【brakes.sav】（软件自带样本数据）。

该数据为某汽车刹车盘工厂的质量控制数据，记录了8台机器各生产的16个刹车盘直径信息。

本次将使用单样本t检验来检查汽车刹车盘的生产是否达标，即查看8台机器各生产的16个刹车盘的平均直径是否与生产标准（322mm）存在显著差异。

示例数据中包含8台机器的数据，因此在统计分析之前需使用标识机器编号的「machine」的变量，将文件拆分为不同的组，以便将每台机器的数据作为独立的样本进行分析。

点击顶部菜单栏的【数据→拆分文件】，根据机器编号（machine变量）进行文件拆分，具体内容可以参考以下文章：

点击顶部菜单栏的【分析→比较平均值和比例→单样本t检验】，在打开的对话框中进行相应设置。

点击「选项」按钮，在打开的选项对话框中可指定用于判断这种差异的置信水平（本次设置为90）以及缺失值的处理方式。

结果解读

系统会为每个检验变量生成一系列描述性统计表。

单样本统计表显示了样本数据的基本统计量（样本量、均值、标准差和标准误）。

可以看到拆分的8组样本的均值都分布在322mm标准值附近，从数据来看，其波动幅度似乎很小。但是需要注意的是，因为存在抽样误差，只看该结果不能直接得出“是否差异显著”的结论，还需假设检验验证。

单样本检验表展示了单样本t检验的结果，该表是判断差异是否显著的核心。包含以下指标：

t 列：显示了每个样本的观测 t 统计量，反映样本均值偏离标准值的程度。该值等于“均值差”除以“样本均值的标准误”。
自由度：通常情况下等于每组的个案数（样本量）减 1。
显著性：显示了基于自由度为15的t分布得出的概率值，也就是我们常说的P值。通常使用0.05（95%置信区间）或0.10（90%置信区间）作为判断显著性的临界值，如果该值小于临界值，表示拒绝原假设（样本均值与总体均值无差异），即说明差异是显著的。
平均值差值：通过用每个样本均值减去检验值（本例中为322）得到。
差值的90%置信区间：总体真实差值可能存在的范围。

本次示例中，由于机器 2、5 和 7 的置信区间完全位于0之上且p值小于0.1（90%置信区间），可以肯定地说，这些机器生产的圆盘平均直径显著大于322mm。同样，因为机器4的置信区间完全位于0之下且p值小于0.1，所以该机器生产的圆盘直径偏小。

该表的核心目的为了告诉我们如果存在差异，这个差异在实际中有多大（即效应大小）。包含以下指标：

标准化量：Cohen's d和Hedges修正是衡量效应大小的两个指标。其中，Cohen's d是最常用的标准化均值差异指标；当样本量较小时，Cohen's d往往会略微高估真实的效应大小，Hedges修正后的数值通常比Cohen's d稍小一点，它提供了更保守、更准确的估计。因此在样本量较小时，建议优先报告Hedges修正值。
点估算：效应大小的具体数值。正数表示样本均值大于检验值（目标值），负数表示样本均值小于检验值。通常认为该值绝对值在0.2左右表示小效应（差异微弱），在0.5左右表示中等效应（差异中等），在0.8以上表示大效应（差异非常显著，具有实际意义）。
90%置信区间：效应大小真值可能存在的范围。

本次示例中，机器2、5和7的效应值均较高，且置信区间完全在0以上，说明这些机器生产的刹车盘直径显著大于目标值；机器4的效应值也较高，但置信区间完全在0以下，说明该机器生产的刹车盘直径显著小于目标值。这也验证了之前得到的结论，但是通过该表可以发现机器2的问题最严重，偏差极大，需立即检查。