【统计分析软件SPSS】76、t检验基本思想与类型

本系列（基于SPSS 31版本）文章配套数据可通过百度网盘获取：

链接：https://pan.baidu.com/s/15r0rLWkJlcecUvBPKZo_MQ?pwd=mnsj 提取码：mnsj

由于微信公众号已发布文章的内容及排版顺序无法二次编辑，为了方便大家后续查阅、检索，同时便于我对内容进行补充更新与完善，我会将所有已发布的推文，在个人网站上以结构化文档的形式重新整理、归档。欢迎前往查看：

https://www.mizhushare.com/docs/

应用场景

在做数据分析时，我们经常会遇到一个核心问题：两组数据的差异，到底是真实存在的“因果必然”，还是运气不好的“随机波动”？

t检验正是回答这一问题最基础、最经典的统计工具之一。它能帮助我们从概率的角度，判断差异是否具有统计学上的显著性。

基本思想

t检验本质上是一种假设检验，其工作流程大致如下所示：

①、建立假设：零假设H0（通常假设两组数据无差异）、备择假设H1（两组数据确实存在差异）。
②、设定显著性水平α：通常设为0.05（对应 95% 置信区间）。这意味着在做出“存在差异”的结论时，我们愿意承担不超过5%的误判风险。
③、计算检验统计量：也就是t值。计算公式为：t =（样本均值差异）÷（差异的标准误）。通过公式可以看出分子越大（差异越明显）、分母越小（数据越稳定），t值就越大，差异越可能具有统计学意义。
④、得出p值并做出推断：p值是在零假设（H0）成立的前提下，观察到当前或更极端数据的概率。通常情况下若p < 0.05，拒绝零假设，认为观察到的差异具有统计学意义。

需要注意的是，t检验要求数据为计量资料（连续变量，如身高、体重、分数等），且应服从或近似服从正态分布。不过，t检验对轻微的偏态偏离具有较强的稳健性，无需过分苛求完美正态。

三大类型

在SPSS中，t检验根据数据结构的差异，主要划分为以下三种类型：

一、单样本t检验：和“标准答案”比高低

核心用途：

判断一组样本的均值是否与某个已知的理论值、标准值或总体均值存在显著差异。通俗地说，就是“我测出来的这个平均值，和公认的标准值到底一不一样？”

经典场景：

检测某公司生产的零件是否等于标准品的理论值；

某班级的平均考试成绩是否与年级平均分存在显著差异；

验证实验室测定的某种元素含量是否等于国家标品认证值等。

二、独立样本t检验：两组人马，一较高下

核心用途：

比较两个完全独立、互不相关的组别在某个定量指标上的均值差异。它的特点是两个组的成员互不重叠，你测你的、我测我的，两组样本之间没有关联。比如男生组和女生组、实验组和对照组、A药组和B药组。

经典场景：

比较城镇居民和农村居民的存款金额是否存在差异；

比较两种不同教学方法下的学生成绩；

比较两种抗生素处理后的细菌菌落数等。

三、成对样本t检验：自己和自己比，最公平

核心用途：

比较同一批研究对象在两种不同条件或两个不同时间点下的均值差异。它的核心在于“配对”——每一个“处理前”的数据都对应一个“处理后”的数据，两组样本之间存在一一对应的配对关系。数据必须成对出现，且样本量相等。本质上，它是先计算每一对的差值，然后将这些差值作为一个新的变量，检验其均值是否显著偏离0，因此可以理解为转化为单样本t检验来处理。

经典场景：

同一批患者接受治疗前后的某项生理指标变化；

同一份样本分为两份，分别用两种检测方法测得的结果；

同一批学生在期中考试和期末考试中的成绩变化等。

t检验是统计分析中最基础但极其重要的工具，选择合适的t检验方法的关键在于理解“数据之间的关系”：

注：该图由AI生成