乐于分享
好东西不私藏

Excel与Minitab假设检验-双样本假设检验

Excel与Minitab假设检验-双样本假设检验

使用的环境

  • 1
  • 2
  • 3
计算机环境:Windows11Excel版本:Excel2024Minitab22

什么时候用双样本检验

在实际问题中,经常需要比较两个总体的均值是否存在显著差异。例如:

  • 比较两种药物的疗效是否不同
  • 比较两台机器生产的零件尺寸是否一致
  • 比较两个班级的平均成绩是否有显著差别
  • 比较两种工艺生产的产品质量是否有差异

当需要比较两个独立样本均值是否存在显著差异时,就需要使用双样本检验。根据总体方差是否已知以及是否相等,选择不同的检验方法——Z检验或T检验。

理解一下假设检验与双样本检验

假设检验就像是法庭审判:原假设相当于”被告无罪”(默认立场),我们要通过证据(样本数据)来决定是否推翻这个立场。如果证据足够充分(p值很小),我们就”判定有罪”(拒绝原假设);如果证据不够(p值较大),我们就”维持无罪”(不拒绝原假设)。双样本检验就是在这个框架下,专门用来判断两组数据的平均水平是不是真的有差别——比如你想知道A班和B班的数学成绩到底有没有本质区别,而不仅仅是偶然波动造成的。

双样本均值检验的三种情况

在对两个总体均值进行假设检验时,需要根据总体方差是否已知以及是否相等,选择不同的检验方法。具体分为以下三种情况:

情况
条件
检验方法
统计量分布
情况1
两个总体方差 已知
Z检验
标准正态分布
情况2
两个总体方差未知相等
等方差T检验

(合并方差)
t分布
情况3
两个总体方差未知不相等
Welch’s T检验

(近似T检验)
近似t分布

适用条件

无论使用哪种检验方法,都有以下前提假设:

  1. 独立性:两个样本是相互独立的,即一个样本中的观测值不影响另一个样本
  2. 正态性:两个总体近似服从正态分布(当样本量较大时,根据中心极限定理,可以放宽此假设)
  3. 连续型数据:被比较的变量应为连续型数据

假设的建立

三种情况的假设形式完全相同:

  • 原假设(两个总体均值相等,即没有显著差异)
  • 备择假设
    • 双尾检验:(两个总体均值不相等)
    • 左尾检验:(第一个总体均值小于第二个)
    • 右尾检验:(第一个总体均值大于第二个)

其中  和  分别为两个总体的均值。

如何选择检验方法?

在实际操作中,可以按照下面的决策流程选择合适的检验方法:

  1. 总体方差是否已知?
    • 如果已知 → 使用Z检验(情况1)
    • 如果未知 → 继续判断
  2. 两个总体方差是否相等?(可通过F检验判断)
    • 如果F检验的p值 > 0.05 → 认为方差齐性(等方差),使用等方差T检验(情况2)
    • 如果F检验的p值 ≤ 0.05 → 认为方差不齐(不等方差),使用Welch’s T检验(情况3)

实用建议:在大多数实际场景中,总体方差通常是未知的。如果不确定方差是否相等,推荐直接使用Welch’s T检验,因为它更加稳健——当方差实际相等时,Welch’s T检验的结果与等方差T检验非常接近;当方差不等时,它比等方差T检验更准确。

情况1:总体方差已知——Z检验

当两个总体的方差  和 已知时(例如通过历史数据积累或工艺标准规定),使用Z检验

检验统计量为:

其中, 和  分别为两个样本的样本均值, 和  为两个总体的已知方差 和  分别为两个样本的样本量。

该统计量服从标准正态分布,因此不需要计算自由度。

判断规则(双尾检验)

  • 如果 ,则拒绝 
  • 或者如果 p值 < ,则拒绝 
  • 在  时,

情况2:总体方差未知但相等——等方差T检验

当两个总体的方差未知,但有理由认为它们相等(即 )时,使用合并方差(Pooled Variance)进行检验。

合并方差的计算公式为:

其中, 和  分别为两个样本的样本方差

检验统计量为:

该统计量服从自由度为  的t分布

情况3:总体方差未知且不相等——Welch’s T检验

当两个总体的方差未知不相等(即 )时,使用Welch’s T检验(也称近似T检验)。

检验统计量为:

自由度采用Welch-Satterthwaite近似公式计算:

该自由度通常不是整数,实际计算中会取其整数部分或使用软件自动处理。

举个例子

某电子厂使用两种不同工艺(工艺A和工艺B)生产电容器,需要检验两种工艺生产的电容器的平均电容值是否有显著差异。分别从两种工艺的产品中各随机抽取了若干样品,测量其电容值(单位:μF)。数据如下表所示。

工艺A
工艺B
10.2
9.8
10.5
10.1
9.8
9.5
10.3
10.0
10.1
9.7
10.4
9.9
9.9
9.6
10.6
10.2
10.0
9.4
10.3
9.8
10.7
10.3
10.1
9.9
9.7
10.4
10.2

工艺A有15个样品,工艺B有12个样品。在显著性水平  下,检验两种工艺生产的电容器平均电容值是否有显著差异。

首先,利用Excel函数计算两个样本的基础统计量:

计算项
工艺A
工艺B
Excel公式
样本个数 
15
12
=COUNT(A2:A16)
样本均值 
10.2133
9.8500
=AVERAGE(A2:A16)
样本方差 
0.0827
0.0755
=VAR.S(A2:A16)
样本标准差 
0.2875
0.2747
=STDEV.S(A2:A16)

情况1:Z检验(总体方差已知)

假设根据历史质量数据,已知工艺A的总体标准差 ,工艺B的总体标准差 

手动计算

计算项
计算结果
Excel公式
已知总体方差 
0.0784
=0.28
已知总体方差 
0.0729
=0.27
均值差 
0.3633
=E3-F3
标准误差
0.1063
=SQRT(E7/E2+F7/F2)
Z统计量
3.4177
=E9/E10
p值(双尾)
0.0006
=2*(1-NORM.S.DIST(ABS(E11), TRUE))
Z临界值(双尾, =0.05)
1.9600
=NORM.S.INV(0.975)

Excel数据分析工具

Excel数据分析工具包提供了”z检验: 双样本均值检验”功能。

  1. 点击 数据 选项卡
  2. 点击 数据分析
  3. 选择 “z检验: 双样本均值检验”,点击确定
  4. 在对话框中设置:
    • 变量1的区域:选择工艺A的数据范围(1:16)
    • 变量2的区域:选择工艺B的数据范围(1:13)
    • 假设平均差:0
    • 变量1的方差(已知):0.0784
    • 变量2的方差(已知):0.0729
    • 标志:勾选(如果第一行包含标题)
    • :0.05
    • 输出区域:选择输出位置
  5. 点击确定

Mintab计算

Minitab提供了更简便的双样本检验功能。需要注意的是,Minitab的”双样本t”工具只涵盖T检验(情况2和情况3),不直接提供双样本Z检验的菜单选项。

Minitab双样本z检验只能用宏脚本,参考:Excel与Minitab参数估计-总体均值估计

情况2:等方差T检验(总体方差未知但相等)

在大多数实际场景中,总体方差是未知的。此时如果两个样本方差比较接近(本例中 0.0827 vs 0.0755),可以假设总体方差相等,使用等方差T检验。

手动计算

计算项
计算结果
Excel公式
均值差 
0.3633
=E3-F3
合并方差 
0.0795
=((E2-1)*E4+(F2-1)*F4)/(E2+F2-2)
合并标准差 
0.2819
=SQRT(上一行)
标准误
0.1092
=E17*SQRT(1/E2+1/F2)
t统计量
3.3273
=E15/E18
自由度 df
25
=E2+F2-2
p值(双尾)
0.0027
=T.DIST.2T(ABS(E19), E20)
t临界值(双尾, =0.05)
2.0595
=T.INV.2T(0.05, E20)

使用数据分析工具

  1. 点击 数据 选项卡
  2. 点击 数据分析
  3. 选择 “t检验: 双样本等方差假设”,点击确定
  4. 在对话框中设置:
    • 变量1的区域:选择工艺A的数据范围(1:16)
    • 变量2的区域:选择工艺B的数据范围(1:13)
    • 假设平均差:0(检验均值是否相等)
    • 标志:勾选(如果第一行包含标题)
    • :0.05
    • 输出区域:选择输出位置
  5. 点击确定

Minitab计算

操作步骤

  1. 将数据输入到Minitab工作表中:在C1列输入工艺A的15个数据,在C2列输入工艺B的12个数据。也可以直接打开Excel数据文件
  2. 选择菜单:统计 > 基本统计量 > 双样本t
  3. 在对话框中:
    • 选择”每个样本在各自的列中”
    • 样本1:选择C1列(工艺A)
    • 样本2:选择C2列(工艺B)
  4. 点击 “选项” 按钮:
    • 置信水平:95.0
    • 假设差值:0.0
    • 备择假设:差值 ≠ 假设差值
    • Minitab默认不等方差,这里需要手动勾选
  5. 点击确定,返回主对话框后再点击确定

结果如下:

情况3:不等方差T检验——Welch’s T检验(总体方差未知且不相等)

如果没有理由假设两个总体方差相等,或者F检验显示方差不齐,应使用Welch’s T检验。

手动计算

计算项
计算结果
Excel公式
均值差 
0.3633
=E3-F3
标准误
0.1086
=SQRT(E4/E2+F4/F2)
t统计量
3.3449
=E25/E26
自由度 df(Welch近似)
24
=(E4/E2+F4/F2)^2/((E4/E2)^2/(E2-1)+(F4/F2)^2/(F2-1))
p值(双尾)
0.0027
=T.DIST.2T(ABS(E27), E28)
t临界值(双尾, =0.05)
2.0639
=T.INV.2T(0.05, E28)

使用数据分析工具

操作方式与等方差T检验基本相同,只是在第3步选择 “t检验: 双样本异方差假设”

  1. 点击 数据 选项卡
  2. 点击 数据分析
  3. 选择 “t检验: 双样本异方差假设”,点击确定
  4. 参数设置与等方差检验相同
  5. 点击确定

Minitab计算

操作步骤

  1. 将数据输入到Minitab工作表中:在C1列输入工艺A的15个数据,在C2列输入工艺B的12个数据。也可以直接打开Excel数据文件
  2. 选择菜单:统计 > 基本统计量 > 双样本t
  3. 在对话框中:
    • 选择”每个样本在各自的列中”
    • 样本1:选择C1列(工艺A)
    • 样本2:选择C2列(工艺B)
  4. 点击 “选项” 按钮:
    • 置信水平:95.0
    • 假设差值:0.0
    • 备择假设:差值 ≠ 假设差值
  5. 点击确定,返回主对话框后再点击确定

结论:P值 = 0.003 < 0.05,拒绝原假设,认为两种工艺生产的电容器平均电容值存在显著差异。差值的95%置信区间为(0.139, 0.587),该区间不包含0,进一步证实了两个均值有显著差异。

总结

关键要点

  1. 三种方法的选择:总体方差已知用Z检验;未知且相等用等方差T检验;未知且不等用Welch’s T检验
  2. Z检验 vs T检验:Z检验基于标准正态分布,无需自由度;T检验基于t分布,需要计算自由度
  3. 等方差 vs 不等方差T检验:如果两个总体方差相等,使用合并方差的T检验(自由度为 );如果方差不等,使用Welch’s T检验(自由度通过近似公式计算,通常较小)
  4. 判断标准:p值 < (通常取0.05)则拒绝原假设,认为两个均值有显著差异
  5. 置信区间:如果差值的置信区间不包含0,同样说明存在显著差异

注意事项

  • 在实际中,总体方差通常是未知的,因此T检验比Z检验更常用
  • 进行T检验前,最好先通过F检验判断方差齐性,再选择等方差或不等方差T检验
  • 如果不确定方差是否相等,推荐使用Welch’s T检验,因为它更加稳健
  • 样本量较小时,正态性假设比较重要;样本量较大时(),可以放宽正态性假设
  • Excel中的T.TEST函数也可以快速计算双样本T检验的p值,语法为:=T.TEST(数组1, 数组2, 尾数, 类型),其中类型2为等方差,类型3为不等方差
  • Minitab默认使用Welch’s T检验,如需等方差检验需手动勾选”假定等方差”
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Excel与Minitab假设检验-双样本假设检验

猜你喜欢

  • 暂无文章