~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~
2021-2025高考真题分类 统计与统计案例5种常见考法归类
~ ~
2021-2025高考真题分类 统计与统计案例5种常见考法归类 1
一 众数、中位数、平均数及方差的计算 1
二 统计图表及其应用 2
三 相关系数 5
四 回归经验方程 6
五 独立性检验 7
参考答案 12
~ ~
一 众数、中位数、平均数及方差的计算
1. (2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为 ( )
A. 8 B. 9 C. 12 D. 18
2. 【多选】(2023·新课标Ⅰ卷·高考真题)有一组样本数据x ,x ,⋅⋅⋅,x ,其中x 是最小值,x 是最大值,则
1 2 6 1 6
( )
A. x ,x ,x ,x 的平均数等于x ,x ,⋅⋅⋅,x 的平均数
2 3 4 5 1 2 6
B. x ,x ,x ,x 的中位数等于x ,x ,⋅⋅⋅,x 的中位数
2 3 4 5 1 2 6
C. x ,x ,x ,x 的标准差不小于x ,x ,⋅⋅⋅,x 的标准差
2 3 4 5 1 2 6
D. x ,x ,x ,x 的极差不大于x ,x ,⋅⋅⋅,x 的极差
2 3 4 5 1 2 6
3. 【多选】(2021·新高考全国Ⅱ卷·高考真题)下列统计量中,能度量样本x ,x ,⋯,x 的离散程度的是
1 2 n
( )
A. 样本x ,x ,⋯,x 的标准差 B. 样本x ,x ,⋯,x 的中位数
1 2 n 1 2 n
C. 样本x ,x ,⋯,x 的极差 D. 样本x ,x ,⋯,x 的平均数
1 2 n 1 2 n
4. (2023·上海·高考真题)国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,某市
在2020年间经济高质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个
季度GDP的中位数与平均数相等,则2020年GDP总额为 ;
5. 【多选】(2021·新高考全国Ⅰ卷·高考真题)有一组样本数据x ,x ,⋯,x ,由这组数据得到新样本数据
1 2 n
y ,y ,⋯,y ,其中y =x +c(i=1,2,⋅⋅⋅,n),c为非零常数,则 ( )
1 2 n i i
A. 两组样本数据的样本平均数相同 B. 两组样本数据的样本中位数相同
C. 两组样本数据的样本标准差相同 D. 两组样本数据的样本极差相同
6. (2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试
验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处
理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x,
i
y ii=1,2,⋅⋅⋅,10 .试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率x 545 533 551 522 575 544 541 568 596 548
i
伸缩率y 536 527 543 530 560 533 522 550 576 536
i
数学试题 第 1 页 共 21 页记z i =x i -y ii=1,2,⋅⋅⋅,10
,记z ,z ,⋅⋅⋅,z 的样本平均数为z,样本方差为s2. 1 2 10
(1)求z,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果
s2
z≥2 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提
10
高,否则不认为有显著提高)
7. (2021·全国乙卷·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有
无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s2和s2.
1 2
(1)求x,y,s2,s2;
1 2
s2+s2
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2 1 2 ,则认为
10
新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
二 统计图表及其应用
1. (2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块
稻田的亩产量(单位:kg)并整理如下表
亩产 [900, [950, [1000, [1050, [1150,
[1100,1150)
量 950) 1000) 1050) 1100) 1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是 ( )
A. 100块稻田亩产量的中位数小于1050kg
B. 100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C. 100块稻田亩产量的极差介于200kg至300kg之间
D. 100块稻田亩产量的平均值介于900kg至1000kg之间
数学试题 第 2 页 共 21 页2. (2021·全国甲卷·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家
庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是 ( )
A. 该地农户家庭年收入低于4.5万元的农户比率估计为6%
B. 该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C. 估计该地农户家庭年收入的平均值不超过6.5万元
D. 估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
3. (2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:°C),共100个数据,分成6组:[13.55
,13.75),[13.75,13.95),[13.95,14.15),[14.15,14.35),[14.35,14.55),[14.55,14.75],并整理得到如
下的频率分布直方图,则全球年平均气温在区间[14.35,14.75]内的有 ( )
A. 22年 B. 23年 C. 25年 D. 35年
4. (2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下
茎叶图:
则下列结论中错误的是 ( )
A. 甲同学周课外体育运动时长的样本中位数为7.4
B. 乙同学周课外体育运动时长的样本平均数大于8
C. 甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D. 乙同学周课外体育运动时长大于8的概率的估计值大于0.6
数学试题 第 3 页 共 21 页5. (2022·全国甲卷·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随
机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲
座前和讲座后问卷答题的正确率如下图:
则 ( )
A. 讲座前问卷答题的正确率的中位数小于70%
B. 讲座后问卷答题的正确率的平均数大于85%
C. 讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D. 讲座后问卷答题的正确率的极差大于讲座前正确率的极差
6. (2021·天津·高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分
数据分为8组:66,70 、70,74 、⋯、94,98 ,并整理得到如下的频率分布直方图,则评分在区间
82,86 内的影视作品数量是 ( )
A. 20 B. 40 C. 64 D. 80
7. (2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,
得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用
该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)
的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区
间[40,50)的人口占该地区总人口的16%.从该地区中任选
一人,若此人的年龄位于区间[40,50),求此人患这种疾病的
概率.(以样本数据中患者的年龄位于各区间的频率作为患
者的年龄位于该区间的概率,精确到0.0001).
数学试题 第 4 页 共 21 页8. (2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰
技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和lgP的关系,其
中T表示温度,单位是K;P表示压强,单位是bar.下列结论中正确的是 ( )
A. 当T=220,P=1026时,二氧化碳处于液态
B. 当T=270,P=128时,二氧化碳处于气态
C. 当T=300,P=9987时,二氧化碳处于超临界状态
D. 当T=360,P=729时,二氧化碳处于超临界状态
三 相关系数
1. (2023·上海·高考真题)根据身高和体重散点图,下列说法正确的是 ( )
A. 身高越高,体重越重 B. 身高越高,体重越轻
C. 身高与体重成正相关 D. 身高与体重成负相关
2. (2025·天津·高考真题)下列说法中错误的是 ( )
A. 若X∼Nμ,σ2 ,则P(X≤μ-σ)=P(X≥μ+σ)
B. 若X∼N1,22 ,Y∼N2,22 ,则P(X<1)
p+1.65 ,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否
n
认为生产线智能化升级改造后,该工厂产品的优级品率提高了?( 150≈12.247)
n(ad-bc)2
附:K2=
(a+b)(c+d)(a+c)(b+d)
P
K2≥k
0.05 0.01
0.001
0 0
3.84 6.63 10.82
k
1 5 8
数学试题 第 9 页 共 21 页5. (2022·全国甲卷·高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长
途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
n(ad-bc)2
附:K2= ,
(a+b)(c+d)(a+c)(b+d)
PK2≥k 0.100 0.050 0.010
k 2.706 3.841 6.635
6. (2021·全国甲卷·高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两
台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
n(ad-bc)2
附:K2=
(a+b)(c+d)(a+c)(b+d)
PK2≥k 0.050 0.010 0.001
k 3.841 6.635 10.828
数学试题 第 10 页 共 21 页7. (2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫
生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时
在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该
P(B|A) P(B|A)
疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指
P(B|A) P(B|A)
标为R.
P(A|B) P(A|B)
(ⅰ)证明:R= ⋅ ;
P(A|B) P(A|B)
(ⅱ)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(ⅰ)的结果给出R的估计值.
n(ad-bc)2
附K2= ,
(a+b)(c+d)(a+c)(b+d)
PK2≥k 0.050 0.010 0.001
k 3.841 6.635 10.828
数学试题 第 11 页 共 21 页参考答案
1. C
【分析】由平均数的计算公式即可求解.
2+8+14+16+20 60
【解析】样本数据2,8,14,16,20的平均数为 = =12.
5 5
故选:C.
2. BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【解析】对于选项A:设x ,x ,x ,x 的平均数为m,x ,x ,⋅⋅⋅,x 的平均数为n,
2 3 4 5 1 2 6
则n-m= x 1 +x 2 +x 3 +x 4 +x 5 +x 6 - x 2 +x 3 +x 4 +x 5 = 2x 1 +x 6
6 4
-x 5 +x 2 +x 3 +x 4 ,
12
因为没有确定2x 1 +x 6 ,x +x +x +x 的大小关系,所以无法判断m,n的大小, 5 2 3 4
例如:1,2,3,4,5,6,可得m=n=3.5;
例如1,1,1,1,1,7,可得m=1,n=2;
11
例如1,2,2,2,2,2,可得m=2,n= ;故A错误;
6
对于选项B:不妨设x ≤x ≤x ≤x ≤x ≤x ,
1 2 3 4 5 6
x +x
可知x ,x ,x ,x 的中位数等于x ,x ,⋅⋅⋅,x 的中位数均为 3 4 ,故B正确;
2 3 4 5 1 2 6 2
1
对于选项C:举反例说明,例如:2,4,6,8,10,12,则平均数n= 2+4+6+8+10+12
6
=7,
1
标准差s 1 = 6 2-7 2+4-7 2+6-7 2+8-7 2+10-7 2+12-7 2
105
= , 3
1
4,6,8,10,则平均数m= 4+6+8+10
4
=7,
1
标准差s 2 = 4 4-7 2+6-7 2+8-7 2+10-7 2
105
= 5,显然 > 5,即s >s , 3 1 2
所以x ,x ,x ,x 的标准差不小于x ,x ,⋅⋅⋅,x 的标准差,这一论断不成立,故C错误;
2 3 4 5 1 2 6
对于选项D:不妨设x ≤x ≤x ≤x ≤x ≤x ,
1 2 3 4 5 6
则x -x ≥x -x ,当且仅当x =x ,x =x 时,等号成立,故D正确;
6 1 5 2 1 2 5 6
3. AC
【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
【解析】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
4. 946
【分析】设第二季度、第三季度分别为x,y,利用平均数和中位数概念列出方程,解出即可.
【解析】GDP稳步增长说明四个季度已经从小到大排列,设第二季度、第三季度分别为x,y,所以中位数即
x+y
为 .
2
x+y
因为中位数与平均数相等,所以231+x+y+242=4× ⇒x+y=473,
2
所以2020年GDP总额:231+242+473=946.
故答案为:946.
数学试题 第 12 页 共 21 页5. CD
【分析】A、C利用两组数据的线性关系有E(y)=E(x)+c、D(y)=D(x),即可判断正误;根据中位数、极
差的定义,结合已知线性关系可判断B、D的正误.
【解析】A:E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;
B:若第一组中位数为x,则第二组的中位数为y =x +c,显然不相同,错误;
i i i
C:D(y)=D(x)+D(c)=D(x),故方差相同,正确;
D:由极差的定义知:若第一组的极差为x -x ,则第二组的极差为y -y =(x +c)-(x +
max min max min max min
c)=x -x ,故极差相同,正确;
max min
故选:CD
6. (1)z=11,s2=61;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【分析】(1)直接利用平均数公式即可计算出x,y,再得到所有的z 值,最后计算出方差即可;
i
s2
(2)根据公式计算出2 的值,和z比较大小即可.
10
545+533+551+522+575+544+541+568+596+548
【解析】(1)x= =552.3,
10
536+527+543+530+560+533+522+550+576+536
y= =541.3,
10
z=x-y=552.3-541.3=11,
z =x -y 的值分别为: 9,6,8,-8,15,11,19,18,20,12,
i i i
故s2=
(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2
10
=61
s2 s2
(2)由(1)知:z=11,z=11,2 =2 6.1= 24.4,故有z≥2 ,
10 10
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
7. (1)x=10,y=10.3,s2=0.036,s2=0.04;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
1 2
【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.
(2)根据题目所给判断依据,结合(1)的结论进行判断.
9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.7
【解析】(1)x= =10,
10
10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.5
y= =10.3,
10
0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.32
s2= =0.036,
1 10
0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.22
s2= =0.04.
2 10
0.036+0.04
(2)依题意,y-x=0.3=2×0.15=2 0.152=2 0.0225,2 =2 0.0076,
10
s2+s2
y-x≥2 1 2 ,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
10
1. C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计
算方法即可判断C;根据平均值计算公式即可判断D.
【解析】对于 A, 根据频数分布表可知, 6+12+18=36<50,
数学试题 第 13 页 共 21 页所以亩产量的中位数不小于 1050kg, 故 A 错误;
对于B,亩产量不低于1100kg的频数为24+10=34,
100-34
所以低于1100kg的稻田占比为 =66%,故B错误;
100
对于C,稻田亩产量的极差最大为1200-900=300,最小为1150-950=200,故C正确;
1
对于D,由频数分布表可得,平均值为 ×(6×925+12×975+18×1025+30×1075+24×1125+
100
10×1175)=1067,故D错误.
2. C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以
相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【解析】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作
为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%
>50%,故D正确;
该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×
0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,
故C错误.
综上,给出结论中不正确的是C.
【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率
的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平
频率
均值的估计值.注意各组的频率等于 ×组距.
组距
3. B
【分析】由频率分布直方图可得所求区间的频率,进而可以求得结果.
【解析】全球年平均气温在区间[14.55,14.75]内的频率为0.50+0.65 ×0.2=0.23,
则全球年平均气温在区间[14.35,14.75]内的有100×0.23=23年.
故选:B.
4. C
【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.
7.3+7.5
【解析】对于A选项,甲同学周课外体育运动时长的样本中位数为 =7.4,A选项结论正确.
2
对于B选项,乙同学课外体育运动时长的样本平均数为:
6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1
=8.50625>8,
16
B选项结论正确.
6
对于C选项,甲同学周课外体育运动时长大于8的概率的估计值 =0.375<0.4,
16
C选项结论错误.
13
对于D选项,乙同学周课外体育运动时长大于8的概率的估计值 =0.8125>0.6,
16
D选项结论正确.
故选:C
数学试题 第 14 页 共 21 页5. B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
70%+75%
【解析】讲座前中位数为 >70%,所以A错;
2
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的
正确率的平均数大于85%,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准
差,所以C错;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.
故选:B.
6. D
【分析】利用频率分布直方图可计算出评分在区间82,86 内的影视作品数量.
【解析】由频率分布直方图可知,评分在区间82,86 内的影视作品数量为400×0.05×4=80.
故选:D.
7. (1)47.9岁;
(2)0.89;
(3)0.0014.
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1-P(A)即可
解出;
(3)根据条件概率公式即可求出.
【解析】(1)平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023
+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)设A=“一人患这种疾病的年龄在区间[20,70)”,所以
P(A)=1-P(A)=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.
(3)设B=“任选一人年龄位于区间[40,50)”,C=“从该地区中任选一人患这种疾病”,
则由已知得:
PB =16%=0.16,PC =0.1%=0.001,P(B|C)=0.023×10=0.23,
则由条件概率公式可得
P(BC)
从该地区中任选一人,若此人的年龄位于区间[40,50),此人患这种疾病的概率为P(C|B)= =
P(B)
P(C)P(B|C) 0.001×0.23
= =0.0014375≈0.0014.
P(B) 0.16
8. D
【分析】根据T与lgP的关系图可得正确的选项.
【解析】当T=220,P=1026时,lgP>3,此时二氧化碳处于固态,故A错误.
当T=270,P=128时,23.841.
95×485×222×358
则零假设不成立,
即有95%的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.
2. (1)19.8
(2)(i)m=23.4;列联表见解析,(ii)能
【分析】(1)直接根据均值定义求解;
(2)(i)根据中位数的定义即可求得m=23.4,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【解析】(1)试验组样本平均数为:
1
(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2
20
396
+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)= =19.8
20
(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位
数据的平均数,
由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,
23.6,⋯,
故第20位为23.2,第21位数据为23.6,
23.2+23.6
所以m= =23.4,
2
故列联表为:
3.841,
20×20×20×20
所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
9
3. (1)
10
(2)有关
【分析】(1)根据古典概型的概率公式即可求出;
(2)根据独立性检验的基本思想,求出χ2,然后与小概率值α=0.001对应的临界值10.828比较,即可判
断.
180 9
【解析】(1)根据表格可知,检查结果不正常的200人中有180人患病,所以p的估计值为 = ;
200 10
(2)零假设为H :超声波检查结果与患病无关,
0
1000×20×20-780×180
根据表中数据可得,χ2=
2
=765.625>10.828=x ,
800×200×800×200 0.001
根据小概率值α=0.001的χ2独立性检验,我们推断H 不成立,即认为超声波检查结果与患该病有关,该
0
推断犯错误的概率不超过0.001.
4. (1)答案见详解
(2)答案见详解
【分析】(1)根据题中数据完善列联表,计算K2,并与临界值对比分析;
p(1-p)
(2)用频率估计概率可得p=0.64,根据题意计算p+1.65 ,结合题意分析判断.
n
【解析】(1)根据题意可得列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
15026×30-24×70
可得K2=
2 75
= =4.6875,
50×100×96×54 16
因为3.841<4.6875<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲,乙两车间产品
的优级品率存在差异.
96
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为 =0.64,
150
用频率估计概率可得p=0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
p1-p
则p+1.65
0.51-0.5
=0.5+1.65
n
0.5
≈0.5+1.65× ≈0.567,
150 12.247
p(1-p)
可知p>p+1.65 ,
n
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
12 7
5. (1)A,B两家公司长途客车准点的概率分别为 ,
13 8
(2)有
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据及公式计算K2,再利用临界值表比较即可得结论.
数学试题 第 19 页 共 21 页【解析】(1)根据表中数据,A共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
240 12
则P(M)= = ;
260 13
B共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
210 7
则P(N)= = .
240 8
12
A家公司长途客车准点的概率为 ;
13
7
B家公司长途客车准点的概率为 .
8
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500
n(ad-bc)2
K2=
(a+b)(c+d)(a+c)(b+d)
500×(240×30-210×20)2
= ≈3.205>2.706,
260×240×450×50
根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
6. (1)75%;60%;
(2)能.
【分析】根据给出公式计算即可
150
【解析】(1)甲机床生产的产品中的一级品的频率为 =75%,
200
120
乙机床生产的产品中的一级品的频率为 =60%.
200
400150×80-120×50
(2)K2=
2 400
= >10>6.635,
270×130×200×200 39
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
7. (1)答案见解析
(2)(i)证明见解析;(ii)R=6;
【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握认为
患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;
(ii)根据(i)结合已知数据求R.
n(ad-bc)2 200(40×90-60×10)2
【解析】(1)由已知K2= = =24,
(a+b)(c+d)(a+c)(b+d) 50×150×100×100
又P(K2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
P(B|A) P(B|A) P(AB) P(A) P(AB) P(A)
(2)(i)因为R= ⋅ = ⋅ ⋅ ⋅ ,
P(B|A) P(B|A) P(A) P(AB) P(A) P(AB)
数学试题 第 20 页 共 21 页
P(AB) P(B) P(AB) P(B)
所以R= ⋅ ⋅ ⋅
P(B) P(AB) P(B) P(AB)
P(A|B) P(A|B)
所以R= ⋅ ,
P(A|B) P(A|B)
(ii)
40 10
由已知P(A|B)= ,PA|B)= ,
100 100
60 90
又P(A|B)= ,PA|B)= ,
100 100
P(A|B) P(A|B)
所以R= ⋅ =6
P(A|B) P(A|B)
数学试题 第 21 页 共 21 页