文档内容
专题 18 统计与统计案例 5 种常见考法归类
知识 五年考情(2021-2025) 命题趋势
考点01众数、中位数、平均数及方差的计算 1.统计基础计算稳定出现
2025·全国二卷 2023·新课标Ⅰ卷 2023·上海 众数、中位数、平均数及方差的
2023·全国乙卷2021·新高考全国Ⅰ卷2021·新高 计算在近 5 年多次出现,且常结
知识1 统计 考全国Ⅱ卷 2021·全国乙卷 合实际数据场景考查,强调对数
(5年5考) 考点02统计图表及其应用 据特征的基本理解与运算能力。
这类题目注重与生活实际结合,
2024·新课标Ⅱ卷2022·新高考全国Ⅱ卷
体现统计知识的实用性,是基础
2022·全国甲卷 2022·全国乙卷2022·天津2022·
得分点,未来仍将保持稳定的考
北京2021·全国甲卷 2021·天津
查频率。
考点03相关系数
2.统计图表应用贯穿始终
2025·天津2024·上海2024·天津2023·上海2023·
统计图表(如柱状图、折线图、
天津
频率分布直方图等)的解读与应
考点04回归经验方程 用在近 5 年高频出现,题目往往
2025·上海 2022·全国乙卷 要求从图表中提取信息、计算数
据特征或进行简单推断。随着数
据分析能力在高考中的重视程度
提升,此类考点会继续强化,且
可能增加图表的综合性(如多种
图表结合)。
3.相关系数近 5 年在天津、上海
知识2 统计案 等地试卷中频繁考查,侧重通过
例 相关系数判断变量相关性的强
(5年5考) 弱,强调对统计量意义的理解而
考点05独立性检验
非单纯计算。
2025·全国一卷2024·全国甲卷2024·上海 2023·
4.回归经验方程虽考查次数相对较
全国甲卷 2022·全国甲卷
少,但常结合实际问题(如经
2022·新高考全国Ⅰ卷2021·全国甲卷
济、环境、医学等),要求建立
回归模型并进行预测,体现统计
的决策功能,未来可能增加非线
性回归的转化考查(如对数、指
数回归)。
5.独立性检验是近 5 年考查频率
最高的统计案例考点,题目多以
2×2 列联表为载体,要求计算卡
方值、判断相关性,并结合实际问题进行推断。此类题目注重逻
辑推理与实际意义结合,未来可
能会在背景设计上更贴近社会热
考点01众数、中位数、平均数及方差的计算
1.(2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
【答案】C
【分析】由平均数的计算公式即可求解.
【详解】样本数据 的平均数为 .
故选:C.
2.【多选】(2023·新课标Ⅰ卷·高考真题)有一组样本数据 ,其中 是最小值, 是最大值,
则( )
A. 的平均数等于 的平均数
B. 的中位数等于 的中位数
C. 的标准差不小于 的标准差
D. 的极差不大于 的极差
【答案】BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设 的平均数为 , 的平均数为 ,
则 ,
因为没有确定 的大小关系,所以无法判断 的大小,
例如: ,可得 ;
例如 ,可得 ;
例如 ,可得 ;故A错误;
对于选项B:不妨设 ,可知 的中位数等于 的中位数均为 ,故B正确;
对于选项C:举反例说明,例如: ,则平均数 ,
标准差 ,
,则平均数 ,
标准差 ,显然 ,即 ,
所以 的标准差不小于 的标准差,这一论断不成立,故C错误;
对于选项D:不妨设 ,
则 ,当且仅当 时,等号成立,故D正确;
故选:BD.
3.【多选】(2021·新高考全国Ⅱ卷·高考真题)下列统计量中,能度量样本 的离散程度的是
( )
A.样本 的标准差 B.样本 的中位数
C.样本 的极差 D.样本 的平均数
【答案】AC
【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
4.(2023·上海·高考真题)国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,
某市在2020年间经济高质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个
季度GDP的中位数与平均数相等,则2020年GDP总额为 ;
【答案】946
【分析】设第二季度、第三季度分别为 ,利用平均数和中位数概念列出方程,解出即可.
【详解】GDP稳步增长说明四个季度已经从小到大排列,设第二季度、第三季度分别为 ,所以中位数
即为 .
因为中位数与平均数相等,所以 ,所以2020年GDP总额: .
故答案为:946.
5.【多选】(2021·新高考全国Ⅰ卷·高考真题)有一组样本数据 , ,…, ,由这组数据得到新样本
数据 , ,…, ,其中 ( 为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【分析】A、C利用两组数据的线性关系有 、 ,即可判断正误;根据中位数、极
差的定义,结合已知线性关系可判断B、D的正误.
【详解】A: 且 ,故平均数不相同,错误;
B:若第一组中位数为 ,则第二组的中位数为 ,显然不相同,错误;
C: ,故方差相同,正确;
D:由极差的定义知:若第一组的极差为 ,则第二组的极差为
,故极差相同,正确;
故选:CD
6.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对
试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处
理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为 ,
.试验结果如下:
试验序号
1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记 ,记 的样本平均数为 ,样本方差为 .
(1)求 , ;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果
,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否
则不认为有显著提高)【答案】(1) , ;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【分析】(1)直接利用平均数公式即可计算出 ,再得到所有的 值,最后计算出方差即可;
(2)根据公式计算出 的值,和 比较大小即可.
【详解】(1) ,
,
,
的值分别为: ,
故
(2)由(1)知: , ,故有 ,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
7.(2021·全国乙卷·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标
有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为 和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 ,则认为新
设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1) ;(2)新设备生产产品的该项指标的均值较旧设备有显
著提高.
【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.
(2)根据题目所给判断依据,结合(1)的结论进行判断.
【详解】(1) ,
,,
.
(2)依题意, , ,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
考点02统计图表及其应用
8.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各
块稻田的亩产量(单位:kg)并整理如下表
亩产 [900, [950, [1000, [1050, [1100, [1150,
量 950) 1000) 1050) 1100) 1150) 1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计
算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于 的频数为 ,
所以低于 的稻田占比为 ,故B错误;
对于C,稻田亩产量的极差最大为 ,最小为 ,故C正确;
对于D,由频数分布表可得,平均值为
,故D错误.
故选;C.
9.(2021·全国甲卷·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户
家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应
的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可
作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为 ,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为 ,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为 ,
故D正确;
该地农户家庭年收入的平均值的估计值为
(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率
的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均
值的估计值.注意各组的频率等于 .
10.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位: ),共100个数据,分成6
组: ,并整理得到如下的频
率分布直方图,则全球年平均气温在区间 内的有( )A.22年 B.23年 C.25年 D.35年
【答案】B
【分析】由频率分布直方图可得所求区间的频率,进而可以求得结果.
【详解】全球年平均气温在区间 内的频率为 ,
则全球年平均气温在区间 内的有 年.
故选:B.
11.(2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:
h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
【答案】C
【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.
【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为 ,A选项结论正确.
对于B选项,乙同学课外体育运动时长的样本平均数为:
,
B选项结论正确.对于C选项,甲同学周课外体育运动时长大于 的概率的估计值 ,
C选项结论错误.
对于D选项,乙同学周课外体育运动时长大于 的概率的估计值 ,
D选项结论正确.
故选:C
12.(2022·全国甲卷·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,
随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲
座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为 ,所以 错;
讲座后问卷答题的正确率只有一个是 个 ,剩下全部大于等于 ,所以讲座后问卷答题的正确率
的平均数大于 ,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所
以C错;
讲座后问卷答题的正确率的极差为 ,
讲座前问卷答题的正确率的极差为 ,所以 错.故选:B.
13.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取 部,统计其评分数据,将所得 个
评分数据分为 组: 、 、 、 ,并整理得到如下的频率分布直方图,则评分在区间
内的影视作品数量是( )
A. B. C. D.
【答案】D
【分析】利用频率分布直方图可计算出评分在区间 内的影视作品数量.
【详解】由频率分布直方图可知,评分在区间 内的影视作品数量为 .
故选:D.
14.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的
年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间 的概率;
(3)已知该地区这种疾病的患病率为 ,该地区年龄位于区间 的人口占该地区总人口的 .从该地区中任选一人,若此人的年龄位于区间 ,求此人患这种疾病的概率.(以样本数据中患者的年龄
位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1) 岁;
(2) ;
(3) .
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设 {一人患这种疾病的年龄在区间 },根据对立事件的概率公式 即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设 “一人患这种疾病的年龄在区间 ”,所以
.
(3)设 “任选一人年龄位于区间[40,50)”, “从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间 ,此人患这种疾病的概率为
.
15.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直
冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和 的关系,
其中T表示温度,单位是K;P表示压强,单位是 .下列结论中正确的是( )
A.当 , 时,二氧化碳处于液态
B.当 , 时,二氧化碳处于气态
C.当 , 时,二氧化碳处于超临界状态D.当 , 时,二氧化碳处于超临界状态
【答案】D
【分析】根据 与 的关系图可得正确的选项.
【详解】当 , 时, ,此时二氧化碳处于固态,故A错误.
当 , 时, ,此时二氧化碳处于液态,故B错误.
当 , 时, 与4非常接近,故此时二氧化碳处于固态,对应的是非超临界状态,故C错
误.
当 , 时,因 , 故此时二氧化碳处于超临界状态,故D正确.
故选:D
考点03相关系数
16.(2023·上海·高考真题)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关
D.身高与体重成负相关
【答案】C
【分析】根据给定的散点图的特征,直接判断作答.
【详解】由于身高比较高的人,其体重可能大,也可能小,则选项AB不正确;
由散点图知,身高和体重有明显的相关性,且身高增加时,体重也呈现增加的趋势,
所以身高与体重呈正相关,C正确,D错误.
故选:C
17.(2025·天津·高考真题)下列说法中错误的是( )
A.若 ,则
B.若 , ,则
C. 越接近1,相关性越强
D. 越接近0,相关性越弱【答案】B
【分析】根据正态分布以及相关系数的概念直接判断即可.
【详解】对于A,根据正态分布对称性可知, ,A说法正确;
对于B,根据正态分布对称性可知, ,B说法错误;
对于C和D,相关系数 越接近0,相关性越弱,越接近1,相关性越强,故C和D说法正确.
故选:B
18.(2024·上海·高考真题)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是
( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】C
【分析】根据相关系数的性质可得正确的选项.
【详解】对于AB,当气候温度高,海水表层温度变高变低不确定,故AB错误.
对于CD,因为相关系数为正,故随着气候温度由低到高时,海水表层温度呈上升趋势,
故C正确,D错误.
故选:C.
19.(2024·天津·高考真题)下列图中,线性相关性系数最大的是( )
A. B.
C. D.
【答案】A
【分析】由点的分布特征可直接判断
【详解】观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较
好,呈现明显的正相关, 值相比于其他3图更接近1.故选:A
20.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾
花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长
度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为 ,利用最小二乘法
求得相应的经验回归方程为 ,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
【答案】C
【分析】根据散点图的特点及经验回归方程可判断ABC选项,根据相关系数的定义可以判断D选项.
【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,
把 代入 可得 ,C选项正确;
由于 是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据
的相关系数不一定是 ,D选项错误
故选:C
考点04回归经验方程
21.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子 米混合泳接力金牌.以下是历届
奥运会男子 米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78 207.46 207.95 209.34 209.35
210.68 213.73 214.84 216.93 216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为 ,年份x的平均数为2006,预测2028年冠军队的
成绩(精确到0.01秒).【答案】(1) ; ;
(2)
(3)
【分析】(1)由最长与最短用时可得极差,由中间两数平均数可得中位数;
(2)由古典概型概率公式可得;
(3)先求成绩平均数 ,再由 在回归直线上,代入方程可得 ,再代入年份预测可得.
【详解】(1)由题意,数据的最大值为 ,最小值为 ,
则极差为 ;
数据中间两数为 与 ,
则中位数为 .
故极差为 ,中位数为 ;
(2)由题意,数据共 个, 以上数据共有 个,
故设事件 “恰有 个数据在 以上”,
则 ,
故恰有 个数据在 以上的概率为 ;
(3)由题意,成绩的平均数
,
由直线 过 ,
则 ,
故回归直线方程为 .
当 时, .
故预测 年冠军队的成绩为 秒.
22.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区
某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量
(单位: ),得到如下数据:
总
样本号i 1 2 3 4 5 6 7 8 9 10
和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已
知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数 .
【答案】(1) ;
(2)
(3)
【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木
平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估
计值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为 ,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为 ,
又已知树木的材积量与其根部横截面积近似成正比,可得 ,解之得 .
则该林区这种树木的总材积量估计为
考点05独立性检验
23.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学
生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
(3)是否有 的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
(附: 其中 , .)
【答案】(1)
(2)
(3)有
【分析】(1)求出相关占比,乘以总人数即可;
(2)根据平均数的计算公式即可得到答案;
(3)作出列联表,再提出零假设,计算卡方值和临界值比较大小即可得到结论.
【详解】(1)由表可知锻炼时长不少于1小时的人数为占比 ,
则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为 .
(2)估计该地区初中生的日均体育锻炼时长约为
.
则估计该地区初中学生日均体育锻炼的时长为0.9小时.
(3)由题列联表如下:
其他 合计
优秀 45 50 95
不优秀 177 308 485合计 222 358 580
提出零假设 :该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.
其中 .
.
则零假设不成立,
即有 的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.
24.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将
其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小
白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,
完成如下列联表
对照
组
试验
组
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增
加量有差异?
附: ,
0.100 0.050 0.010
2.706 3.841 6.635
【答案】(1)
(2)(i) ;列联表见解析,(ii)能
【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得 ,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【详解】(1)试验组样本平均数为:
(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21
位数据的平均数,
由原数据可得第11位数据为 ,后续依次为 ,
故第20位为 ,第21位数据为 ,
所以 ,
故列联表为:
合计
对照组 6 14 20
试验组 14 6 20
合计 20 20 40
(ii)由(i)可得, ,
所以能有 的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
25.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随
机调查了1000人,得到如下列联表:
超声波检查结果组别 正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1000
(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;
(2)根据小概率值 的独立性检验,分析超声波检查结果是否与患该疾病有关.
附 ,
0.050 0.010 0.0013.841 6.635 10.828
【答案】(1)
(2)有关
【分析】(1)根据古典概型的概率公式即可求出;
(2)根据独立性检验的基本思想,求出 ,然后与小概率值 对应的临界值 比较,即可判断.
【详解】(1)根据表格可知,检查结果不正常的 人中有 人患病,所以 的估计值为 ;
(2)零假设为 :超声波检查结果与患病无关,
根据表中数据可得, ,
根据小概率值 的 独立性检验,我们推断 不成立,即认为超声波检查结果与患该病有关,该
推断犯错误的概率不超过 .
26.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个
车间的产品中随机抽取150件进行检验,数据如下:
优级 合格 不合格 总
品 品 品 计
甲车
26 24 0 50
间
乙车
70 28 2 100
间
总计 96 52 2 150
(1)填写如下列联表:
优级 非优级
品 品
甲车
间
乙车
间
能否有 的把握认为甲、乙两车间产品的优级品率存在差异?能否有 的把握认为甲,乙两车间产品
的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率 ,设 为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生
产线智能化升级改造后,该工厂产品的优级品率提高了?( )
附:
0.05 0.01
0.001
0 0
3.84 6.63 10.82
k
1 5 8
【答案】(1)答案见详解
(2)答案见详解
【分析】(1)根据题中数据完善列联表,计算 ,并与临界值对比分析;
(2)用频率估计概率可得 ,根据题意计算 ,结合题意分析判断.
【详解】(1)根据题意可得列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得 ,
因为 ,
所以有 的把握认为甲、乙两车间产品的优级品率存在差异,没有 的把握认为甲,乙两车间产品的
优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为 ,
用频率估计概率可得 ,
又因为升级改造前该工厂产品的优级品率 ,
则 ,
可知 ,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
27.(2022·全国甲卷·高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附: ,
0.100 0.050 0.010
2.706 3.841 6.635
【答案】(1)A,B两家公司长途客车准点的概率分别为 ,
(2)有
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据及公式计算 ,再利用临界值表比较即可得结论.
【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
则 ;
B共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
则 .
A家公司长途客车准点的概率为 ;
B家公司长途客车准点的概率为 .
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500= ,
根据临界值表可知,有 的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
28.(2021·全国甲卷·高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了
比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)75%;60%;
(2)能.
【分析】根据给出公式计算即可
【详解】(1)甲机床生产的产品中的一级品的频率为 ,
乙机床生产的产品中的一级品的频率为 .
(2) ,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
29.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯
(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),
同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良
良好
好病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该
疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标
为R.
(ⅰ)证明: ;
(ⅱ)利用该调查数据,给出 的估计值,并利用(ⅰ)的结果给出R的估计值.
附 ,
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii) ;
【分析】(1)由所给数据结合公式求出 的值,将其与临界值比较大小,由此确定是否有99%的把握认为
患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)
根据(i)结合已知数据求 .
【详解】(1)由已知 ,
又 , ,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为 ,
所以
所以 ,
(ii)
由已知 , ,
又 , ,所以