文档内容
01 卷 第九章 统计与统计案例《过关检测卷》
-2022 年高考一轮数学单元复习(新高考专用)
第I卷(选择题)
一、单选题
1.(2021·重庆巴蜀中学高三月考)城市道路由于通勤造成道路交通的早晚高峰.一
般地,工作日早高峰时段通常在7:00-9:00,晚高峰时段通常在17:00-19:00.
为了衡量某路段在某一段时间内的拥堵程度,通常采用的指标之一是路段的汽车平均
行程速度,即在该时间段通过该路段的汽车的平均速度.路段通常可分为快速路、主
干路、次干路、支路,根据不同路段与汽车平均行程速度,可将拥堵程度分为1到5
级.等级划分如表(单位:km/h):
等级
1 2 3 4 5
快速路 >65 ≤20
主干路 >45 ≤15
次干路 >35 ≤10
支路 >35 ≤10
重庆市的黄花园大桥横跨嘉陵江之上,是连接渝中区和江北区的主干路.今在某高峰
时段监测黄花园大桥的汽车平均行程速度,将得到的数据绘制成频率分布直方图如图,
根据统计学知识估计该时段黄花园大桥拥堵程度的等级为( )
A.2级 B.3级 C.4级 D.5级
2.(2021·江苏泰州市·泰州中学高一期末)在一组样本数据中,1,3,5,7出现的频
率分别为p,p,p,p 且 ,若这组数据的中位数为6,则p=( )
1 2 3 4 4A.0.5 B.0.4 C.0.2 D.0.1
3.(2021·湖南长沙市·长郡中学高二期末)已知数据 的方差为 4
, 若 , 则新数据 的方差为
( )
A.2 B.4 C.8 D.16
4.(2021·上海市大同中学高二期末)在发生某公共卫生事件期间,有专业机构认为
该事件在一段时间没有发生规模群体感染的标志为“连续 天,每天新增疑似病例不
超过 人”,根据过去 天甲、乙、丙、丁四地新增病例数据,一定符合该标志的是
( )
A.甲地:总体均值为 ,总体方差为 B.乙地:总体均值为 ,中位数为
C.丙地:总体均值为 ,总体方差大于 D.中位数为 ,总体方差为
5.(2021·宁夏长庆高级中学高二期末(理))通过随机询问110名不同的我校学生
是否爱好某项运动,得到如下的列联表:经计算 的观测值 .参照附表,得
到的正确结论是( )
附表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
0.050 0.010 0.001
3.841 6.635 10.828
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
6.(2021·福建泉州市·泉州五中高二期末)第24届冬季奥林匹克运动会将于2022年
在北京举办,为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行
调查统计得到如下2×2列联表
男 女 合计
关注冰雪运动 35 25 60
不关注冰雪运动 15 25 40
合计 50 50 100
根据列联表可知( )
参考公式: ,其中 .
附表:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.该市女性居民中大约有5%的人关注冰雪运动
B.该市男性届民中大约有95%的人关注冰雪运动
C.有95%的把握认为该市居民是否关注冰雪运动与性别有关
D.有99%的把握认为该市居民是否关注冰雪运动与性别无关
7.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是(
)
A.回归直线过样本点的中心
B.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高
C.线性回归方程对应的直线 至少经过其样本数据点 , ,
…, 中的一个点
D.在回归分析中, 的模型比 的模型拟合的效果好
二、多选题
8.(2021·江苏省锡山高级中学高二期末)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似
病例不超过7人”过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:中位数为2,极差为5;
乙地:总体平均数为2,众数为2;
丙地:总体平均数为1,总体方差大于0;
丁地:总体平均数为2,总体方差为3.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的有( )
A.甲地 B.乙地 C.丙地 D.丁地
9.(2021·湖南长沙一中高一月考)从某小学随机抽取100名学生,将他们的身高
(单位:厘米)按照区间 , 进行分组,
得到频率分布直方图(如图),下列说法正确的有()
A.若要从身高在 三组内的学生中.用等比例分层抽样
的方法选取18人参加一项活动.则从身高在 内的学生中应选取3人;
B.估计这100名学生的平均身高是 厘米)
C.估计这100名学生的第80百分位数为 厘米)
D.估计这100名学生的众数是 厘米)
10.(2021·海南华侨中学高一期末)若一组数据: 的平均值为2,方差
为3,则关于数据 说法正确的是( )
A.平均值为-2 B.方差为6 C.平均值为4 D.方差为12
11.(2021·重庆西南大学附中高一期末)在一次测验中共有500名同学参赛,经过评判,这500名考生的得分都在 之间,其得分的频率分布直方图如图,则下列结
论正确的是( )
A.可求得
B.这500名参赛者得分的平均数为65
C.得分在 之间的频率为
D.得分在 之间的共有200人
12.(2021·广东高二期中)下列说法正确的是( )
A.对于独立性检验,随机变量 的观测值 值越小,判定“两变量有关系”犯错误
的概率越小
B.在回归分析中,相关指数 越大,说明回归模型拟合的效果越好
C.随机变量 ,若 , ,则
D.甲、乙、丙、丁 个人到 个景点旅游,每人只去一个景点且每个景点都有人去,
设事件 为“ 个人去的景点各不相同”,事件 为“甲不去其中的 景点”,则
13.(2021·辽宁大连二十四中高二期中)针对当下的“抖音热”,某校团委对“学生
性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 ,女生喜欢抖音的人数占女生人数的 ,若有 的把握
认为是否喜欢抖音和性别有关,则调查人数中男生有可能( )
附:
A. B. C. D.
14.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点
及其线性回归方程 ,下列说法正确的有
( )
A.相关系数r的绝对值 越接近0,表示x,y的线性相关程度越强
B.相关系数r的绝对值 越接近1,表示x,y的线性相关程度越强
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若 ,则点 一定在线性回归方程 上
15.(2021·河南高二期中(文))某校为了解学生对餐厅食品质量的态度(满意或不满
意),对在餐厅就餐的学生随机做了一次调查,其中被调查的男、女生人数相同,有
的男生态度是“不满意”,有 的女生态度是“不满意”,若有99%的把握认为男生
和女生对餐厅食品质量的态度有差异,则调查的总人数可能为( )
,其中 .临界值表:
( ) 0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.120 B.160 C.240 D.360
第II卷(非选择题)
请点击修改第II卷的文字说明
三、填空题
16.(2021·重庆高二期末)某同学对变量 进行回归分析时收集了几组观测数据如
表所示,
1 2 3 4
但他不小心丟失了一个数据(用 代替),在数据丢失之前该同学根据散点图判断出
与 线性相关,并计算出线性回归方程为 ,则 的值为___________.
17.(2021·焦作市第一中学高一期末)某单位年龄(单位:岁)在 的员工有
40人,年龄在 的员工有60人,年龄在 的员工有20人.现准备用分层
抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,
年龄小于50岁的员工人数为______.
18.(2021·哈尔滨工业大学附属中学校高一期末)某学校为了调查高一年级学生的体
育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻
炼时间(单位: ),数据如下,
甲 6 6.5 7 7.5 8
乙 6 7 8 9 10 11 12
丙 3 4.5 6 7.5 9 10.5 12 13.5
估计这个学校高一年级学生一周的平均锻炼时间___________
19.(2021·重庆江北区·字水中学高二期末)某工厂为研究某种产品的产量 (吨)与
所需某种原材料的质量 (吨)的相关性,在生产过程中收集4组对应数据 ,如下表所示.(残差=观测值-预测值)
3 4 5 6
2.5 3 4
根据表中数据,得出 关于 的经验回归方程为 .据此计算出在样本
处的残差为 ,则表中 的值为______.
20.(2021·河南高二期中(文))某企业计划通过广告宣传来提高销售额,经统计,
产品的广告费 (单位:百万元)与销售额 (单位:百万元)之间有如下对应数据:
0 1 2 3 4
14.8 30.4 36.2 39.6 51
由表中的数据得线性回归方程为 .投入的广告费 时,销售额的预报
值为______百万元.
21.(2021·天津西青区·高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数 的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程 中,当解释变量x每增加1个单位时,相应变量 平
均增加 个单位;
④某人研究儿子身高 与父亲身高 的关系,得到经验回归方程
,当 时, ,即:如果一个父亲的身高为
,则儿子的升高一定为 .
则以上结论中正确的序号为__________.
22.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)某公交公司推出扫
码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:
第 天 1 2 3 4 5
使用人数( ) 15 173 457 842 1333由表中数据可得y关于x的回归方程为 ,则据此回归模型相应于点(2,
173)的残差为________.
四、双空题
23.(2021·上海市实验学校高二期末)如果数据 、 、 、 的平均值为10,方
差为3,则 、 、 、 的平均值为______,方差为______.
24.(2021·绥化市第二中学高一期末)数据 的平均数为2,方差为3,则
数据 的平均数为__________;方差为__________.
25.(2021·湖北高二学业考试)某校足球俱乐部有男运动员60人,女运动员40人,
为了了解运动员的身体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的
样本,则应抽取的(1)男运动员人数为_______;(2)女运动员人数为_______.
26.(9.2.1总体取值规律的估计(分层练习)-2020-2021学年高一数学新教材配套练
习(人教A版2019必修第二册))一个容量为n的样本,分成若干组,已知甲组的频
数和频率分别为36和 ,则容量n=____,频率为 的乙组的频数x=____.
27.(2021·天津高二期末)生活经验告诉我们,儿子的身高与父亲的身高具有较强的
正相关性,某体育老师调查了大学三年级某班所有男生的身高和父亲的身高(单位:
),利用最小二乘法计算出 , ,则儿子的身高y与父亲的身高 的
线性回归方程是___________,据此估计其它班级,如果父亲的身高增加10 ,儿子
的身高平均增加___________ .
28.(2021·天津高一期末)某市供电部门为了解节能减排以来本市居民的用电量情况,
通过抽样,获得了1000户居民月平均用电量(单位:度),将数据按照[50,100),
[100,150),…,[300,350]分成六组,制成了如图所示的频率分布直方图.则频率分布
直方图中 的值为___________;根据频率分布直方图近似估计抽取的这1000户居民
月用电量的中位数为___________.(精确到0.1)29.(2021·北京高二期末)判断对错,并在相应横线处划“√”或“×”.①样本相关系
数 时,称成对数据正相关, 时,称成对数据负相关___________.②样本相
关系数的绝对值 越接近于1,线性相关程度越弱, 越接近于0,线性相关程度越
强___________.
30.(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23
时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品
的上升器送入到预定环月轨道,这是我国首次实现月球无人采样和地外天体起飞,对
我国航天事业具有重大而深远的影响,为进一步培养中学生对航空航天的兴趣爱好,
某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3
人,第2天6人,第3天10人,第4天13人,第5天18人,通过数据分析已知,报
名人数与报名时间具有线性相关关系.已知第 天的报名人数为 ,则 关于 的线
性回归方程为___________,该社团为了解中学生对航空航天的兴趣爱好和性别是否有
关系,随机调查了100名学生,并得到如下 列联表:
有兴趣 无兴趣 合计
男生 45 5 50
女生 30 20 50
合计 75 25 100
请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱
好和性别_______(填“有”或”无”)关系
参考公式及数据:回归方程 中斜率的最小二乘估计公式为:, ;
,其中 .
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
31.(2021·浙江高二课时练习)某学生对其30名亲属的饮食习惯进行了一次调查,
依据统计所得数据可得到如下的 列联表:
喜欢吃蔬菜 喜欢吃肉类 总计
50岁以下 8
50岁以上 16 2 18
总计 30
根据以上列联表中的数据,可得 的观测值 __________,__________(填“有”
或“没有”) 的把握认为其亲属的饮食习惯与年龄有关.
参考公式: ,其中 .
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
32.(2018·北京全国·高二单元测试(理))关于 与 ,有如下数据有如下的两个模
型:(1) ;(2) .通过残差分析发现第(1)个线性模型比第
(2)个拟合效果好,则 ________ , ______ (用大于,小于号填空,
是相关指数和残差平方和)2 4 5 6 8
30 40 60 50 70
五、解答题
33.(2021·北京市第十二中学高一期末)某公司为了解用户对其产品的满意程度,采
用分层抽样的方法从A,B两个地区共抽取了500名用户,请用户根据满意程度对该公
司品评分,该公司将收集到的数据按照 , , , 分组,
绘制成评分频率分布直方图如下:
已知A地区用户约为40000人,B地区用户约为10000人.
(1)求该公司采用分层抽样的方法从A,B两个地区分别抽取的用户人数;(2)根据频率分布直分图,估计B地区所有用户中,对该产品评分不低于80分的用
户的人数;
(3)根据频率分布直方图,估计A地区抽取的400名用户对该公司产品的评分的平均
值为 ,B地区抽取的100名用户对该公司产品的评分的平均值为 ,以及A,B两
个地区抽取的500名用户对该公司产品的评分的平均值为 ,试比较 和 的
大小.(结论不要求证明)
34.(2021·绥化市第二中学高一期末)某部门计划对某路段进行限速,为调查限速
是否合理,对通过该路段的500辆汽车的车速进行检测,将所得数据按
分组,绘制成如图所示的频率分布直方图.
(1)求直方图中 的值及车速落在 的汽车数;
(2)求这500辆汽车车速的平均数、中位数和众数.
35.(云南省部分名校2020-2021学年高二下学期期末联考数学(文)试题)某重点
中学调查了100位学生在市统考中的理科综合分数,以 , ,
, , , , 分组的频率分布直方
图如图.将理科综合分数不低于240分的学生称为成绩“优秀”
(1)估计某学生的成绩为“优秀”的概率;
(2)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为成
绩“优秀”与性别有关.
成绩“非优秀” 成绩“优秀” 合计
男
女 15 45
合计
附: , .
0.050 0.010 0.001
k 3.841 6.635 10.828
36.(2021·黎川县第一中学高二期末(文))某网站的调查显示,健身操类、跑步类、
拉伸运动类等健身项目在大众健康项目中比较火热,但是大多数人对健身科学类的知
识相对缺乏,尤其是健身指导方面.现从某健身房随机抽取 名会员,其中男生有
人,对其平均每天健身的时间进行调查,并根据日均健身时间分为 ,
, , , 五组,得到如图所示的男生日均健身时间频
数表与女生日均健身时间频率分布直方图.规定日均健身时间不少于 分钟的人为
“喜欢健身”.
男生日均健身时间频数表:
日均健身时间(分钟)
人数
女生日均健身时间频率分布直方图:(1)请完成下面的 列联表.
喜欢健身 不喜欢健身 总计
男生
女生
总计
根据以上的 列联表,能否有 的把握认为喜欢健身与性别有关?
(2)现从日均健身时间在 的学员中选取 人进行表彰,求选取的 人中至少
有 名男生的概率.
附: ,其中 .
0.05 0.025 0.01 0.005
3.841 5.024 6.635 7.829
37.(2021·河南新乡县一中高二期末(文))华为 系统是一款面向未
来、面向全场景的分布式操作系统,预计该系统将会成为继 、 系统之后的
全球第三大手机操作系统.为了了解手机用户对 系统的期待程度,某公司
随机在20000人中抽取了100名被调查者,记录他们的期待值,将数据分成 ,
,…, 6组,其中期待值不低于60的称为非常期待 系统,
现整理数据得到如下频率分布直方图.(1)已知样本中期待值小于15的有4人,试估计总体中期待值在区间[15,30)内的人
数;
(2)已知样本中的男生有一半非常期待 系统,且样本中非常期待
系统的男、女生人数相等.请根据所提供的数据,完成下面的 列联表,
并判断是否有99%的把握认为是否非常期待 系统与性别有关.
非常期待 不非常期待 合计
男
女
合计 100
附: ,其中 .
38.(2021·安徽黄山市·屯溪一中高二期末(文))黄山市一直践行“节能环保、绿色
出行”的基本理念,现越来越多的市民购置新能源电动车替代传统的燃油汽车.如表
是近五年我市新能源电动车的年销量与年份的统计表(其中第1年表示2016年,第2
年表示2017年,依此类推).
第x年 1 2 3 4 5
年销售量y(万台) 5 8 14 22 31
高二(1)班家委会组织了一次本班家庭购车调查,调查对象与内容近五年购车的20个家庭及购车的类型,得到的部分数据如表 列联表.
购置传统燃油汽车 购置新能源电动车 总计
车主为父亲 3
车主为母亲 2 6
总计 20
(1)求新能源电动车的年销售量y关于x的线性相关系数r,并判断y与x是否线性相
关?若是,预测2021年新能源电动车的年销售量;若不是,请说明理由;
(2)完成 列联表,并判断是否有 的把握认为购车车主是否购置新能源电动
车与性别有关?
参考公式: ,若 ,可判断y与x线性相关.
, ,
,其中 .
临界值表供参考:
参考数据:
66 450 2.236 2.449
39.(2021·江西景德镇一中高二期末(文))为调查某地区老年人是否需要志愿者提
供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别 男 女是否需要志愿者
需要 30 50
不需要 270 150
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
附:
( ) 0.050 0.010 0.001
3.841 6.635 10.828
40.(2021·四川省成都市玉林中学高二(文))某企业在开展“质量安全周”活动中,
某种产品被检测出其中一项质量指标存在问题,该企业对甲、乙两条流水线生产该产
品情况进行统计,表1是甲流水线样本的频数分布表,如图是乙流水线样本的频率分
布直方图.表1
质量指标数 频数
10
9
18
7
6
(1)某个月内甲、乙两条流水线各生产了3500件和1500件产品,现按照分层抽样的
方法,从中抽出100件产品进行检测,问甲、乙两条生产线各抽出多少件产品?(2)随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们
的这一项质量指标值.若该项质量指标值落在 内,则为合格品,否则为不合
格品.根据已知条件完成表2的 列联表,并回答能否有85%的把握认为“该企业生
产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?
表2
甲流水线 乙流水线 合计
合格品
不合格品
合计
附: (其中 ).
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
41.(2021·重庆一中高二期中)垃圾是人类日常生活和生产中产生的废弃物,由于排
出量大,成分复杂多样,且具有污染性,所以需要无害化减量化处理.某市为调查产生
的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据
,其中 和 分别表示第 个县城的人口(单位:万人)和该
县年垃圾产生总量(单位:吨),并计算得
.
(1)请用相关系数 说明该组数据中 与 之间的关系可用线性回归模型进行拟合;
(当 时,认为两变量的线性相关性很强)
(2)求 关于 的线性回归方程,并用所求回归方程预测该市100万人口的县城年垃
圾产生总量约为多少吨?参考公式:相关系数 ,对于一组具有线性相关关系的数
据 ,其回归直线 的斜率和截距的最小二乘法估计分
别为 .