文档内容
01 卷 第九章 统计与统计案例《过关检测卷》
-2022 年高考一轮数学单元复习(新高考专用)
第I卷(选择题)
一、单选题
1.(2021·重庆巴蜀中学高三月考)城市道路由于通勤造成道路交通的早晚高峰.一般地,工作日早高峰
时段通常在7:00-9:00,晚高峰时段通常在17:00-19:00.为了衡量某路段在某一段时间内的拥堵程
度,通常采用的指标之一是路段的汽车平均行程速度,即在该时间段通过该路段的汽车的平均速度.路段
通常可分为快速路、主干路、次干路、支路,根据不同路段与汽车平均行程速度,可将拥堵程度分为1到
5级.等级划分如表(单位:km/h):
等级
1 2 3 4 5
快速路 >65 ≤20
主干路 >45 ≤15
次干路 >35 ≤10
支路 >35 ≤10
重庆市的黄花园大桥横跨嘉陵江之上,是连接渝中区和江北区的主干路.今在某高峰时段监测黄花园大桥
的汽车平均行程速度,将得到的数据绘制成频率分布直方图如图,根据统计学知识估计该时段黄花园大桥
拥堵程度的等级为( )
A.2级 B.3级 C.4级 D.5级
【答案】B
【分析】
结合频率分布直方图求出平均速度,然后根据表格中的信息即可得出结论.【详解】
解:由题意可知,组距为10,共6组,
由六个矩形面积之和为1,可得速度在[50,60]内的频率为0.05,
因此平均速度为5×0.1+15×0.15+25×0.2+35×0.3+45×0.2+55×0.05=30(km/h),
根据表格中的信息可知,其拥堵等级为3.
故选:B.
2.(2021·江苏泰州市·泰州中学高一期末)在一组样本数据中,1,3,5,7出现的频率分别为p,p,
1 2
p,p 且 ,若这组数据的中位数为6,则p=( )
3 4 4
A.0.5 B.0.4 C.0.2 D.0.1
【答案】A
【分析】
由样本数据中只有1,3,5,7,没有6知样本数据一共有偶数个数,且从小到大排序后中间两个数为5,
7,从而求得.
【详解】
∵样本数据中只有1,3,5,7,没有6,
∴样本数据一共有偶数个数,且从小到大排序后中间两个数为5,7,
∴样本数据中有一半是7,∴p=0.5,
4
故选:A.
3.(2021·湖南长沙市·长郡中学高二期末)已知数据 的方差为 4 , 若
, 则新数据 的方差为( )
A.2 B.4 C.8 D.16
【答案】D
【分析】
利用方差的定义求解即可
【详解】
解:由题意可得 ,因为 ,所以 ,
所以新数据 的方差为
,
故选:D
4.(2021·上海市大同中学高二期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没
有发生规模群体感染的标志为“连续 天,每天新增疑似病例不超过 人”,根据过去 天甲、乙、丙、
丁四地新增病例数据,一定符合该标志的是( )
A.甲地:总体均值为 ,总体方差为 B.乙地:总体均值为 ,中位数为
C.丙地:总体均值为 ,总体方差大于 D.中位数为 ,总体方差为
【答案】A
【分析】
利用平均数、中位数、方差的计算公式以及含义,对四个选项逐一分析判断即可;
【详解】
解:对于A:假设至少有一天的疑似病例超过 人,此时方差 ,这与题设矛盾,
所以假设不成立,故 正确.
对于B: 平均数和中位数不能限制某一天的病例不超过7人,故 不正确,
对于C:当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,故 不正确,对于D:中位数为 ,总体方差为 ,如 ,平均数为
,方差 ,满足
题意,但是存在大于7的数,故D错误;
故选:A
5.(2021·宁夏长庆高级中学高二期末(理))通过随机询问110名不同的我校学生是否爱好某项运动,
得到如下的列联表:经计算 的观测值 .参照附表,得到的正确结论是( )
附表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
0.050 0.010 0.001
3.841 6.635 10.828
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
【答案】A
【分析】
根据表格中的数据,求得 的值,结合附表,即可得到结论.
【详解】
由表格中的数据,可得 ,因为 ,所以有99%以上的把握认为“爱好体育运动与性别有关”.
故选:A.
6.(2021·福建泉州市·泉州五中高二期末)第24届冬季奥林匹克运动会将于2022年在北京举办,为了解
某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计得到如下2×2列联表
男 女 合计
关注冰雪运动 35 25 60
不关注冰雪运动 15 25 40
合计 50 50 100
根据列联表可知( )
参考公式: ,其中 .
附表:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.该市女性居民中大约有5%的人关注冰雪运动
B.该市男性届民中大约有95%的人关注冰雪运动
C.有95%的把握认为该市居民是否关注冰雪运动与性别有关
D.有99%的把握认为该市居民是否关注冰雪运动与性别无关
【答案】C
【分析】
根据列联表中数据计算 ,对照临界值得出结论.
【详解】
解:根据 列联表中数据,计算 ,
经查对临界值表知 .
所以有 的把握认为该市居民是否关注冰雪运动与性别有关,选项 正确.故选: .
7.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是( )
A.回归直线过样本点的中心
B.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高
C.线性回归方程对应的直线 至少经过其样本数据点 , ,…, 中的一
个点
D.在回归分析中, 的模型比 的模型拟合的效果好
【答案】C
【分析】
利用线性回归的相关定义即可得出答案
【详解】
样本中心点一定在线性回归方程上,则A正确;
残差点分布越窄越均匀,拟合程度越高,则B正确;
样本点不一定在线性回归直线上,则C错误;
越接近于1,模拟程度越好,则D正确.
故选:C.
二、多选题
8.(2021·江苏省锡山高级中学高二期末)在发生公共卫生事件期间,有专业机构认为该事件在一段时间
内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”过去10日,甲、乙、丙、
丁四地新增疑似病例数据信息如下:
甲地:中位数为2,极差为5;
乙地:总体平均数为2,众数为2;
丙地:总体平均数为1,总体方差大于0;
丁地:总体平均数为2,总体方差为3.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的有( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】AD
【分析】假设最多一天疑似病例超过7人,根据极差可判断 ;
根据平均数可算出10天疑似病例总人数,可判断 .
【详解】
解:假设甲地最多一天疑似病例超过7人,甲地中位数为2,说明有一天疑似病例小于2,极差会超过5,
甲地每天疑似病例不会超过7, 选A.
根据乙、丙两地疑似病例平均数可算出10天疑似病例总人数,可推断最多一天疑似病例可能超过7人,由
此不能断定一定没有发生大规模群体感染, 不选BC;
假设丁地最多一天疑似病例超过7人,丁地总体平均数为2,说明极差会超过3, 丁地每天疑似病例不会
超过7, 选D.
故选:AD.
9.(2021·湖南长沙一中高一月考)从某小学随机抽取100名学生,将他们的身高(单位:厘米)按照区
间 , 进行分组,得到频率分布直方图(如图),下列说法正
确的有()
A.若要从身高在 三组内的学生中.用等比例分层抽样的方法选取18人参加
一项活动.则从身高在 内的学生中应选取3人;
B.估计这100名学生的平均身高是 厘米)
C.估计这100名学生的第80百分位数为 厘米)
D.估计这100名学生的众数是 厘米)
【答案】ACD【分析】
首先求得 的值,然后利用比例关系可求得身高在 内的学生中应选取的人数,由平均数公式可
求得平均身高,由直方图可求得第80百分位数和众数.
【详解】
由题意可得: ,解得: ,
则身高在 三组内的学生的比例关系为: ,
故从身高在 内的学生中应选取 人,选项A正确;
估计这100名学生的平均身高是:
厘米),选项B错误;
由于 ,
故设这100名学生的第80百分位数为 厘米,则:
,解得: ,
即这100名学生的第80百分位数为 厘米),选项C正确;
由频率分布直方图可估计这100名学生的众数是 厘米),选项D正确.
故选:ACD.
10.(2021·海南华侨中学高一期末)若一组数据: 的平均值为2,方差为3,则关于数据
说法正确的是( )
A.平均值为-2 B.方差为6 C.平均值为4 D.方差为12
【答案】AD
【分析】
利用平均数、方差的概念进行求解即可.
【详解】的平均值为2,方差为3,
即 ,
则
,故A正确;
故D正确,
故选:AD.
11.(2021·重庆西南大学附中高一期末)在一次测验中共有500名同学参赛,经过评判,这500名考生的
得分都在 之间,其得分的频率分布直方图如图,则下列结论正确的是( )A.可求得
B.这500名参赛者得分的平均数为65
C.得分在 之间的频率为
D.得分在 之间的共有200人
【答案】ACD
【分析】
首先根据频率和为 可求得 的值,进而可求其它量,逐项分析即可得解.
【详解】
根据评率分布直方图可得 ,A正确;
平均数 ,B错误;
得分在 之间的频率为 ,C正确;
得分在 之间的共有 ,D正确;
故选:ACD
12.(2021·广东高二期中)下列说法正确的是( )
A.对于独立性检验,随机变量 的观测值 值越小,判定“两变量有关系”犯错误的概率越小B.在回归分析中,相关指数 越大,说明回归模型拟合的效果越好
C.随机变量 ,若 , ,则
D.甲、乙、丙、丁 个人到 个景点旅游,每人只去一个景点且每个景点都有人去,设事件 为“ 个
人去的景点各不相同”,事件 为“甲不去其中的 景点”,则
【答案】BD
【分析】
利用独立性检验可判断A选项;利用相关指数与回归模型的拟合效果可判断B选项;利用二项分布的期望
和方差公式可判断C选项;利用分步计数原理结合古典概型的概率公式可判断D选项.
【详解】
对于A选项,对于独立性检验,随机变量 的观测值 值越小,判定“两变量有关系”犯错误的概率越
大,A选项错误;
对于B选项,在回归分析中,相关指数 越大,说明回归模型拟合的效果越好,B选项正确;
对于C选项,随机变量 ,则 ,解得 ,C选项错误;
对于D选项,利用分步计数原理结合古典概型的概率公式可得 ,D选项正确.
故选:BD.
13.(2021·辽宁大连二十四中高二期中)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否
有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 ,女生喜欢抖
音的人数占女生人数的 ,若有 的把握认为是否喜欢抖音和性别有关,则调查人数中男生有可能(
)附:
A. B. C. D.
【答案】BC
【分析】
先设男生人数为 , ,列出列联表,利用独立性检验计算观测值,再结合观测值列关系即得答
案.
【详解】
解:由题意被调查的男女生人数相同,设男生的人数为: , ,由题意可列出 列联表:
男生 女生 合计
喜欢锻炼
不喜欢锻炼
合计
.
由于有 的把握认为是否喜欢抖音和性别有关,
所以 ;
解得: ,因为 ,
故 的可能取值为:9、10、11、12、13,即男生的人数可以是45,50,55,60,65.
则选项中被调查学生中男生的人数可能45或60.
故选:BC.14.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点 及其线
性回归方程 ,下列说法正确的有( )
A.相关系数r的绝对值 越接近0,表示x,y的线性相关程度越强
B.相关系数r的绝对值 越接近1,表示x,y的线性相关程度越强
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若 ,则点 一定在线性回归方程 上
【答案】BD
【分析】
根据相关系数绝对值大小,判断向量 相关性强弱,可判定选项A,B;根据残差分析,判断线性回归方
程的拟合效果,可判定选项C;根据样本中心点与线性回归直线的关系,即可判定选项D.
【详解】
当相关系数r的绝对值 越接近1,表示x,y的线性相关程度越强,
选项A错误,选项B正确;
残差平方和越小,表示线性回归方程拟合效果越好,选项C错误;
样本中心点 一定在线性回归直线 上,选项D正确.
故选:BD.
15.(2021·河南高二期中(文))某校为了解学生对餐厅食品质量的态度(满意或不满意),对在餐厅就餐
的学生随机做了一次调查,其中被调查的男、女生人数相同,有 的男生态度是“不满意”,有 的女生
态度是“不满意”,若有99%的把握认为男生和女生对餐厅食品质量的态度有差异,则调查的总人数可能
为( )
,其中 .
临界值表:( ) 0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.120 B.160 C.240 D.360
【答案】C
【分析】
设总人数为 ,写出列联表,利用公式计算 的值,由题意应当在0.01和0.001的临界值之间,解不等式
得到 的取值范围,从而做出选择.
【详解】
设总人数为 ,则列联表为:
男 女 合计
满意
不满意
合计
由题意得 ,
解得 , 为整数,所以调查的总人数至少为180人,至多为292人,
故选:C.
第II卷(非选择题)三、填空题
16.(2021·重庆高二期末)某同学对变量 进行回归分析时收集了几组观测数据如表所示,
1 2 3 4
但他不小心丟失了一个数据(用 代替),在数据丢失之前该同学根据散点图判断出 与 线性相关,并计
算出线性回归方程为 ,则 的值为___________.
【答案】
【分析】
求出 ,利用样本点中心的性质得出 的值.
【详解】
因为 ,所以
故答案为:
17.(2021·焦作市第一中学高一期末)某单位年龄(单位:岁)在 的员工有40人,年龄在
的员工有60人,年龄在 的员工有20人.现准备用分层抽样的方法从这些员工中选拔18
人代表单位参加技术比武活动,则选拔出的员工中,年龄小于50岁的员工人数为______.
【答案】15
【分析】
利用分层抽样的性质直接求解.
【详解】
解:总人数为: 人,
年龄小于50岁的员工人数为: 人,
则用分层抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,年龄小于50岁的员工人数为 人.
故答案为:15.
18.(2021·哈尔滨工业大学附属中学校高一期末)某学校为了调查高一年级学生的体育锻炼情况,从甲、
乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位: ),数据如下,
甲 6 6.5 7 7.5 8
乙 6 7 8 9 10 11 12
丙 3 4.5 6 7.5 9 10.5 12 13.5
估计这个学校高一年级学生一周的平均锻炼时间___________
【答案】
【分析】
利用甲,乙,丙的平均数计算总体平均数.
【详解】
样本中甲、乙、丙三个班级的平均锻炼时间分别为
,
则样本平均数为 .
估计该校高一年级学生一周的平均锻炼时间为8.2h.
故答案为:
19.(2021·重庆江北区·字水中学高二期末)某工厂为研究某种产品的产量 (吨)与所需某种原材料的
质量 (吨)的相关性,在生产过程中收集4组对应数据 ,如下表所示.(残差=观测值-预测值)
3 4 5 6
2.5 3 4根据表中数据,得出 关于 的经验回归方程为 .据此计算出在样本 处的残差为 ,
则表中 的值为______.
【答案】
【分析】
首先由已知条件求出 的值,再由回归直线过样本中心点即可求解.
【详解】
因为样本 处的残差为 ,即 ,
所以 ,
所以回归方程为: ,
因为 , ,
因为样本中心点 在回归直线上,所以 ,
解得: ,
故答案为: .
20.(2021·河南高二期中(文))某企业计划通过广告宣传来提高销售额,经统计,产品的广告费 (单
位:百万元)与销售额 (单位:百万元)之间有如下对应数据:
0 1 2 3 4
14.8 30.4 36.2 39.6 51
由表中的数据得线性回归方程为 .投入的广告费 时,销售额的预报值为______百万元.
【答案】66.4
【分析】
先求平均值,再代入线性回归方程得 ,最后利用线性回归方程估计结果.
【详解】因为 ;
所以 ,∴
因此 时,
故答案为:66.4
21.(2021·天津西青区·高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数 的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程 中,当解释变量x每增加1个单位时,相应变量 平均增加 个单位;
④某人研究儿子身高 与父亲身高 的关系,得到经验回归方程 ,当
时, ,即:如果一个父亲的身高为 ,则儿子的升高一定为 .
则以上结论中正确的序号为__________.
【答案】①③
【分析】
根据残差和相关系数的意义判定①②;根据线性回归方程的意义判定③④.
【详解】
根据残差的定义,可知①正确;相关系数绝对值越接近于1,线性相关性越强,故②错误;
由回归方程的意义,根据回归方程的解释变量的系数为0.3, 变量 平均增加 个单位,
故③正确;
回归方程是表示一种统计规律,具有随机的不确定性,不能说一定是,故④错误;
故答案为:①③.
22.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)某公交公司推出扫码支付乘车优惠活动,
活动为期两周,活动的前五天数据如下表:
第 天 1 2 3 4 5使用人数( ) 15 173 457 842 1333
由表中数据可得y关于x的回归方程为 ,则据此回归模型相应于点(2,173)的残差为
________.
【答案】
【分析】
先计算样本中心点坐标,可得回归方程,计算出 的值,然后求出估计值,最后计算残差即可.
【详解】
令 ,则 ,
由题意可得, ,
,
则样本中心为 ,
故 经过点 ,
所以 ,解得 ,
则 ,
当 时, ,
所以残差为 .
故答案为: .
四、双空题
23.(2021·上海市实验学校高二期末)如果数据 、 、 、 的平均值为10,方差为3,则 、
、 、 的平均值为______,方差为______.
【答案】35 27【分析】
根据平均数的计算公式与方差的计算公式即可求解.
【详解】
解:因为 , , , 的平均值为10,
所以 、 、 、 的平均值 ,
其方差为 .
故答案为:35;27.
24.(2021·绥化市第二中学高一期末)数据 的平均数为2,方差为3,则数据
的平均数为__________;方差为__________.
【答案】5 12
【分析】
根据两类数据的线性关系可得它们的均值关系和方差关系.
【详解】
因为数据 的平均数为2,方差为3,
故数据 的平均数为 ,方差为 ,
故答案为: .
25.(2021·湖北高二学业考试)某校足球俱乐部有男运动员60人,女运动员40人,为了了解运动员的身
体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则应抽取的(1)男运动员人数为
_______;(2)女运动员人数为_______.
【答案】
【分析】
先由已知计算出抽样比,进而可得答案.
【详解】
解:足球俱乐部有男运动员60人,女运动员40人,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则抽样比为 ,
故抽取的男运动员人数 人,抽取的女运动员人数 人,
故答案为: ;
26.(9.2.1总体取值规律的估计(分层练习)-2020-2021学年高一数学新教材配套练习(人教A版2019
必修第二册))一个容量为n的样本,分成若干组,已知甲组的频数和频率分别为36和 ,则容量
n=____,频率为 的乙组的频数x=____.
【答案】144 24
【分析】
利用频率公式求解.
【详解】
由题意得 ,
所以 ,
同理 ,
解得 .
故答案为:144,24
27.(2021·天津高二期末)生活经验告诉我们,儿子的身高与父亲的身高具有较强的正相关性,某体育老
师调查了大学三年级某班所有男生的身高和父亲的身高(单位: ),利用最小二乘法计算出 ,
,则儿子的身高y与父亲的身高 的线性回归方程是___________,据此估计其它班级,如果父亲
的身高增加10 ,儿子的身高平均增加___________ .【答案】
【分析】
(1)根据 即可得出答案;
(2) 即为增加量,将x=10代入即可解得.
【详解】
(1)由题意 ;
(2)若父亲身高增加10厘米时,孩子身高增加 厘米.
故答案为:① ,②8.4.
28.(2021·天津高一期末)某市供电部门为了解节能减排以来本市居民的用电量情况,通过抽样,获得了
1000户居民月平均用电量(单位:度),将数据按照[50,100),[100,150),…,[300,350]分成六组,制成
了如图所示的频率分布直方图.则频率分布直方图中 的值为___________;根据频率分布直方图近似估计
抽取的这1000户居民月用电量的中位数为___________.(精确到0.1)
【答案】0.0044 183.3
【分析】
由频率和为1可求出图中 的值,由于前2组的频率和为 ,前3组的频率和为 ,所以可判断中位数
在第3 组,设中位数为 ,则 ,从而可求出中位数
【详解】
解:由频率分布直方图可得
,解得 ,
由于前2组的频率和为 ,前3 组的频率和为
,所以可知中位数在第3组,设中位数为 ,则
,解得 ,
故答案为: ,
29.(2021·北京高二期末)判断对错,并在相应横线处划“√”或“×”.①样本相关系数 时,称成对
数据正相关, 时,称成对数据负相关___________.②样本相关系数的绝对值 越接近于1,线性相关
程度越弱, 越接近于0,线性相关程度越强___________.
【答案】√ ×
【分析】
根据样本相关系数的意义及性质即可判断作答.
【详解】
由成对数据正负相关与相关系数的对应关系知,①正确,在横线处划“√”;
因样本相关系数的绝对值 越接近于1,线性相关程度越强, 越接近于0,线性相关程度越弱,则②不
正确,在横线处划“×”.
故答案为:√;×
30.(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23时11分降落在月球
表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品的上升器送入到预定环月轨道,这是我
国首次实现月球无人采样和地外天体起飞,对我国航天事业具有重大而深远的影响,为进一步培养中学生
对航空航天的兴趣爱好,某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第
1天3人,第2天6人,第3天10人,第4天13人,第5天18人,通过数据分析已知,报名人数与报名时
间具有线性相关关系.已知第 天的报名人数为 ,则 关于 的线性回归方程为___________,该社团为
了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并得到如下 列联表:有兴趣 无兴趣 合计
男生 45 5 50
女生 30 20 50
合计 75 25 100
请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别
_______(填“有”或”无”)关系
参考公式及数据:回归方程 中斜率的最小二乘估计公式为:
, ;
,其中 .
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】 有
【分析】
由题意计算 、 ,求出回归系数,写出线性回归方程,利用回归方程求出 时 的值即可,再由列
联表求出 ,与观测值比较即可;.
【详解】
解:由题意,计算 ,
,所以 ,
,
所以 关于 的线性回归方程为 ,
由列联表数据可得
因为 ,
所以,在犯错误的概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”.
故答案为:(1) ;(2)有
31.(2021·浙江高二课时练习)某学生对其30名亲属的饮食习惯进行了一次调查,依据统计所得数据可
得到如下的 列联表:
喜欢吃蔬菜 喜欢吃肉类 总计
50岁以下 8
50岁以上 16 2 18
总计 30
根据以上列联表中的数据,可得 的观测值 __________,__________(填“有”或“没有”)
的把握认为其亲属的饮食习惯与年龄有关.
参考公式: ,其中 .
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】10 有【分析】
根据列联表,求得 的值,利用公式,求得 的值,结合附表,即可得到结论.
【详解】
由列联表可得 , , , ,
可得 ,
所以有 的把握认为其亲属的饮食习惯与年龄有关.
故答案为: ;有.
32.(2018·北京全国·高二单元测试(理))关于 与 ,有如下数据有如下的两个模型:(1)
;(2) .通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则
________ , ______ (用大于,小于号填空, 是相关指数和残差平方和)
2 4 5 6 8
30 40 60 50 70
【答案】
【分析】
直接利用残差的性质以及相关指数的性质求解即可.
【详解】
由相关指数 的的性质可得,
越大模型的拟合效果越好,所以 ,
由残差的性质可得,
残差平方和越小模型的拟合效果越好,
所以 ,故答案为 .
【点睛】本题主要考查残差的性质以及相关指数的性质,属于中档题. 残差平方和越小越好,带状区域的宽度越窄,
说明模型的拟合精度越高,相关指数 越大,模型的拟合效果越好.
五、解答题
33.(2021·北京市第十二中学高一期末)某公司为了解用户对其产品的满意程度,采用分层抽样的方法从
A,B两个地区共抽取了500名用户,请用户根据满意程度对该公司品评分,该公司将收集到的数据按照
, , , 分组,绘制成评分频率分布直方图如下:
已知A地区用户约为40000人,B地区用户约为10000人.
(1)求该公司采用分层抽样的方法从A,B两个地区分别抽取的用户人数;
(2)根据频率分布直分图,估计B地区所有用户中,对该产品评分不低于80分的用户的人数;
(3)根据频率分布直方图,估计A地区抽取的400名用户对该公司产品的评分的平均值为 ,B地区抽
取的100名用户对该公司产品的评分的平均值为 ,以及A,B两个地区抽取的500名用户对该公司产品
的评分的平均值为 ,试比较 和 的大小.(结论不要求证明)
【答案】(1) 地区抽取400户, 地区抽取100户;(2)10;(3)当 时, ,
时, , 时, .【分析】
(1)根据分层抽样,样本比等于总体比求得抽取的用户人数;
(2)由频率分布图得出频率后可得所求人数;
(3)根据均值的定义求出 ,作差比较.
【详解】
(1)设A,B两个地区抽取的用户人数分别为 ,则 ,所以 ,
;
(2)由频率分布图知,B地区所有用户中,对该产品评分不低于80分的用户频率为 ,人
数 ;
(3)由题意 ,
,
所以当 时, , 时, , 时, .
34.(2021·绥化市第二中学高一期末)某部门计划对某路段进行限速,为调查限速 是否合理,对
通过该路段的500辆汽车的车速进行检测,将所得数据按 分组,绘制
成如图所示的频率分布直方图.(1)求直方图中 的值及车速落在 的汽车数;
(2)求这500辆汽车车速的平均数、中位数和众数.
【答案】(1) , 辆; (2)平均数为 ,中位数为 ,众数为 .
【分析】
(1)由频率分布直方图的性质,列出方程,求得 的值,求得车速落在 的频率,进而求得汽车数.
(2)根据频率分布直方图的平均数,中位数和众数的定义,即可求解.
【详解】
(1)由频率分布直方图的性质,可得 ,
解得 ,
其中车速落在 的频率为 ,
所以该路段500辆汽车中车速落在 的汽车数为 辆.
(2)根据频率分布直方图的平均数的计算公式,可得这500辆汽车车速的平均数为:
,
由中位数的计算方法,可得中位数为: ,
根据众数的定义,可得众数为 .
35.(云南省部分名校2020-2021学年高二下学期期末联考数学(文)试题)某重点中学调查了100位学
生在市统考中的理科综合分数,以 , , , , ,
, 分组的频率分布直方图如图.将理科综合分数不低于240分的学生称为成绩“优秀”
(1)估计某学生的成绩为“优秀”的概率;
(2)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为成绩“优秀”与性别
有关.
成绩“非优秀” 成绩“优秀” 合计
男
女 15 45
合计
附: , .
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1) ;(2)列联表答案见解析,没有 的把握认为成绩“优秀”与性别有关.
【分析】
(1)根据频率分布直方图求出“非优秀”的概率,再利用概率和为1求出“优秀”的概率;(2)先求出
优秀的人数,再逐一填其他量,代入公式计算 得出结论.
【详解】
解:(1)根据频率分布直方图可得某学生的成绩为“优秀”的概率为
.(2)由频率分布直方图可知,在抽取的100人中,成绩“优秀”的有30人,从而2×2列联表如下:
成绩“非优秀” 成绩“优秀” 合计
男 40 15 55
女 30 15 45
合计 70 30 100
将2×2列联表中的数据代入公式计算,得
因为 ,
所以没有 的把握认为成绩“优秀”与性别有关.
36.(2021·黎川县第一中学高二期末(文))某网站的调查显示,健身操类、跑步类、拉伸运动类等健身
项目在大众健康项目中比较火热,但是大多数人对健身科学类的知识相对缺乏,尤其是健身指导方面.现
从某健身房随机抽取 名会员,其中男生有 人,对其平均每天健身的时间进行调查,并根据日均健身
时间分为 , , , , 五组,得到如图所示的男生日均健身时间频
数表与女生日均健身时间频率分布直方图.规定日均健身时间不少于 分钟的人为“喜欢健身”.
男生日均健身时间频数表:
日均健身时间(分钟)
人数
女生日均健身时间频率分布直方图:(1)请完成下面的 列联表.
喜欢健身 不喜欢健身 总计
男生
女生
总计
根据以上的 列联表,能否有 的把握认为喜欢健身与性别有关?
(2)现从日均健身时间在 的学员中选取 人进行表彰,求选取的 人中至少有 名男生的概率.
附: ,其中 .
0.05 0.025 0.01 0.005
3.841 5.024 6.635 7.829
【答案】(1) 列联表见解析,没有 的把握认为喜欢健身与性别有关;(2) .
【分析】
(1)根据已知条件可直接得到 列联表,由列联表计算得到 ,由此可得结论;
(2)采用列举法可得基本事件总数和满足题意的基本事件个数,由古典概型概率公式可计算得到结果.
【详解】
(1)由题意可得 列联表如下:
喜欢健身 不喜欢健身 总计
男生
女生
总计
,没有 的把握认为喜欢健身与性别有关.
(2)记 名女生为 , 名男生为 ,
则从 人中抽取 人的所有可能情况为 , , , , ,
, , , , ,共 种,
其中 人中至少有 名男生的情况有 种, 所求概率 .
37.(2021·河南新乡县一中高二期末(文))华为 系统是一款面向未来、面向全场景的分布
式操作系统,预计该系统将会成为继 、 系统之后的全球第三大手机操作系统.为了了解手机用
户对 系统的期待程度,某公司随机在20000人中抽取了100名被调查者,记录他们的期待值,
将数据分成 , ,…, 6组,其中期待值不低于60的称为非常期待 系
统,现整理数据得到如下频率分布直方图.
(1)已知样本中期待值小于15的有4人,试估计总体中期待值在区间[15,30)内的人数;
(2)已知样本中的男生有一半非常期待 系统,且样本中非常期待 系统的男、女
生人数相等.请根据所提供的数据,完成下面的 列联表,并判断是否有99%的把握认为是否非常期待
系统与性别有关.非常期待 不非常期待 合计
男
女
合计 100
附: ,其中 .
【答案】(1) ;(2)列联表答案见解析,没有99%的把握认为是否非常期待 系统与
性别有关.
【分析】
(1)利用频率分布直方图的性质直接计算即可;
(2)根据频率分布直方图列联表,计算 ,并对照临界值表确定是否有关.
【详解】
解:(1)因为样本中期待值不小于30的频率为 ,
所以样本中期待值小于30的频率为0.1,
所以样本中期待值在区间 内的人数为 ,
故总体中期待值在区间 内的人数约为 .
(2)因为样本中非常期待 系统的人数为 ,
所以样本中非常期待 系统的男生人数为 ,所以样本中的男生人数为 ,女生人数为 .
非常期待 不非常期待 合计
男 30 30 60
女 30 10 40
合计 60 40 100
所以没有99%的把握认为是否非常期待 系统与性别有关.
38.(2021·安徽黄山市·屯溪一中高二期末(文))黄山市一直践行“节能环保、绿色出行”的基本理念,
现越来越多的市民购置新能源电动车替代传统的燃油汽车.如表是近五年我市新能源电动车的年销量与年
份的统计表(其中第1年表示2016年,第2年表示2017年,依此类推).
第x年 1 2 3 4 5
年销售量y(万台) 5 8 14 22 31
高二(1)班家委会组织了一次本班家庭购车调查,调查对象与内容近五年购车的20个家庭及购车的类型,
得到的部分数据如表 列联表.
购置传统燃油汽车 购置新能源电动车 总计
车主为父亲 3
车主为母亲 2 6
总计 20
(1)求新能源电动车的年销售量y关于x的线性相关系数r,并判断y与x是否线性相关?若是,预测
2021年新能源电动车的年销售量;若不是,请说明理由;
(2)完成 列联表,并判断是否有 的把握认为购车车主是否购置新能源电动车与性别有关?
参考公式: ,若 ,可判断y与x线性相关., , ,其中
.
临界值表供参考:
参考数据:
66 450 2.236 2.449
【答案】(1) ,y与x线性相关; 万台;(2)列联表见解析,有 的把握认为购车车主
是否购置新能源电动车与性别有关.
【分析】
(1)由公式计算出线性相关系数,即可判断是否线性相关;求出线性回归方程后代入 即可预测2021
年新能源电动车的年销售量;
(2)由题意完成列联表,代入公式求出 ,与2.706比较即可得解.
【详解】
(1) , ,
∵ ,
∴y与x线性相关,又 , .
∴ .
∴y关于x的线性回归方程为 ,
取 ,可得 .
即预测2021年新能源电动车的年销售量是 万台;
(2) 列联表如下:
购置传统燃油汽车 购置新能源电动车 总计
车主为父亲 11 3 14
车主为母亲 2 4 6
总计 13 7 20
则 ,∵ ,
∴有 的把握认为购车车主是否购置新能源电动车与性别有关.
39.(2021·江西景德镇一中高二期末(文))为调查某地区老年人是否需要志愿者提供帮助,用简单随机
抽样方法从该地区调查了500位老年人,结果如下:
性别
男 女
是否需要志愿者
需要 30 50
不需要 270 150
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
附:
( ) 0.050 0.010 0.0013.841 6.635 10.828
【答案】(1) ;(2)有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
【分析】
(1)利用表中的数据直接求解即可;
(2)直接用公式 求解,然后与临界值表比较可得结论
【详解】
解:(1)被调查的500位老年人中有80位需要志愿者提供帮助,
因此该地区老年人中,需要帮助的老年人的比例的估计值为 ,
所以该地区老年人中,需要志愿者提供帮助的老年人的比例为 .
(2)由题知
所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
40.(2021·四川省成都市玉林中学高二(文))某企业在开展“质量安全周”活动中,某种产品被检测出
其中一项质量指标存在问题,该企业对甲、乙两条流水线生产该产品情况进行统计,表1是甲流水线样本
的频数分布表,如图是乙流水线样本的频率分布直方图.表1
质量指标数 频数
10
9
18
7
6(1)某个月内甲、乙两条流水线各生产了3500件和1500件产品,现按照分层抽样的方法,从中抽出100
件产品进行检测,问甲、乙两条生产线各抽出多少件产品?
(2)随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.
若该项质量指标值落在 内,则为合格品,否则为不合格品.根据已知条件完成表2的 列联表,
并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有
关”?
表2
甲流水线 乙流水线 合计
合格品
不合格品
合计
附: (其中 ).
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)70,30;(2)表见解析,没有85%的把握.
【分析】
(1)由分层抽样的性质运算即可得解;
(2)由题干数据分别求出甲、乙合格及不合格的数量,完成列联表,代入公式计算 ,与2.072比较即可得解.
【详解】
(1)按照分层抽样抽出100件产品中,
甲有 件,乙有 件;
(2)甲、乙两条生产线各抽出50件产品,
甲流水线生产的不合格产品有16件,合格产品有34件,
∵乙流水线生产的不合格产品的概率为 ,
∴乙流水线生产的不合格产品有10件,合格产品有40件,
则 列联表如下,
甲流水线 乙流水线 合计
合格品 34 40 74
不合格品 16 10 26
合计 50 50 100
,
∴没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”.
41.(2021·重庆一中高二期中)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多
样,且具有污染性,所以需要无害化减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽
取20个县城进行了分析,得到样本数据 ,其中 和 分别表示第 个县城的人口
(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得
.
(1)请用相关系数 说明该组数据中 与 之间的关系可用线性回归模型进行拟合;(当 时,
认为两变量的线性相关性很强)(2)求 关于 的线性回归方程,并用所求回归方程预测该市100万人口的县城年垃圾产生总量约为多少
吨?
参考公式:相关系数 ,对于一组具有线性相关关系的数据
,其回归直线 的斜率和截距的最小二乘法估计分别为
.
【答案】(1)因为 与 的相关系数大于0.75,所以 与 之间具有较强的线性相关关系,可用线性回归
模型进行拟合;(2) ,1040吨.
【分析】
(1)将所给数据代入相关系数公式计算并与0.75比较即得解;
(2)由最小二乘法计算斜率 ,进而求出截距 可得回归直线方程并进行估计作答.
【详解】
(1)由题意知,相关系数 .
因为 与 的相关系数大于0.75,所以 与 之间具有较强的线性相关关系,可用线性回归模型进行拟合;
(2)由题意可得, ,,所以 ,
当 时, ,
所以该市100万人口的县城年垃圾产生总量约为1040吨.