文档内容
8.5 统计案例(精练)(提升版)
题组一 独立性检验
1.(2022·雅安模拟)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后
将所得结果填入相应的 列联表中,由列联表中的数据计算得 .参照附表,下列结论正
确的是( )
附表:
0.050 0.025 0.010 0.005 0.001
3.841 5.02 6.635 7.879 10.828
A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”
B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”
C.有99%以上的把握认为“药物有效”
D.有99%以上的把握认为“药物无效”
【答案】C
【解析】因为 ,即 ,所以有99%以上的把握认为“药物有效”.
故答案为:C.
2.(2022·成都模拟)在某大学一食品超市,随机询问了70名不同性别的大学生在购买食物时是否查
看营养说明,得到如下的列联表:
女 男 总计
要查看营养说明 15 25 40
不查看营养说明 20 10 30
总计 35 35 70
附: ,其中 .
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.0050.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879
根据列联表的独立性检验,则下列说法正确的是( ).
A.在犯错误的概率不超过0.05的前提下认为该校大学生在购买食物时要查看营养说明的人数中男生
人数更多
B.在犯错误的概率不超过0.010的前提下认为该校女大学生在购买食物时要查看营养说明的人数与不
查看营养说明的人数比为
C.在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系
D.在犯错误的概率不超过0.010的前提下认为性别与是否查看营养说明有关系
【答案】C
【解析】由题可得 ,
∴在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系. 故答案为:C.
3.(2022·武昌模拟)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:
性别
跳绳 合计
男 女
爱好 40 20 60
不爱好 20 30 50
合计 60 50 110
已知 ,
0.05 0.01 0.001
3.841 6.635 10.828
则以下结论正确的是( )
A.根据小概率值 的独立性检验,爱好跳绳与性别无关
B.根据小概率值 的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过
0.001C.根据小概率值 的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”
D.根据小概率值 的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与
性别无关”
【答案】A
【解析】由题知
因为 ,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,A符合题意,B
不符合题意,又因为 ,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误
的概率不超过1%的前提下,认为“爱好跳绳与性别有关.C和D不符合题意.
故答案为:A.
4.(2022·广东佛山·模拟预测)武汉热干面既是中国四大名面之一,也是湖北武汉最出名的小吃之一.
某热干面店铺连续10天的销售情况如下(单位:份):
天数 1 2 3 4 5 6 7 8 9 10
10 15
套餐一 120 140 140 120 70 120 110 130
0 0
套餐二 80 90 90 60 50 90 70 80 90 100
(1)分别求套餐一、套餐二的均值、方差,并判断两种套餐销售的稳定情况;
(2)假定在连续10天中每位顾客只购买了一份,根据图表内容填写下列 列联表,并据此判断能否有
95%的把握认定顾客性别与套餐选择有关?
顾客套
套餐一 套餐二 合计
餐
男顾客 400
女顾客 500
合计
附:0.02
0.10 0.05 0.010
5
5.02
2.706 3.841 6.635
4
【答案】(1)套餐一:均值120,方差480;套餐二:均值80,方差220;套餐二销量相对稳定
(2)填表见解析;没有
【解析】(1)套餐一:均值
方差 ;
套餐二:均值
方差 .
因为 ,所以,套餐二销量相对稳定.
(2)列联表如下:
顾客套
套餐一 套餐二 合计
餐
男顾客 400 300 700
女顾客 800 500 1300
合计 1200 800 2000
因为 ,
所以,没有95%以上的把握认定顾客性别与套餐选有关
题组二 线性回归方程
1.(2022·永州三模)某新能源汽车销售公司统计了某款汽车行驶里程 (单位:万千米)对应维修保养
费用 (单位:万元)的四组数据,这四组数据如下表:
行驶里程 /万千米 1 2 4 5
维修保养费用 /万元 0.50 0.90 2.30 2.70
若用最小二乘法求得回归直线方程为 ,则估计该款汽车行驶里程为6万千米时的维修保养费是( )
A.3.34万元 B.3.62万元 C.3.82万元 D.4.02万元
【答案】A
【解析】由已知 , ,
所以 , ,即 ,
时, 故答案为:A.
2.(2022·东北模拟)为研究变量x,y的相关关系,收集得到下面五个样本点(x,y):
x 9 9.5 10 10.5 11
y 11 10 8 6 5
若由最小二乘法求得y关于x的回归直线方程为 ,则据此计算残差为0的样本点是(
)
A.(9,11) B.(10,8) C.(10.5,6) D.(11.5)
【答案】B
【解析】由题意可知, ,
所以线性方程的样本中心点为 ,因此有 ,所以 ,
在收集的5个样本点中, 一点在 上,故计算残差为0的样本点是 .
故答案为:B
3.(2022·平江模拟)(多选)下列说法正确的是( )
A.线性回归方程 必过
B.设具有线性相关关系的两个变量x,y的相关系数为r,则 越接近于0,x和y之间的线性相关
程度越强
C.在一个 列联表中,由计算得 的值,则 的值越小,判断两个变量有关的把握越大D.若 , ,则
【答案】A,D
【解析】因为线性回归方程 必过样本中心点 ,所以A符合题意;
因为 越接近于0,x和y之间的线性相关程度越弱,所以B不正确;
因为 的值越小,确定两个变量有关的把握的程度越小,所以C不正确;
因为 ,所以 ,因此D符合题意。
故答案为:AD
4.自2020年初,新型冠状病毒引起的肺炎疫情爆发以来,各地医疗机构采取了各种有针对性的治疗
方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格
可得y关于x的二次回归方程为 ,则下列说法正确的是( )
周数(x) 1 2 3 4 5
治愈人数(y) 2 17 36 93 142
A.
B.
C.此回归模型第4周的残差(实际值与预报值之差)为5
D.估计第6周治愈人数为220
【答案】B,C
【解析】设 ,则 ,
由已知得 ,
所以 ,故选项A错,选项B对;
在 中,令 ,得 ,所以此回归模型第4周的残差为 .故选项C正确;
在 中,令 ,得 ,故选项D错误.
故答案为:BC.
5(2022·武汉模拟)(多选)在研究某种产品的零售价 (单位:元)与销售量 (单位:万件)之间
的关系时,根据所得数据得到如下所示的对应表:
12 14 16 18 20
17 16 14 13 11
利用最小二乘法计算数据,得到的回归直线方程为 ,则下列说法中正确的是( )
A. 与 的样本相关系数
B.回归直线必过点
C.
D.若该产品的零售价定为22元,可预测销售量是9.7万件
【答案】B,C,D
【解析】由表中数据可知
,
,
对于A,根据相关性系数的公式为 ,
故相关系数的正负取决分子
A不正确;对于B,C,由变量 与 的均值,得样本点的中心为 ,
所以样本点的中心 必过线性回归方程,B符合题意;
将 代入 中,得 ,解得 ,
所以 ,C符合题意;
因为 ,所以回归直线方程为 ,
当 时, ,
所以该产品的零售价定为22元,可预测销售量是 万件,D符合题意.
故答案为:BCD.
6.(2022·德州二模)2021年12月17日,工信部发布的“十四五“促进中小企业发展规划》明确提
出建立”百十万千”的中小企业梯度培育体系,引导中小企业走向“专精特新”、“小巨人”、“隐
形冠军”的发展方向,“专精特新”是指具备专业化、精细化、特色化,新颖化优势的中小企业下表
是某地各年新增企业数量的有关数据:
年份(年) 2017 2018 2019 2020 2021
年份代码(x) 1 2 3 4 5
新增企业数量:(y) 8 17 29 24 42
参考公式:回归方程 中,斜率和截距最小二乘法估计公式分别为
,
(1)请根据上表所给的数据,求出y关于x的线性回归方程,并预测2023年此地新增企业的数量;
(2)若在此地进行考察,考察企业中有4个为“专精特新”企业,3个为普通企业,现从这7个企业
中随机抽取3个,用X表示抽取的3个为“专精特新”全业个数,求随机变量X的分布列与期望.
【答案】见解析【解析】解: ,
,
,
,
所以 , ,
所以 .
2023年,即当 时,由线性回归方程可得 ,
所以估计2023年此地新增企业的数量的为54家.
(2)解:由题意可知,X的可能取值为0,1,2,3,
因为 , , ,
,
所以X的分布列为
X 0 1 2 3
P
所以 .
7.(2022·烟台模拟)当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了
玩家对每一关的平均过关时间,如下表:
关卡 1 2 3 4 5 6
平均过关时间 (单位:秒) 50 78 124 121 137 352
计算得到一些统计量的值为: ,其中, .
参考公式:对于一组数据 ( ),其经验回归直线 的斜率和截距的
最小二乘估计分别为 , .
(1)若用模型 拟合 与 的关系,根据提供的数据,求出 与 的经验回归方程;
(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获
得 分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过
的概率均为 ,若甲玩一轮此款益脑游戏,求“甲获得的积分 ”的分布列和数学期望.
【答案】见解析
【解析】(1)解:因为 两边取对数可得 ,即 ,
令 ,所以 ,由 ,
, .
所以 ,又 ,即 ,
所以 ,所以 .
所以 关于 的经验回归方程为
(2)解:由题知,甲获得的积分 的所有可能取值为5,7,9,12,
所以 , ,
, ,
所以 的分布列为
5 7 9 12
所以
8.(2022·安阳模拟)为有效防控疫情,于2021年9月开始,多省份相继启动新冠疫苗加强免疫接种
工作.新冠疫苗接种一段时间后,有保护效果削弱的情况存在,加强针的接种则会使这种下降出现“强
势反弹”.研究结果显示,接种加强针以后,受种者的抗体水平将大幅提升,加强免疫14天后,抗体
水平相当于原来10-30倍,6个月后,能维持在较高水平,并且对德尔塔等变异株出现良好交叉中和
作用.某市开展加强免疫接种工作以来,在某一周的接种人数(单位:万人)如下表所示:
星期一 星期二 星期三 星期四 星期五 星期六 星期日
接种人数 1.7 1.9 2.1 2.3 2.4 2.5 a
规定星期一为第1天,设天数为 ,当日接种人数为y.
参考公式: , .
(1)若当日接种人数超过1.8万人,则认为“接种繁忙”,从前4天中随机选择2天,求这2天接种繁忙的概率;
(2)若y关于 具有线性相关关系,求y关于x的线性回归方程;
(3)根据所求的线性回归方程分别计算星期五,星期六的预报值 ,并与当日接种人数的真实值y
进行比较.若满足 ,则可用此回归方程预测以后的接种人数,并预测星期日的接种人数a;
若不满足,请说明理由.
【答案】见解析
【解析】(1)解:记 “这2天接种繁忙”为事件 ,所以
(2)解:由表格可知, ,
,
,所以 , ,
故y关于x的线性回归方程为
(3)解:当 时, , ;
当 时, , ,不满足,即不可用此回归方程预测以
后的接种人数.
9.(2022·安阳模拟)共享汽车,是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有
权,有点类似于在租车行业里的短时间的租车.它手续简便,打个电话或通过网上就可以预约订车.
某市为了了解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他
们根据体验效果进行评分.附:回归直线 的斜率
相关系数
独立性检验中的 ,其中 .
临界值表:
0.050 0.010 0.001
3.841 6.635 10.828
(1)设消费者的年龄为x,对共享汽车的体验评分为y.若根据统计数据,用最小二乘法得到y关
于x的线性回归方程为 ,且年龄x的方差为 ,评分y的方差为 .
求y与x的相关系数r,并据此判断对共享汽车使用体验的评分与年龄的相关性强弱(当
时,认为相关性强,否则认为相关性弱).
(2)现将100名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,
整理得到如下数据,请将 列联表补充完整并判断是否有99.9%的把握认为对共享汽车的评价与
年龄有关.
好评 差评 合计
青年 16
中老年 12
合计 44 100
【答案】见解析
【解析】(1)解:因为 ,所以 ,因为 ,所以 ,
因为 ,所以 ,
所以相关系数 ,
因为 ,所以可以判断对共享汽车使用体验的评分与年龄的相关性很强.
(2)解:根据题意可得 列联表如下:
好评 差评 合计
青年 16 32 48
中老年 40 12 52
合计 56 44 100
因为 ,
所以有99.9%的把握认为对共享汽车的评价与年龄有关.
题组三 非线性回归方程
1(2022·广东·铁一中学高三期末) 年 月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途
径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在 月
日至 日累计确诊人数如下表:
日期( 月) 日 日 日 日 日 日 日
人数(人)
由上述表格得到如散点图( 月 日为封城第一天).(1)根据散点图判断 与 ( , 均为大于 的常数)哪一个适宜作为累计确诊人数 与
封城后的天数 的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;
(2)随着更多的医护人员投入疫情的研究, 月 日武汉影像科医生提出存在大量核酸检测呈阴性(阳
性则确诊),但观其 肺片具有明显病变,这一提议引起了广泛的关注, 月 日武汉疾控中心接收了
份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概
率为 ,核酸试剂能把阳性样本检测出阳性结果的概率是 (核酸检测存在阳性样本检测不出来的情
况,但不会把阴性检测呈阳性),求这 份样本中检测呈阳性的份数的期望.
参考数据:
其中 , ,参考公式:对于一组数据 , ,…, ,其回归直线
的斜率和截距的最小二乘估计公式分别为 , .
【答案】(1)选择 , 关于 的回归方程为 ;(2)期望为 人.
【解析】(1)由散点图可知选择 ,
由 两边同时取常用对数得 ,设 , .
计算 , , ,
,
把样本中心点 代入 得 .
, 关于 的回归方程为 ;
(2)这 份样本中检测呈阳性的份数为 ,
则每份检测出阳性的概率 ,
由题意可知 , (人),
故这 份样本中检测呈阳性份数的期望为 人.
2.(2022·山西·二模(理))数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高
速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的
代码依次为1-5.
年份代码x 1 2 3 4 5
市场规模y 3.98 4.56 5.04 5.86 6.36
(1)由上表数据可知,可用函数模型 拟合y与x的关系,请建立y关于x的回归方程( , 的
值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机
抽取4人,记这4人中选择在品牌官方直播间购物的人数为X,若 ,求X的分布列与
期望.
参考数据: , , ,其中 .参考公式:对于一组数据 , ,…, ,其回归直线 的斜率和截距的最小二乘
估计公式分别为 , .
【答案】(1)
(2)分布列见解析;期望为
【解析】(1)解:设 ,则 ,
因为 , , ,
所以 .
把 代入 ,得 .
即 关于 的回归方程为 .
(2)解:由题意知 ,
, ,
由 得
所以, 的取值依次为0,1,2,3,4,
, ,
, ,,
所以X的分布列为
X 0 1 2 3 4
P
3.(2022·贵州·模拟预测(理))某企业为加强科研创新,加大研发资金的投入,新研发了一种产品.
该产品的生产成本由直接生产成本(如原料、工人工资、机器设备折旧等)和间接生产成本(如物料消耗、
管理人员工资、车间房屋折旧等)组成.该产品的间接生产成本y(万元)与该产品的生产数量x(千件)有
关,经统计并对数据作初步处理,得到散点图及一些统计量的值.
3.5 13.24 1.81 17.5 1.46 19.9 5.84
表中 , .
(1)根据散点图判断 与 哪一个更适合作为间接生产成本y与该产品的生产数量x的回
归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测生产9千件产品时,间接生产成本是多少万元;
(3)为确保产品质量,该企业在生产过程中对生产的每件产品均进行五个环节的质量检测,若检测出不合
格产品,则需在未进入下一环节前立即修复(修复后再进入下一环节),已知每个环节是相互独立的,且
每个环节产品检测的合格率均为98%,各环节中不合格的一件产品所需的修复费用均为100元,求一件产
品需修复的平均费用.
附:对于一组数据 , ,…, ,其回归直线 的斜率和截距的最小二乘估计分
别为 , .
【答案】(1) 更适合
(2) ,18万元
(3) (元)
【解析】(1)解:由散点图判断 更适合作为间接生产成本y与该产品的生产数量x的回归方程
类型;
(2)解:令 ,先建立y关于 的线性回归方程,
,
,
∴y关于 的线性回归方程为 ,
∴y关于x的回归方程为 ,当 时, ,即生产9千件产品时,间接生产成本
是18万元;
(3)解:设每件产品需修复的环节为 个,则 , ,设一件产品需修复的费用为 元,则 , (元).
4.(2022·广东·铁一中学高三期末) 年 月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播
途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在 月
日至 日累计确诊人数如下表:
日期( 月) 日 日 日 日 日 日 日
人数(人)
由上述表格得到如散点图( 月 日为封城第一天).
(1)根据散点图判断 与 ( , 均为大于 的常数)哪一个适宜作为累计确诊人数 与
封城后的天数 的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;
(2)随着更多的医护人员投入疫情的研究, 月 日武汉影像科医生提出存在大量核酸检测呈阴性(阳
性则确诊),但观其 肺片具有明显病变,这一提议引起了广泛的关注, 月 日武汉疾控中心接收了
份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概
率为 ,核酸试剂能把阳性样本检测出阳性结果的概率是 (核酸检测存在阳性样本检测不出来的情
况,但不会把阴性检测呈阳性),求这 份样本中检测呈阳性的份数的期望.
参考数据:
其中 , ,参考公式:对于一组数据 , ,…, ,其回归直线的斜率和截距的最小二乘估计公式分别为 , .
【答案】(1)选择 , 关于 的回归方程为 ;(2)期望为 人.
【解析】(1)由散点图可知选择 ,
由 两边同时取常用对数得 ,
设 , .
计算 , , ,
,
把样本中心点 代入 得 .
, 关于 的回归方程为 ;
(2)这 份样本中检测呈阳性的份数为 ,
则每份检测出阳性的概率 ,
由题意可知 , (人),
故这 份样本中检测呈阳性份数的期望为 人.
5.(2022·山西·二模(理))数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高
速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的
代码依次为1-5.
年份代码x 1 2 3 4 5
市场规模y 3.98 4.56 5.04 5.86 6.36
(1)由上表数据可知,可用函数模型 拟合y与x的关系,请建立y关于x的回归方程( , 的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机
抽取4人,记这4人中选择在品牌官方直播间购物的人数为X,若 ,求X的分布列与
期望.
参考数据: , , ,其中 .
参考公式:对于一组数据 , ,…, ,其回归直线 的斜率和截距的最小二乘
估计公式分别为 , .
【答案】(1)
(2)分布列见解析;期望为
【解析】(1)解:设 ,则 ,
因为 , , ,
所以 .
把 代入 ,得 .
即 关于 的回归方程为 .
(2)
解:由题意知 ,
, ,由 得
所以, 的取值依次为0,1,2,3,4,
, ,
, ,
,
所以X的分布列为
X 0 1 2 3 4
P