文档内容
第八章 成对数据的统计分析 ---B提高练
一、选择题
1.(2021·黑龙江大庆市·大庆实验中学高二月考(理))下列数据中,拟合效果最好的回归直线方
程,其对应的相关指数 为( )
A. B. C. D.
【答案】D
【详解】因为相关指数 越大,拟合效果更好,故选:D
2.(2021·安徽省舒城中学高二期末)某产品的广告费用 与销售额 的统计数据如下表:
广告费用 (万元) 2 3 4 5 6
销售额 (万元) 19 25 34 38 44
根据上表可得回归直线方程为 ,下列说法正确的是( )
A.回归直线 必经过样本点 、
B.这组数据的样本中心点 未必在回归直线 上
C.回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元
D.据此模型预报广告费用为7万元时销售额为50.9万元
【答案】D
【详解】回归直线 ,不一定经过任何一个样本点,故 A错;
由最小二乘法可知,这组数据的样本中心点 一定在回归直线 上,故B错;
回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C错;
, ,
将 代入 可得 ,则回归方程为 ,
时, ,故D正确.故选:D.3.(2021·吉林长春市高二)2019年10月18日至27日,第七届世界军人运动会在湖北武汉举办,
中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,
研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与
调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为 ;②在犯错误的
概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%
的把握认为“是否对主办方表示满意与运动员的性别有关”.
男性运动员 女性运动员
对主办方表示满意 200 220
对主办方表示不满意 50 30
则正确说法的个数为( )
A.0 B.1 C.2 D.3
【答案】B
【解析】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为 ,故①错误;
,故②错误,③正确.故选:B.
4.(2021·全国高二专题练)下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
【答案】B
【解析】对于A,根据相关关系的定义,即可判断自变量取值一定时,因变量的取值带有一定随机
性的两个变量之间的关系是相关关系,∴命题A正确;
对于B,线性回归分析中,相关系数r的绝对值越接近1,两个变量的线性相关性越强,
反之,线性相关性越弱,∴命题B错误;
对于C,残差图中,对于一组数据拟合程度的好坏评价,是残差点分布的带状区域宽度越狭窄,其
模型拟合的精度越高,∴命题C正确;对于D,回归分析中,用相关指数R2刻画回归效果时,R2的值越大说明模型拟合效果越好,∴R2
为0.98的模型比R2为0.80的模型拟合效果好,命题D正确.故选:B.
5.(多选题)(2021·江苏南通市高二期末)已知由样本数据点集合 ,求
得的回归直线方程为 ,且 ,现发现两个数据点(1.2,2.2)和(4.8, 误差较大,
去除后重新求得的回归直线 的斜率为1.2,则( )
A.变量 与 具有正相关关系
B.去除后 的估计值增加速度变快
C.去除后 方程为
D.去除后相应于样本点 的残差平方为
【答案】ACD
【详解】由样本数据点集合 ,回归直线方程为 ,且 ,
得到 ,去除掉两个数据点(1.2,2.2)和(4.8,7.8),因为 ,
所以去除掉两个数据点后, , 仍然成立,因为直线方程 ,将 ,
代入求得 ;故A选项正确;因为 ,所以B选项错误;由上知C选项正确;
去除后,当 , 相应于样本点 的残差平方为 ,故D选
项正确;故选:ACD.
6.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调
查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女
生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人
附表:
α 0.050 0.010
x 3.841 6.635
α
附:χ2=A.25 B.45 C.60 D.75
【答案】BCD
【详解】设男生可能有x人,依题意可得列联表如下:
喜欢抖音 不喜欢抖音 合计
男生 x x x
女生 x x x
合计 x x 2x
若有95%的把握认为是否喜欢抖音和性别有关,则χ2>3.841,由χ2=>3.841,解得x>40.335,由题
意知x>0,且x是5的整数倍,所以45,60和75都满足题意.故选BCD.
二、填空题
7.(2021·湖北高二月考)某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进
行调查统计,得出y与x具有线性相关关系,且回归方程为 .若某城市职工人均工资
为5千元,估计该城市人均消费额占人均工资收入的百分比为________.
【答案】84%
【解析】因为y与x具有线性相关关系,满足回归方程 ,该城市居民人均工资为
,所以可以估计该城市的职工人均消费水平 ,所以可以估计该城市人
均消费额占人均工资收入的百分比为 84%.
8.(2021·全国高二课时练)某学校为了制订治理学校门口,上学、放学期间家长接送孩子乱停车
现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下
的列联表:
同意限定区域停车 不同意限定区域停车 合计
男 20 5 25
女 10 15 25
合计 30 20 50
则认为“是否同意限定区域停车与家长的性别有关”的把握约为____________.
【答案】99.5%【详解】因为 ,又 ,
所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.
9.(2021·青铜峡市高级中学高二期末)为了研究某班学生的脚长 (单位:厘米)和身高 (单位:
厘米)的关系,从该班随机抽取 名学生,根据测量数据的散点图可以看出 与 之间有线性相关
关系,设其回归直线方程为 .已知这组数据的样本中心点为 , ,若该班某学
生的脚长为 厘米,据此估计其身高为________厘米.
【答案】
【详解】根据题意,计算 , , ;
∴ ,∴ ,
当 时,计算 ,据此估计其身高为 (厘米).
10.(2021·黑龙江大庆市高二月考).世界20个地区受教育程度的人口百分比与人均收入的散点图
如图所示,样本点基本集中在一个条型区域,因此两个变量具有线性相关关系.利用散点图中的数据建
立的经验回归方程为^=3.193x+88.193.若受教育程度的人口百分比相差10%,则其人均收入相差
y
美元.
【答案】31.93【详解】设受教育程度的人口百分比分别为a%,b%,且a-b=10,根据经验回归方程为^
y
=3.193x+88.193,
可知收入相差大约为3.193×a+88.193-(3.193×b+88.193)=3.193×10=31.93,即受教育程度的人口百分
比相差10%,则其人均收入相差约31.93美元.
三、解答题
11.(2021·河南驻马店市)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开
通共享单车的 县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年
使用人次进行了统计,得到了投放量 (单位:千辆)与年使用人次 (单位:千次)的数据如下
表所示,根据数据绘制投放量 与年使用人次 的散点图如图所示.
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型 或指数函
数模型 对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量 与年
使用人次 的回归方程类型(给出判断即可,不必说明理由),并求出 关于 的回归方程;
(2)已知每辆单车的购入成本为 元,年调度费以及维修等的使用成本为每人次 元,按用
户每使用一次,收费 元计算,若投入 辆单车,则几年后可实现盈利?
参考数据:其中 , .
参考公式:对于一组数据 , ,…, ,其回归直线 的斜率和截距
的最小二乘估计公式分别为 , .
【答案】(1) 适宜, ;(2)6年.
【解析】(1)由散点图判断, 适宜作为投放量 与年使用人次 的回归方程类型.
由 ,两边同时取常用对数得 .
设 ,则 .
因为 , , , ,
所以 .
把 代入 ,得 ,
所以 ,所以 ,
则 ,
故 关于 的回归方程为 .
(2)投入 千辆单车,则年使用人次为 千人次,每年的收益为 (千元),
总投资 千元,
假设需要 年开始盈利,则 ,即 ,
故需要 年才能开始盈利.
12.(2021·山东日照市高二)定向越野起源于欧洲,是一种借助地图、指南针,在一个划定的区域
内,通过对地形地貌的判断.设计合理路线到达各个目标点位,最后到达终点的运动.湖南青奠定向
体育发展有限公司为了推广定向活动,对学生群体进行定向越野的介绍和培训,并对初步了解了定
向活动的学生是否会参加定向越野活动进行调查.随机抽取了200位中小学生进行调查,得到如下数
据:准备参加定向越野的小学生有80人,不准备参加定向越野的小学生有40人,准备参加定向越
野的中学生有40人.
(1)完成下列 列联表,并根据列联表判断是否有97.5%的把握认为这200位参与调查的中小
学生是否准备参加定向越野与中学生、小学生年龄有关.
准备参加定向越野 不准备参加定向越野 合计
小学生
中学生
合计
(2)为了储备定向后备力量,备战全国赛,提高会员定向水平,俱乐部将小学生会员分组进行比
赛.两人一组,每周进行一轮比赛,每小组两人每人跑两张地图(跑一张地图视为一次),达到教练设
定的成绩标准的次数之和不少于3次称为“优秀小组”.小超与小红同一小组,小超、小红达到教练
设定的成绩标准的概率分别为 , ,且 ,理论上至少要进行多少轮比赛,才能使
得小超、小红小组在比赛中获得“优秀小组”次数的期望值达到16次?并求此时 , 的值.
附: , .
0.50 0.25 0.05 0.025 0.0100.455 1.323 3.840 5.024 6.635
【解析】(1)由题意得2×2列联表如下:
准备参加定向越野 不准备参加定向越野 合计
小学生 80 40 120
中学生 40 40 80
合计 120 80 200
因为 ,
所以有97.5%的把握认为这200位参与调查者是否准备参加定向越野与年龄有关.
(2)他们在一轮游戏中获“优秀小组”的概率为
∵ ,所以 .
∵ , ,∴ ,
又 ,∴ ,
∴ 可看成关于 的二次函数,
当 时, ,
当 或 时, .
∴ ,令 ,∴ ,∴ ,
当 时, ,他们小组在 轮游戏中获“优秀小组”次数 满足 ,
由 ,则 ,
所以理论上至少要进行27轮游戏.
此时 , , .