文档内容
课时跟踪检测(五十二) 变量间的相关性与统计案
例
一、综合练——练思维敏锐度
1.(2020·全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:
℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x,y)(i=1,2,…,20)
i i
得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温
度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该
是对数函数类型的,故应该选用的函数模型为y=a+bln x.
2.(多选)(2021·济宁模拟)下列说法正确的是( )
A.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差
B.某地气象局预报:6月9日本地降水概率为90%,结果这天没下雨,这表明天气预报
并不科学
C.回归分析模型中,残差平方和越小,说明模型的拟合效果越好
D.在回归直线方程y=0.1x+10中,当解释变量每增加1个单位时,预报变量增加0.1个
单位
解析:选CD 对A项,在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表
示回归效果越好,故A错误;对B项,概率只说明事件发生的可能性,某次事件不一定发生,
所以并不能说明天气预报不科学,故B错误;对C项,在回归分析模型中,残差平方和越小,
说明模型的拟合效果越好,故C正确;对D项,在回归直线方程y=0.1x+10中,当解释变量
x每增加1个单位时,预报变量y增加0.1个单位,故D正确,故选C、D.
3.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,
由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是y=
bx+48,则当原材料支出费用为40时,预估销售额为( )
x 10 15 20 25 30
y 110 125 160 185 220
A.252 B.268
C.272 D.288解析:选C 由题意得=20,=160,将点代入回归方程y=bx+48中,得b=5.6,∴回归
方程为y=5.6x+48,∴当x=40时,y=272,故选C.
4.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某
机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线 一线 总计
愿生 45 20 65
不愿生 13 22 35
总计 58 42 100
计算得,K2≈9.616.
参照下表,
P(K2≥k) 0.050 0.010 0.001
0
k 3.841 6.635 10.828
0
下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:选C 因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别
有关”,故选C.
5.(多选)我国5G技术研发试验在2016~2018年进行,分为5G关键技术试验、5G技术
方案验证和5G系统验证三个阶段.2020年初以来,5G技术在我国已经进入高速发展的阶段,
5G手机的销量也逐渐上升.某手机商城统计了近5个月来5G手机的实际销量,如下表所示:
2020年 2020年 2020年 2020年 2020年
月份
8月 9月 10月 11月 12月
月份编号x 1 2 3 4 5
销量y/部 50 96 a 185 227
若y与x线性相关,且求得线性回归方程为y=45x+5,则下列说法正确的是( )
A.a=142
B.y与x正相关
C.y与x的相关系数为负数
D.2021年2月该手机商城的5G手机销量约为365部
解析:选AB ==3,
==,因为点(,)在回归直线上,所以=45×3+5,解得a=142,所以选项A正确;
从表格数据看,y随x的增大而增大,所以y与x正相关,所以选项B正确;
因为y与x正相关,所以y与x的相关系数为正数,所以选项C错误;
2021年2月对应的月份编号x=7,当x=7时,y=45×7+5=320,所以2021年2月该
手机商城的5G手机销量约为320部,所以选项D错误.故选A、B.
6.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色
等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地
上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜
后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:
夜晚天气
下雨 未下雨
日落云里走
出现 25 5
未出现 25 45
临界值表
P(K2≥k) 0.10 0.05 0.010 0.001
0
k 2.706 3.841 6.635 10.828
0
并计算得到K2≈19.05,下列小波对地区A天气判断正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
解析:选D 由题意,把频率看作概率可得夜晚下雨的概率约为=,故A判断正确;未出
现“日落云里走”,夜晚下雨的概率约为=,故B判断正确;由K2≈19.05>10.828,根据临界
值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故
C判断正确,D判断错误,故选D.
7.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入
x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关
关系,并由调查数据得到y与x的回归直线方程为y=0.15x+0.2.由回归直线方程可知,家庭
年收入每增加1万元,则年教育支出平均增加________万元.
解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增
加0.15万元.
答案:0.15
8.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个
结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代
数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题 代数题 总计
男同学 22 8 30
女同学 8 12 20
总计 30 20 50
根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超
过________.
附表:
P(K2≥k) 0.10 0.05 0.025 0.010 0.001
0
k 2.706 3.841 5.024 6.635 10.828
0
解析:由列联表计算K2的观测值k=≈5.556>5.024.∴推断犯错误的概率不超过0.025.
答案:0.025
9.(2021·甘肃兰州一诊)近五年来某草场羊只数量与草地植被指数两变量间的关系如表
所示,绘制相应的散点图,如图所示:
年份 1 2 3 4 5
羊只数量/万只 1.4 0.9 0.75 0.6 0.3
草地植被指数 1.1 4.3 15.6 31.3 49.7
根据表及图得到以下判断:
①羊只数量与草地植被指数成减函数关系;
②若利用这五组数据得到的两变量间的相关系数为r,去掉第一年数据后得到的相关系
1
数为r,则|r|<|r|;
2 1 2
③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.
以上判断中正确的个数是________.
解析:对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;
对于②,用这五组数据得到的两变量间的相关系数为r,因为第一年数据(1.4,1.1)是离群值,
1
去掉后得到的相关系数为r,其相关性更强,所以|r|<|r|,②正确;对于③,利用回归直线方
2 1 2
程,不能准确得到当羊只数量为2万只时的草地植被指数,得到的只是预测值,所以③错误.
综上知,正确的判断序号是②,共1个.
答案:1
10.(2021·佛山质检)“学习强国”APP是由中宣部主管以习近平新时代中国特色社会
主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学
习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某
两天在“学习强国”APP上所得的分数统计如表(1)所示:
表(1)
分数 [60,70) [70,80) [80,90) [90,100]
人数 50 100 20 30
(1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机
选取2人作为学习小组长,求所选取的两位小组长的分数都在上的概率;
(2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取
了机关事业单位党员以及国有企业党员作出调查,得到的数据如表所示:
表(2)
机关事业单位党员 国有企业党员
分数超过80 220 150
分数不超过80 80 50
判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.
附:K2=,n=a+b+c+d.
P(K2≥k) 0.100 0.050 0.010 0.001
0
k 2.706 3.841 6.635 10.828
0
解:(1)由题意得,分数在上抽取2人,记为a,b;分数在上抽取3人,记为A,B,C.
选取2人作为学习小组长的基本事件有10个,即(a,b),(a,A),(a,B),(a,C),(b,A),(b,
B),(b,C),(A,B),(A,C),(B,C),其中两位小组长的分数都在上的有(A,B),(A,C),(B,C)共
3个基本事件,∴所求概率P=.
(2)完善表格如下:
机关事业单位党员 国有企业党员 总计
分数超过80 220 150 370
分数不超过80 80 50 130
总计 300 200 500
K2=≈0.173<6.635,
故没有99%的把握认为“学习强国”APP得分情况受所在单位的影响.
11.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关
系进行分析研究并做了记录,得到如下资料:
日期 第一年 第二年 第三年 第四年
优惠金额x/千元 10 11 13 12
销售量y/辆 22 24 31 27
(1)求出y关于x的线性回归方程y=bx+a;(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.
参考公式:b=,a=-b.
解:(1)由题中数据可得=11.5,=26,∑xy=1 211,
i i
∑x=534,
∴b====3,
故a=-b=26-3×11.5=-8.5,
∴y关于x的线性回归方程为y=3x-8.5.
(2)由(1)得,当x=8.5时,y=17,
∴第5年优惠金额为8.5千元时,销售量估计为17辆.
二、自选练——练高考区分度
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销
售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x和年销售量y(i=1,
i i
2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(x
i
-)· (wi -)·
(x
i
-)2 (wi -)2
(y-)
i (y-)
i
46.6 563 6.8 289.8 1.6 1 469 108.8
表中 wi =,= i .
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的
回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.
根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u
1
,
v1
),(u
2
,
v2
),…,(u
n
,
vn
),其回归直线v=α+βu的斜率和截距的
最小二乘估计分别为
β=,α=-β.解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类
型.
(2)令
w
=,先建立y关于
w
的线性回归方程,由于
d===68,
c=-d=563-68×6.8=100.6.
所以y关于
w
的线性回归方程为y=100.6+68w ,
因此y关于x的回归方程为y=100.6+68.
(3)①由(2)知,当x=49时,
年销售量y的预报值y=100.6+68=576.6,
年利润z的预报值z=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值
z=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,z取得最大值,
故年宣传费为46.24千元时,年利润的预报值最大.