文档内容
第八章 成对数据的统计分析(提高卷)
姓名:__________________ 班级:______________ 得分:_________________
注意事项:
本试卷满分150分,考试时间1200分钟,试题共23题.答卷前,考生务必用0.5毫米黑色签字笔将
自己的姓名、班级等信息填写在试卷规定的位置.
一、选择题(本大题共12小题,每小题5分,共60分)在每小题所给出的四个选项中,只有一项是符合
题目要求的.
1.有以下几组(x,y)的统计数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下
的
数据具有较强的相关关系,应去掉的一组数据是( )
A.(3,10) B.(10,12) C.(1,2) D.(4,5)
【答案】A
【分析】在坐标系中画出五个点,结果除去(3,10)之外,其余的点都在一条线附近,去掉这个点以后
剩下的数据更具有相关关系
【解答】解:∵(1,2),(2,4),(4,5),(3,10),(10,12),
在坐标系中画出五个点,结果除去(3,10)之外,其余的点都在一条线附近,
∴去掉这个点以后剩下的数据更具有相关关系,
故选:A.
【知识点】回归分析、变量间的相关关系
2.根据如表的数据,用最小二乘法计算出变量x,y的线性回归方程为( )
x 1 2 3 4 5
y 0.5 1 1 1.5 2
A. B.
C. D.
【答案】A
【分析】由已知求得与的值,则线性回归方程可求.
【解答】解: , ,
=0.35, ,
∴y关于x的线性回归方程为 .
故选:A.
【知识点】线性回归方程
3.某企业一种商品的产量与单位成本数据如表:
产量x(万件) 2 3 4
单位成本y(元/件) 3 a 7
现根据表中所提供的数据,求得y关于x的线性回归方程为=2x﹣1,则a值等于( )A.4.5 B.5 C.5.5 D.6
【答案】B
【分析】由已知表格中的数据求得与的值,代入线性回归方程求解a值.
【解答】解: , ,
代入线性回归方程为=2x﹣1,得 ,
解得a=5.
故选:B.
【知识点】线性回归方程
4.若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,
如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.9亿元 B.9.5亿元 C.10亿元 D.10.5亿元
【答案】D
【分析】将所给数据代入y=bx+a+e,利用|e|≤0.5,即可求得结论.
【解答】解:∵某地的财政收入x与支出y满足的线性回归模型是y=bx+a+e(单位:亿元),其中b=
0.7,a=3,
∴y=0.7x+3+e
当x=10时,y=0.7x+3+e=10+e.
∵|e|≤0.5,∴﹣0.5≤e≤0.5
∴9.5≤y≤10.5,
∴今年支出预计不超出10.5亿元.
故选:D.
【知识点】线性回归方程
5.已知如表为x与y之间的一组数据,若y与x线性相关,则y与x的回归直线y=bx+a必过点( )
x 0 1 2 3
y 1 3 5 7
A.(2,2) B.(1.5,0) C.(1,2) D.(1.5,4)
【答案】D
【分析】由已知求得样本点的中心的坐标得答案.
【解答】解:∵ , ,
∴样本点的中心的坐标为(1.5,4),
∴y与x的回归直线y=bx+a必过点(1.5,4),
故选:D.
【知识点】线性回归方程
6.已知变量x,y之间的一组数据如表:
x 3 4 5 6
y 2.5 3 4 4.5
若y关于x的线性回归方程为 ,则=( )
A.0.1 B.0.2 C.0.35 D.0.45
【答案】C【分析】求出样本中心坐标,代入回归直线方程,求解即可.
【解答】解:由题意可知= =4.5.
= =3.5.
因为回归直线经过样本中心,
所以3.5=0.7×4.5+,
解得=0.35.
故选:C.
【知识点】线性回归方程
7.已知变量x,y之间具有线性相关关系,其回归方程为=ax﹣(1﹣a),若 ,则a的值为( )
A. B. C. D.1
【答案】A
【分析】由已知求得样本点的中心的坐标,代入线性回归方程即可求得a值.
【解答】解:由 ,
得 , ,
∴样本点的中心的坐标为( ),
代入=ax﹣(1﹣a),得 ,
解得:a= .
故选:A.
【知识点】线性回归方程
8.已知变量x,y之间的线性回归方程为 ,且变量x,y之间的一组相关数据如表所示,则下列说法错
误的是( )
x 6 8 10 12
y 6 m 3 2
A.可以预测,当x=20时,
B.m=5
C.变量x,y之间呈负相关关系
D.该回归直线必过点(8,5)
【答案】D
【分析】由线性回归方程恒过样本点的中心逐一核对四个选项得答案.
【解答】解:对于A选项,当x=20时, ,A选项正确;
对B选项, ,
将点(,)的坐标代入回归直线方程,得 ,解得m=5,B选项正确;
对于C选项,由于回归直线方程的斜率为负,则变量x,y之间呈负相关关系,C选项正确;
对于D选项,由B选项可知,回归直线 必过点(9,4),D选项不正确.
故选:D.
【知识点】线性回归方程
9.“独立性检验”中在犯错误的概率不超过 0.05的前提下认为事件 A和B有关,则算出的数据满足
( )
A.k2<6.63 B.k2<3.84 C.k2>3.84 D.k2>6.63【答案】C
【分析】通过K的观测值K2,对照题目中的表格,得出统计结论.
【解答】解:根据观测值
P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
概率不超过0.05对应的k值为3.841,
故选:C.
【知识点】独立性检验
10.对具有线性相关关系的两个变量x,y,测得一组数据如表所示:
x 2 4 5 6 8
y 20 m 60 70 n
根据上表,利用最小二乘法得到他们的回归直线方程为 ,则m+n=( )
A.119 B.120 C.129 D.130
【答案】B
【分析】由已知表格中的数据求得样本点的中心的坐标,代入线性回归方程求解m+n的值.
【解答】解:∵ , ,
∴样本点的中心的坐标为(5, ),代入线性回归方程,
得 ,解得m+n=120.
故选:B.
【知识点】线性回归方程
11.如图是某地区2010年至2019年污染天数y(单位:天)与年份x的折线图.根据2010年至2014年数
据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型=bx+a, ,则
1 1
( )
A.b<b<b,a<a<a B.b<b<b,a<a<a
1 2 3 1 2 3 1 3 2 1 3 2
C.b<b<b,a<a<a D.b<b<b,a<a<a
2 3 1 1 3 2 2 3 1 3 2 1
【答案】C【分析】在散点图中作出三条线性回归方程对应直线的大致形状,数形结合得答案.
【解答】解:不妨设l:=bx+a,l: ,l: ,
1 1 1 2 3
由线性回归方程恒过样本点的中心,可知三条回归直线方程的大致形状如图:
由图可知,b<b<b,a<a<a.
2 3 1 1 3 2
故选:C.
【知识点】线性回归方程
12.小明同学在做市场调查时得到如下样本数据
x 1 3 6 10
y 8 a 4 2
他由此得到回归直线的方程为=﹣2.1x+15.5,则下列说法正确的是( )
①变量x与y线性负相关②当x=2时可以估计y=11.3
a=6 变量x与y之间是函数关系
③A.①④ B.①② C.①②③ D.①②③④
【答案】C
【分析】由线性相关系数判定①;在回归直线方程中取x=2求得y值判定②;求出样本点的中心坐标,
代入回归直线方程求得a值判断③;由回归直线方程的意义说明④错误.
【解答】解:由回归直线的方程为=﹣2.1x+15.5,可知变量x与y线性负相关,故①正确;
当x=2时, ,故②正确;
∵ , ,∴样本点的中心坐标为(5, ),
代入=﹣2.1x+15.5,得 ,解得a=6,故③正确;
变量x与y之间具有线性负相关关系,不是函数关系,故④错误.
∴说法正确的是①②③.
故选:C.
【知识点】线性回归方程
二、填空题(本大题共4小题,每小题5分,共20分.不需写出解答过程,请把答案直接填写在横线
上)
13.对两个变量的相关系数r,有下列说法:(1)|r|越大,相关程度越大;(2)|r|越小,相关程度越大;(3)|r|趋近于0时,没有非线性相关系数;(4)|r|越接近于1时,线性相关程度越强,其中正确的是
.
【答案】(1)、(4)
【分析】用相关系数r衡量两个变量之间的相关关系强弱时,
r的绝对值越接近于1,表示两个变量的线性相关性越强,
r的绝对值越接近于0,表示两个变量的线性相关性越弱,由此得到答案.
【解答】解:对于(1),|r|越大,相关程度越大,命题(1)正确;
对于(2),|r|越小,相关程度越小,命题(2)错误;
对于(3),|r|趋近于0时,线性相关关系越弱,命题(3)错误;
对于(4),|r |越接近于1时,线性相关程度越强,命题(4)正确.
综上,正确的命题是(1)、(4).
故答案为:(1)、(4).
【知识点】变量间的相关关系
14.已知变量x和y线性相关,其一组观测数据为(x ,y ),(x ,y ),(x ,y ),(x ,y ),(x ,
1 1 2 2 3 3 4 4 5
y ),由最小二乘法求得回归直线方程为y=0.67x+50.9.若已知x+x+x+x+x =150,则y+y+y+y+y
5 1 2 3 4 5 1 2 3 4 5
= .
【答案】355
【分析】由已知求得,代入线性回归方程求得,则y+y+y+y+y 可求.
1 2 3 4 5
【解答】解:由x+x+x+x+x=150,得 ,
1 2 3 4 5
再由( )在直线y=0.67x+50.9上,
得 ,
∴y+y+y+y+y= .
1 2 3 4 5
故答案为:355.
【知识点】线性回归方程
15.某公司一种新产品的销售额y与宣传费用x之间的关系如表:
x(单位:万元) 0 1 2 3 4
y(单位:万元) 10 15 20 30 35
已知销售额y与宣传费用x具有线性相关关系,并求得其回归直线方程为 ,则的值为 .
【答案】6.5
【分析】由表中数据计算平均数,代入回归直线方程中求得回归系数.
【解答】解;由表中数据,计算 ,
,
又归直线方程为 过样本中心点(2,22)得,
,
解得 .
故答案为:6.5.
【知识点】线性回归方程
16.为了判断高中三年级学生是否选择文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科
男 13 10
女 7 20
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2的观测值 ,则有 以上把握认为选择文科与性别有关系.
【答案】95%
【分析】根据条件中所给的观测值,同所给的临界值进行比较,根据4.844>3.841,有1﹣0.05=95%的把
握认为选修文科与性别有关系.
【解答】解:∵根据表中数据,得到K2的观测值k= ≈4.844
4.844>3.841,
∴有1﹣0.05=95%的把握认为选修文科与性别有关系,
故答案为:95%
【知识点】独立性检验
三、解答题(本大题共6小题,共70分.请在答题卡指定区域内作答,解答时应写出文字说明、证明过
程或演算步骤)
17.某种产品的广告费支出x与销售额y(单位:百万元)之间有如表对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
参考公式:用最小二乘法求线性回归方程系数公式= ,=﹣b.
(1)画出散点图;
(2)求线性回归方程;
(3)预测当广告费支出7(百万元)时的销售额.
【分析】(1)根据表中数据画出散点图即可;
(2)由表中数据计算平均数和回归系数,写出回归方程;
(3)利用线性回归方程计算x=7时的值,即可得出预测结果.
【解答】解:(1)画出散点图如图所示:(2)由表中数据,计算= ×(2+4+5+6+8)=5,
= ×(30+40+60+50+70)=50,
(x﹣)(y﹣)=﹣3×(﹣20)+(﹣1)×(﹣10)+0×10+1×0+3×20=130,
i i
(x﹣)2=9+1+0+1+9=20,
i
则= =6.5,=﹣ =17.5,
所以y关于x的线性回归方程是=6.5x+17.5;
(3)利用线性回归方程,计算x=7时,=6.5×7+17.5=63;
预测当广告费支出7百万元时,销售额为63百万元.
【知识点】线性回归方程
18.自湖北武汉爆发新型冠状病毒肺炎疫情以来,在以习近平总书记为核心的党中央的正确领导和指挥下,
全国各地纷纷驰援,湖北的疫情形势很快得到了控制,但是国际疫情越来越严重,医用口罩等物资存
在很大缺口.某口罩生产厂家复工复产后,抢时生产口罩,以驰援国际社会,已知该企业前10天生产
的口罩量如表所示:
第x天 1 2 3 4 5 6 7 8 9 10
产量y(单 76.0 88.0 96.0 104.0 111.0 117.0 124.0 130.0 135.0 140.0
位:万个)
对上表的数据作初步处理,得到一些统计量的值:
y (x﹣)2 (y﹣)2 (x﹣)(y﹣)
i i i i i
m n 1121.0 82.5 3998.9 570.5
(1)求表中m,n的值,并根据最小二乘法求出y关于x的线性回归方程=x+(回归方程系数精确到
0.1);
(2)某同学认为y=px2+qx+r更适宜作为y关于x的回归方程模型,并以此模型求得回归方程为 y=﹣
x2+10x+68.经调查,该企业第11天的产量为145.3万个,与(1)中的线性回归方程比较,哪个回归方程
的拟合效果更好?并说明理由.
附:= = ,=﹣ .
【分析】(1)计算平均数可求表中m,n的值,结合参考数据并根据最小二乘法公式可求出y关于x的线
性回归方程=x+;
(2)利用模型模拟第11天的产量与实际进行比较可得答案.
【解答】解:(1)样本平均数=5.5,=112.1,
∴由最小二乘法公式求得= = ≈6.9,=﹣ =112.1﹣6.9×5.5=74.2,
即所求回归方程为: .
(2)由(1)可知,用线性回归方程模型求得该企业第11天的产量为y=6.9×11+74.2=150.1
(万个)
用题中的二次函数模型求得回归方程为y=﹣ x2+10x+68.经调查,该企业第11天的产量为
145.3万个,
与第11天的实际数据进行比较发现|150.1﹣145.3|>|145﹣145.3|;所以用这个二次函数模型的回归方程来拟合效果会更好.
【知识点】线性回归方程
19.近几年来,热饮越来越受到年轻人的欢迎.一个研究性学习小组为了研究气温对热饮销售的影响,统
计了学校门口一个热饮店在2019年1月份某6天白天的平均气温和热饮销售量,得到以下数据:
x气温/℃ ﹣2 0 3 6 10 13
y销售量/杯 161 146 138 133 120 112
(1)求销售量关于气温的回归直线方程,若某天白天的平均气温为16℃,估计当天的热饮销售量;
(2)根据表格中的数据计算R2(精确到0.001),由此解释平均气温对销售量变化的影响.
参考公式: , ; .
【分析】(1)求出与的值,可得线性回归方程,取x=16求得y值即可;
(2)由已知数据求得R2得结论.
【解答】解:(1)由已知表格中的数据,得 , ,从而:
x ﹣2 0 3 6 10 13
y 161 146 138 133 120 112
﹣7 ﹣5 ﹣2 1 5 8
26 11 3 ﹣2 ﹣15 ﹣23
∴ , ,
解得: , .
∴气温预报销售量的回归直线方程为: .
当x=16时, .
因此,某天白天的平均气温为16℃时,估计可以卖出102杯热饮;
(2)求得与 的值如下表:
x ﹣2 0 3 6 10 13
y 161 146 138 133 120 112
156 150 141 132 120 111
5 ﹣4 ﹣3 1 0 1
∴ , .
得 .
∴销售量变化有96.7%是由平均气温引起的.
【知识点】线性回归方程
20.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果
如表:
男 女需要 40 m
不需要 n 270
若该地区老年人中需要志愿者提供帮助的比例为14%.
(1)求m,n的值;
(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?
参加公式:K2= .
P(K2≥k ) 0.050 0.010 0.001
0
k 3.841 6.635 10.828
0
【分析】(1)根据老年人中需要志愿者提供帮助的比例为14%和总人数为500人列方程求解即可得答案;
(2)根据列联表所给的数据,代入随机变量的观测值公式,得到观测值的结果,把观测值与
临界值进行比较,即可得到结论.
【解答】解:(1)因为调查的500位老年人中有40+m位需要志愿者提供帮助,
所以 ,
解得m=30,n=160;
(2)K2 的观测值 ,
=
因为9.967>6.635,
所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.
【知识点】独立性检验
21.某地随着经济的发展,居民收入逐年增大,如表是该地一农业银行连续五年的储蓄存款(年底余额),
如下表:
年份x 2013 2014 2015 2016 2017
储 蓄 存 款 y5 6 7 8 9
(亿元)
为了研究方便,工作人员将上表的数据进行了处理,t=x﹣2012,得到如表:
时间代号t 1 2 3 4 5
y 5 6 7 8 10
(1)求y关于t的线性回归方程;
(2)求y关于x的线性回归方程;
(3)用所求回归方程预测,到2020年底,该地储蓄存款额大约可达多少?
(附:线性回归方程 ,= ,= )
【分析】(1)求出样本中心坐标,回归直线方程的系数,然后求解回归直线方程.
(2)通过t=x﹣2012与 ,真假写出回归直线方程即可.
(3)将2020代入 有 ,推出结果.【解答】解:(1)= =3,= (5+6+7+8+10)=7.2,
,
∵ ,∴ ,
∵ ,∴ ,
∴ .
(2)∵t=x﹣2012与 ,
∴ ,即y=1.2x﹣2410.8.
(3)将2020代入 有 ,
所以到2020年底,该地储蓄存款额大约可达13.2亿元.
【知识点】线性回归方程
22.下面给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线
性回归方程的残差图(2012年~2018年的年份代码x分别为1~7).
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得 y=1074, xy=4517,求y关于x的线性回归方程;
i i i
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果(精确到0.01)
附:回归方程 中斜率和截距的最小二乘估计公式分别为: .
【分析】(1)根据散点图可以看出,散点均匀的分布在一条直线附近,故y与x成线性相关;
(2)根据给出信息,分别计算出x,y的平均值,代入最小二乘法估计公式,即可得到回归方
程;
(3)根据所给残差图分别区域的宽度分析即可.
【解答】解:(1)根据散点图可知,散点均匀的分布在一条直线附近,且随着x的增大,y增大,故y与
x成线性相关,且为正相关;
(2)依题意,= (1+2+3+4+5+6+7)=4,
= y= 1074≈153.43,
i= = = ≈7.89,
=﹣ =154.43﹣7.89×4=121.87,
所以y关于x的线性回归方程为:
=7.89x+121.87;
(3)由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较
好,回归方程的预报精度较高.
【知识点】线性回归方程