文档内容
第八章 成对数据的统计分析(能力提升)B 卷
姓名: 班级:
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一个选项是符
合题目要求的。
1.两个变量有线性相关关系且残差的平方和等于0,则( )。
A、样本点都在回归直线上 B、样本点都集中在回归直线附近
C、样本点比较分散 D、不存在规律
2.我国在有效防控疫情的同时积极有序推进复工复产,各旅游景区也逐渐恢复开放。某4A景区对重新开
放后的月份x与该月游客的日平均人数y(单位:千人/天)进行了统计分析,得出下表数据:
月份x 4 5 7 8
日平均人数y 1.9 3.2 t 6.1
若y与x线性相关,且求得其线性回归方程为 y=x−2 ,则表中t的值为( )。
A、4.7 B、4.8 C、5 D、无法确定
(x ,y ) (x ,y ) (x ,y ) y^=b^ x+a^ (x ,y )
3.已知数组 1 1 、 2 2 、…、 10 10 满足线性回归方程 ,则“ 0 0 满足线性回
x +x +¿⋅¿+x y +y +¿⋅¿+y
归方程
y^=b^ x+a^
”是“
x
0
=
10
1 2 10
、
y
0
=
10
1 2 10
”的( )。
A、充分不必要条件 B、必要不充分条件 C、充要条件 D、既不充分也不必要条件
500 500
4.某医疗研究所为了检验某种血清能起到预防感冒的作用,把 名使用血清的人与另外 名未使用血
清的人一年中的感冒记录作比较,利用2×2列联表计算得K2 的观测值k≈3.918
。
附表:
P(K2 ≥k ) 0.150 0.100 0.050 0.025 0.010 0.005 0.001
0
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )。
A、2.5% B、5%
C、
95%
D、
97.5%
5.观察下列散点图,其中两个变量的相关关系判断正确的是( )。
A、a为正相关,b为负相关,c为不相关
B、a为负相关,b为不相关,c为正相关
C、a为负相关,b为正相关,c为不相关
D、a为正相关,b为不相关,c为负相关
6.假设有两个分类变量X 和Y ,它们的可能取值分别为 {x 1 ,x 2 } 和 {y 1 ,y 2 } ,其2×2列联表如表,对于
以下数据,对同一样本能说明X和Y 有关系的可能性最大的一组为( )。
y y 总计
1 2
x a b a+b
1x c d c+d
2
总
a+c b+d a+b+c+d
计
A、a=6、b=7、c=8、d=9 B、a=8、b=6、c=9、d=7
C、a=9、b=8、c=6、d=8 D、a=9、b=8、c=7、d=6
n(ad−bc) 2
K2
=
7.已知: (a+b)(a+c)(c+d)(b+d) ,n=a+b+c+d。
P(K2 ≥k ) 0.050 0.010
0
k 3.841 6.635
0
在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中
1 1
2 6
被调查的女生人数是男生人数的 ,男生喜欢数学文化的人数占男生人数的 ,女生喜欢数学文化的人数
2
3 99%
占女生人数 ,若有 的把握认为是否喜欢数学文化和性别有关,则男生至少有( )。
A、 18 人 B、 20 人 C、22人 D、24人
8.某同学用收集到的6组数据对 (x
i
,y
i
) (i=1、2、3、4、5、6)制作成如图所示的散点图(点旁的
l y^=b^ ⋅x+a^ r
数据为该点坐标),并由最小二乘法计算得到回归直线 1的方程: 1 1,相关系数为 1,相关指数
R2
为 1;经过残差分析确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据
l y^=b^ ⋅x+a^ r R2
计算得到回归直线 2的方程: 2 2,相关系数为 2,相关指数为 2。则以下结论中,不正确的
是( )。
r >0 r >0
A、 1 、 2
b^ >0 b^ >0
B、 1 、 2
b^ >b^
C、 1 2
R2 >R2
D、 1 2
二、多项选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。
9.下面关于K2
的说法错误的是( )。
A、K2
在任何相互独立的问题中都可以用于检验有关还是无关
B、K2
的值越大,两个事件的相关性就越大
C、K2 是用来判断两个分类变量是否相关的随机变量,当K2
的值很小时可以推定两类变量不相关
n(ad−bc)
K2
=
D、K2
的计算公式是
(a+b)(a+c)(c+d)(b+d)
10.对四对变量Y 与x进行线性相关检验,已知n是观测值组数,r是相关系数,则变量Y 和x具有线性
相关关系的是( )。A、n=7、r=0.9533 B、n=15 、r=0.3012 C、n=17 、r=0.4991 D、n=3、r=0.9950
11.下列说法中,正确的命题是( )。
kx
A、以模型
y=c⋅e
去拟合一组数据时,为了求出回归方程,设
z=lny
,将其变换后得到线性方程
z=0.3x+4,则c、k的值分别是 e4 和0.3
B、设有一个回归直线方程 y^=3−5x ,变量x增加1个单位时, y^ 平均增加5个单位
C、线性回归方程
y^=b^ x+a^ 必经过样本点的中心(¯x,¯y)
D、已知一系列样本点 (x i ,y i ) (i=1,2,3,⋅¿⋅,n)的回归直线方程 y^=4x+a^ ,若样本点(m,2)与(2,n)
的残差相等,则4m+n=10
12.下列命题正确的是( )。
ξ~N(0,σ2 ) P(ξ>2)=0.023 P(−2≤ξ≤2)=0.954
A、已知随机变量 ,若 ,则
B、已知分类变量X与Y 的随机变量K2 的观察值为k,则当k的值越大时,“X 与Y 有关”的可信
度越小
C、在线性回归模型中,计算其相关指数
R2 =0.96
,则可以理解为:解析变量对预报变量的贡献率约
为0.96
D、若对于变量y与x的 10 组统计数据的线性回归模型中,相关指数 R2 =0.95 ,又知残差平方和为
n
∑(y −y^ )2
i i
R2=1−i=1
10 n
∑(y−y)2=2410.6 ∑(y −y)2
120.53 。那么i=1 i ,(注意:
i=1
i )
三、填空题:本题共4小题,每小题5分,共20分。
13.期中考试后,某校高三(9)班对全班 65 名学生的成绩进行分析,得到数学成绩y对总成绩x的回归
y^=6+0.4x 50
直线方程为 。由此可以估计:若两个同学的总成绩相差 分,则他们的数学成绩大约相差
________分。
14.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:(单位:
人)
2000
月收入 元以 月收入 2000 元及以上 总计
下
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
105×(10×30−20×45) 2
K2 = ≈6.109
由上表中数据计算得K2
的观测值
55×50×30×75
,请估计在犯错误的概率不超
过 的前提下认为“文化程度与月收入有关系”。
15.有两个分类变量x和y,其中一组观测值为如下的2×2列联表:
y y 总计
1 2x a 15−a 15
1
x 20−a 30+a 50
2
总计 20 45 65
其中a、
15−a均为大于5的整数,则a= 时,在犯错误的概率不超过0.01
的前提下为“x和
n(ad−bc) 2
K2
=
y之间有关系”。附: (a+b)(a+c)(c+d)(b+d) 。
P(K2 ≥k ) 0.100 0.050 0.025 0.010 0.005
0
k 2.706 3.841 5.024 6.635 7.879
0
16.某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别
记录了12月1日至12月5日的每天昼夜温度与实验室每天每100颗种子中的发芽数,得到如下数据:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差 10 11 13 12 8
发芽数(颗) 23 26 32 26 16
由表中根据12月2日至12月4的数据,求的线性回归方程 y^=b^ x+a^ 中的 b^ =3 ,则 a^ 为 ,若
由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1颗,则认为得到的线性回归方程是
可靠的,则求得的线性回归方程 。(填“可靠”或“不可靠”)(本小题第一个空2分。第二个
空3分)
四、解答题:本题共6小题,共70分。应写出文字说明、证明过程或演算步骤。
17.(本小题满分10分)某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这些服装件
数x之间有如下一组数据:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
7 7
∑x2=280 ∑x⋅y =3487
i i i
已知i=1 ,i=1 。
(1)求¯x、¯y
;
(2)求纯利y与每天销售件数x之间的回归直线方程;
(3)每天多销售1件,纯利y增加多少元?
100
18.(本小题满分12分)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取 名驾驶员先
后在无酒状态、酒后状态下进行“停车距离”测试。测试的方案:电脑模拟驾驶,以某速度匀速行驶,记
录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子停下所需的距离),无酒状态与酒后状态下的
实验数据分别列于表1和表2。表1
停车距离d(米) (10,20] (20,30] (30,40] (40,50] (50,60]
频数 26 40 24 8 2
表2
平均每毫升血液酒精含量x(毫克) 10 30 50 70 90
平均停车距离y(米) 30 50 60 70 90
请根据表1、表2回答以下问题:
(1)根据表1估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程
y^=b^ x+a^
;
(3)该测试团队认为:驾驶员酒后驾车的“平均停车距离”y大于(1)中无酒状态下的停车距离平均数
的3倍,则认定驾驶员是“醉驾”。请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克
时为“醉驾”?
n n
∑(x −x)(y −y) ∑x⋅y −n⋅x⋅y
i i i i
b^=i=1 =i=1
n n
参考公式:
∑(x
i
−x)2 ∑x
i
2−n⋅x2
,
a^=y−b^ x
。
i=1 i=1
19.(本小题满分12分)学校食堂统计了最近5天到餐厅就餐的人数x(百人)与食堂向食材公司购买所
需食材(原材料)的数量y(袋),得到如下统计表:
第三
第一天 第二天 第四天 第五天
天
就餐人数x(百
13 9 8 10 12
人)
原材料y(袋) 32 23 18 24 28
(1)根据所给的5组数据,求出y关于x的线性回归方程
y^=b^ x+a^
;
C=¿{400y− 20 ,0