文档内容
1.下列有关线性回归的说法,不正确的是( )
A.具有相关关系的两个变量不是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有经验回归方程
2.对于样本相关系数,下列说法错误的是( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数r∈[-1,1]
D.样本相关系数越大,成对样本数据的线性相关程度也越强
3.(2023·运城模拟)在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=x
+1上,R2=1-,则R2等于( )
A. B. C.1 D.
4.(多选)某工厂研究某种产品的产量x(单位:吨)与所需某种材料y(单位:吨)之间的相关关
系,在生产过程中收集4组数据如表所示.根据表中数据可得经验回归方程为y=0.7x+a,
则下列四个说法中正确的为( )
x 3 4 6 7
y 2.5 3 4 5.9
A.变量x与y正相关
B.y与x的样本相关系数r<0
C.a=0.35
D.当产量为8吨时,预测所需材料约为5.95吨
5.(多选)(2023·唐山模拟)某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高
(单位:cm)和臂展(单位:cm)进行了测量,这10名志愿者身高和臂展的折线图如图所示.
已知这10名志愿者身高的平均值为176 cm,根据这10名志愿者的数据求得臂展u关于身高
v的经验回归方程为u=1.2v-34,则下列结论正确的是( )A.这10名志愿者身高的极差小于臂展的极差
B.这10名志愿者的身高和臂展呈负相关
C.这10名志愿者臂展的平均值为176.2 cm
D.根据经验回归方程可估计身高为160 cm的人的臂展为158 cm
6.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中:
已知该产品的色度y和色差x之间满足线性相关关系,且y=0.8x+a,现有一对测量数据为
(30,23.6),则该数据的残差为( )
色差x 21 23 25 27
色度y 15 18 19 20
A.-0.96 B.-0.8 C.0.8 D.0.96
7.某智能机器人的广告费用x(万元)与销售额y(万元)的统计数据如表所示:
广告费用x(万元) 2 3 5 6
销售额y(万元) 28 31 41 48
根据此表可得经验回归方程为y=5x+a,据此模型预测广告费用为 8万元时销售额为
________万元.
8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=2e2x+1的图象
附近,设z=ln y,将其变换后得到经验回归方程为z=mx+n,则mn=________.
9.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统
计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
已知=90,≈140.8,y=112.3,≈8.9,≈1.4.
i i
(1)求,;
(2)计算y与x的样本相关系数r(精确到0.001),并判断该设备的使用年限与所支出的维修费
用的相关程度.
附:样本相关系数r==.10.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区
某种树木的总材积量,随机选取了 10棵这种树木,测量每棵树的根部横截面积(单位:m2)
和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截
0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
面积x
i
材积量y 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
i
并计算得∑x=0.038,∑y=1.615 8,∑xy=0.247 4.
i i
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总
和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这
种树木的总材积量的估计值.
附:样本相关系数r==,≈1.377.
11.(多选)针对某疾病,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,
某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得 y关于x的经
验回归方程为y=6x2+a,则下列说法正确的是( )
周数(x) 1 2 3 4 5
治愈人数(y) 2 17 36 93 142
A.a=4
B.a=-8
C.此回归模型第4周的残差为5
D.估计第6周治愈人数为220
12.2020年,全球开展了某疫苗研发竞赛,我国处于领先地位,为了研究疫苗的有效率,
在某地进行临床试验,对符合一定条件的10 000名试验者注射了该疫苗,一周后有20人感
染,为了验证疫苗的有效率,同期,从相同条件下未注射疫苗的人群中抽取 2 500人,分成
5组,各组感染人数如下:调查人数x 300 400 500 600 700
感染人数y 3 3 6 6 7
并求得y与x的经验回归方程为y=0.011x+a,同期,在人数为10 000的条件下,以拟合结
果估算未注射疫苗的人群中感染人数,记为N;注射疫苗后仍被感染的人数记为n,则估计
该疫苗的有效率为________.(疫苗的有效率为1-,结果保留3位有效数字)
13.在一组样本数据(x ,y),(x ,y),…,(x ,y)的散点图中,若所有样本点(x,y)(i=
1 1 2 2 7 7 i i
1,2,…,7)都在曲线y=aln(x-1 895)+12.15附近波动,经计算(x-1 895)=210.77,y=
i i
73.50,ln(x-1 895)=23.10,则实数a等于( )
i
A.-0.5 B.0.5 C.-1 D.1
14.(多选)已知由样本数据(x,y)(i=1,2,3,…,10)组成的一个样本,得到经验回归方程为y
i i
=2x-0.4,且=2,去除两个歧义点(-2,1)和(2,-1)后,得到新的经验回归直线的斜率为
3.则下列说法正确的是( )
A.相关变量x,y具有正相关关系
B.去除两个歧义点后,新样本中变量x(j=1,2,…,8)的平均值变大
j
C.去除两个歧义点后的经验回归方程为y=3x-3
1
D.去除两个歧义点后,样本数据(4,8.9)的残差为0.1