文档内容
第八章 成对数据的统计分析(能力提升)B 卷
姓名: 班级:
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一个选项是符
合题目要求的。
1.两个变量有线性相关关系且残差的平方和等于0,则( )。
A、样本点都在回归直线上
B、样本点都集中在回归直线附近
C、样本点比较分散
D、不存在规律
【答案】A
【解析】在验证两个变量之间的线性相关关系中,残差平方和越小,相关性也越强,
两个变量有线性相关关系且残差的平方和等于0,则样本点都在回归直线上,故选A。
2.我国在有效防控疫情的同时积极有序推进复工复产,各旅游景区也逐渐恢复开放。某4A景区对重新开
放后的月份x与该月游客的日平均人数y(单位:千人/天)进行了统计分析,得出下表数据:
月份x 4 5 7 8
日平均人数y 1.9 3.2 t 6.1
若y与x线性相关,且求得其线性回归方程为 y=x−2 ,则表中t的值为( )。
A、4.7
B、4.8
C、5
D、无法确定
【答案】B
4+5+7+8 1.9+3.2+t+6.1 11.2+t
x= =6 y= =
4 4 4
【解析】由表格中的数据可得 、 ,
11.2+t
=6−2=4
将点
(x,y)
的坐标代入回归直线方程得
4 ,解得t=4.8,故选B。
(x ,y ) (x ,y ) (x ,y ) y^=b^ x+a^ (x ,y )
3.已知数组 1 1 、 2 2 、…、 10 10 满足线性回归方程 ,则“ 0 0 满足线性回
x +x +¿⋅¿+x y +y +¿⋅¿+y
归方程
y^=b^ x+a^
”是“
x
0
=
10
1 2 10
、
y
0
=
10
1 2 10
”的( )。
A、充分不必要条件
B、必要不充分条件
C、充要条件
D、既不充分也不必要条件
【答案】Bx y 10 y^=b^ x+a^ (x,y)
【解析】 0、 0为这 组数据的平均值,又∵线性回归方程 必过样本中心 ,
(x,y) (x,y)
∴ 一定满足线性回归方程,但满足线性回归方程的除了 外还可能有其他样本点,
故选B。
500 500
4.某医疗研究所为了检验某种血清能起到预防感冒的作用,把 名使用血清的人与另外 名未使用血
清的人一年中的感冒记录作比较,利用2×2列联表计算得K2 的观测值k≈3.918
。
附表:
P(K2 ≥k ) 0.150 0.100 0.050 0.025 0.010 0.005 0.001
0
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )。
A、2.5%
B、5%
95%
C、
D、
97.5%
【答案】B
【解析】由题意知观测值k≈3.918>3.841
,∴对照题中的附表得
P(K2 ≥k)=0.05=5%
,故选B。
5.观察下列散点图,其中两个变量的相关关系判断正确的是( )。
A、a为正相关,b为负相关,c为不相关
B、a为负相关,b为不相关,c为正相关
C、a为负相关,b为正相关,c为不相关
D、a为正相关,b为不相关,c为负相关
【答案】D
【解析】根据散点图,由相关性可知:
图a各点散步在从左下角到右上角的区域内,是正相关,
图b中各点分布不成带状,相关性不明确,所以不相关,
图c中各点分布从左上角到右上角的区域里,是负相关,
故选D。
6.假设有两个分类变量X 和Y ,它们的可能取值分别为 {x 1 ,x 2 } 和 {y 1 ,y 2 } ,其2×2列联表如表,对于
以下数据,对同一样本能说明X和Y 有关系的可能性最大的一组为( )。
y y 总计
1 2
x a b a+b
1
x c d c+d
2
总
a+c b+d a+b+c+d
计
A、a=6、b=7、c=8、d=9
B、a=8、b=6、c=9、d=7C、a=9、b=8、c=6、d=8
D、a=9、b=8、c=7、d=6
【答案】C
|ad−bc|=|6×9−7×8|=2
【解析】A选项, ,
|ad−bc|=|8×7−6×9|=2
B选项, ,
|ad−bc|=|8×9−6×7|=30
C选项, ,
|ad−bc|=|6×9−8×7|=2
D选项, ,
由
|ad−bc|
越大,说明X 和Y 有关系的可能性越大,故选C。
n(ad−bc) 2
K2
=
7.已知: (a+b)(a+c)(c+d)(b+d) ,n=a+b+c+d。
P(K2 ≥k ) 0.050 0.010
0
k 3.841 6.635
0
在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中
1 1
2 6
被调查的女生人数是男生人数的 ,男生喜欢数学文化的人数占男生人数的 ,女生喜欢数学文化的人数
2
3 99%
占女生人数 ,若有 的把握认为是否喜欢数学文化和性别有关,则男生至少有( )。
18
A、 人
20
B、 人
C、22人
D、24人
【答案】A
【解析】设男生至少有x人,根据题意,可列出如下2×2联表:
喜欢数学文化 不喜欢数学文化 总计
男 1 5
x x x
生 6 6
女 1 1 1
x x x
生 3 6 2
总 1 3
x x x
计 2 2
3 1 1 1 5
x⋅( x⋅ x− x⋅ x) 2
2 6 6 3 6 3
K2 = = x
1 5 1 1 5 1 1 1 8
( x+ x)( x+ x)( x+ x)( x+ x)
则 6 6 6 3 6 6 3 6 ,
99%
若有 的把握认为是否喜欢数学文化和性别有关,
3
x>6.635
则
K2 >6.635
,即
8 ,解得x>17.693
,由于表中人数都为整数,∴x=18
,即男生至少有
18
人,故选A。
8.某同学用收集到的6组数据对 (x
i
,y
i
) (i=1、2、3、4、5、6)制作成如图所示的散点图(点旁的
l y^=b^ ⋅x+a^ r
数据为该点坐标),并由最小二乘法计算得到回归直线 1的方程: 1 1,相关系数为 1,相关指数
R2
为 1;经过残差分析确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据
l y^=b^ ⋅x+a^ r R2
计算得到回归直线 2的方程: 2 2,相关系数为 2,相关指数为 2。则以下结论中,不正确的
是( )。
r >0 r >0
A、 1 、 2
b^ >0 b^ >0
B、 1 、 2
b^ >b^
C、 1 2
R2 >R2
D、 1 2
【答案】D
【解析】A选项,从图形中可以看出,两个变量是正相关,对,
B选项、C选项,从图形中可以看出,回归直线的纵截距是正数,对,
n
∑(y −y^ )2
i i
R2=1−i=1
n
D选项,∵ ∑ i=1 (y i −y)2 ,其中 y i −y^ i = 真实值-预报值=残差,R2 值越大,
说明残差的平方和越小,也就是说模型的拟合效果越好,错,
故选D。
二、多项选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。
9.下面关于K2
的说法错误的是( )。
A、K2
在任何相互独立的问题中都可以用于检验有关还是无关
B、K2
的值越大,两个事件的相关性就越大
C、K2 是用来判断两个分类变量是否相关的随机变量,当K2
的值很小时可以推定两类变量不相关
n(ad−bc)
K2
=
D、K2
的计算公式是
(a+b)(a+c)(c+d)(b+d)
【答案】ACD
【解析】K2
只适用于2×2型列联表问题,A选项错,
K2
的值越大,两个事件的相关性就越大,B选项对,
K2
只能推定两个分类变量相关,但不能推定两个变量不相关,C选项错,
n(ad−bc) 2
K2
=
K2
的计算公式是
(a+b)(a+c)(c+d)(b+d),D选项错,故选ACD。
10.对四对变量Y 与x进行线性相关检验,已知n是观测值组数,r是相关系数,则变量Y 和x具有线性
相关关系的是( )。
A、n=7、r=0.9533
B、n=15 、r=0.3012
C、n=17 、r=0.4991
D、n=3、r=0.9950
【答案】AC
【解析】由于小概率0.05 与n−2在附表中分别查得:
r =0.754 r =0.514 r =0.482 r =0.997
A选项的 0.05 ,B选项的 0.05 ,C选项的 0.05 ,D选项的 0.05 ,
r
因此知A、C中相关系数比 0.05大,变量Y 和x具有线性相关关系,
r
而B、D中的相关系数小于 0.05,故变量Y 与x不具有线性相关关系,
故选AC。
11.下列说法中,正确的命题是( )。
kx
A、以模型
y=c⋅e
去拟合一组数据时,为了求出回归方程,设
z=lny
,将其变换后得到线性方程
z=0.3x+4,则c、k的值分别是 e4 和0.3
B、设有一个回归直线方程 y^=3−5x ,变量x增加1个单位时, y^ 平均增加5个单位
C、线性回归方程
y^=b^ x+a^ 必经过样本点的中心(¯x,¯y)
D、已知一系列样本点 (x i ,y i ) (i=1,2,3,⋅¿⋅,n)的回归直线方程 y^=4x+a^ ,若样本点(m,2)与(2,n)
的残差相等,则4m+n=10
【答案】ACD
y=c⋅e kx lny=ln(c⋅e kx )=lnc+lne kx =lnc+kx
【解析】∵ ,∴两边取对数,可得 ,
令
z=lny ,可得z=lnc+kx ,∵z=0.3x+4,∴ lnc=4,即k=0.3, c=e4
,A选项对,
y^=3−5x y^
若有一个回归直线方程 ,随着x的增大, 会减小,B选项错,
线性回归方程
y^=b^ x+a^ 必经过样本点的中心(¯x,¯y),C选项对,
回归直线方程为
y^=4x+a^ ,且样本点(m,2)与(2,n)的残差相等,
2−(4m+a^)=n−(4⋅2+a^)⇒4m+n=10
则 ,D选项对,
故选ACD。
12.下列命题正确的是( )。
ξ~N(0,σ2 ) P(ξ>2)=0.023 P(−2≤ξ≤2)=0.954
A、已知随机变量 ,若 ,则
B、已知分类变量X与Y 的随机变量K2 的观察值为k,则当k的值越大时,“X 与Y 有关”的可信度越小
C、在线性回归模型中,计算其相关指数
R2 =0.96
,则可以理解为:解析变量对预报变量的贡献率约
为0.96
D、若对于变量y与x的 10 组统计数据的线性回归模型中,相关指数 R2 =0.95 ,又知残差平方和为
n
∑(y −y^ )2
i i
R2=1−i=1
10 n
∑(y−y)2=2410.6 ∑(y −y)2
120.53 。那么i=1 i ,(注意:
i=1
i )
【答案】ACD
【解析】A选项,曲线关于x=0对称,由 P(ξ>2)=0.023 ,则 P(ξ<−2)=0.023 ,
P(−2≤ξ≤2)=1−P(ξ>2)−P(ξ<−2)=0.954
则 ,对,
B选项,对分类变量X与Y 的随机变量K2 的观察值k来说,k越大,
“X与Y 有关”的可信度越大,错,
C选项,解析变量对预报变量的贡献率约为0.96
,对,
n
∑(y −y^ )2
i i
R2=1−i=1
n 10
∑(y −y)2 ∑(y−y^ )2=120.53
D选项,根据公式 i=1 i ,其中i=1 i i ,
10
∑(y−y)2=2410.6
i
代入求出i=1 ,对,
故选ACD。
三、填空题:本题共4小题,每小题5分,共20分。
13.期中考试后,某校高三(9)班对全班 65 名学生的成绩进行分析,得到数学成绩y对总成绩x的回归
y^=6+0.4x
50
直线方程为 。由此可以估计:若两个同学的总成绩相差 分,则他们的数学成绩大约相差
________分。
20
【答案】
x x y^ =6+0.4x y^ =6+0.4x
【解析】令两人的总成绩分别为 1、 2,则对应的数学成绩估计为 1 1, 2 2,
|y^ −y^ |=|0.4(x −x )|=0.4×50=20
∴ 1 2 1 2 。
14.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:(单位:
人)
2000
月收入 元以 月收入 2000 元及以上 总计
下
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
105×(10×30−20×45) 2
K2 = ≈6.109
由上表中数据计算得K2
的观测值
55×50×30×75
,请估计在犯错误的概率不超过 的前提下认为“文化程度与月收入有关系”。
【答案】0.025
【解析】∵6.109>5.024 ,故在犯错误的概率不超过0.025
的前提下认为“文化程度与月收入有关
系”。
15.有两个分类变量x和y,其中一组观测值为如下的2×2列联表:
y y 总计
1 2
x a 15−a 15
1
x 20−a 30+a 50
2
总计 20 45 65
其中a、
15−a均为大于5的整数,则a= 时,在犯错误的概率不超过0.01
的前提下为“x和
n(ad−bc) 2
K2
=
y之间有关系”。附: (a+b)(a+c)(c+d)(b+d) 。
P(K2 ≥k ) 0.100 0.050 0.025 0.010 0.005
0
k 2.706 3.841 5.024 6.635 7.879
0
【答案】9
65×[a⋅(30+a)−(20−a)⋅(15−a)] 2 13×(13a−60) 2
= ≥6.635
【解析】由题意知:
K2 ≥6.635
,则
20×45×15×50 5400
,
解得a≥8.65 或a≤0.58 ,∵a>5且 15−a>5,a∈Z,综上得:8.65≤a<10 ,a∈Z,
∴a=9。
16.某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别
记录了12月1日至12月5日的每天昼夜温度与实验室每天每100颗种子中的发芽数,得到如下数据:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差 10 11 13 12 8
发芽数(颗) 23 26 32 26 16
由表中根据12月2日至12月4的数据,求的线性回归方程 y^=b^ x+a^ 中的 b^ =3 ,则 a^ 为 ,若
由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1颗,则认为得到的线性回归方程是
可靠的,则求得的线性回归方程 。(填“可靠”或“不可靠”)(本小题第一个空2分。第二个
空3分)
【答案】
a^=−8
可靠
11+12+13 26+26+32
x= =12 y= =28
3 3 (12,28)
【解析】由题得 、 ,∴样本中心点为 ,
∴
28=3×12+a^,∴ a^=−8
,∴
y^=3x−8
,
12月1日的估计值为: y^=3×10−8=22 , 23−22=1,没有超过1,
12月5日的估计值为: y^=3×8−8=16 , 16−16=0,没有超过1,
∴求得的线性回归方程可靠。
四、解答题:本题共6小题,共70分。应写出文字说明、证明过程或演算步骤。17.(本小题满分10分)某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这些服装件
数x之间有如下一组数据:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
7 7
∑x2=280 ∑x⋅y =3487
i i i
已知i=1 ,i=1 。
(1)求¯x、¯y
;
(2)求纯利y与每天销售件数x之间的回归直线方程;
(3)每天多销售1件,纯利y增加多少元?
3+4+5+6+7+8+9 66+69+73+81+89+90+91
¯x= =6 ¯y= ≈79.86
7 7
【解析】(1) , ; 2
分
7
∑x⋅y −7⋅x⋅y
i=1
i i
=
3487−7×6×79.86
≈4.75
7 280−7×6
(2)设回归直线方程
y^=b^ x+a^
,则
b^
=
∑
i=1
x
i
2−7⋅x2
, 5
分
a^=y−b^x≈79.86−4.75×6=51.36
∴ , 6
分
y^=4.75x+51.36
∴回归直线方程为: , 7分
(3)由回归直线方程知,每天多销售1件,纯利润增加4.75
元。 10
分
100
18.(本小题满分12分)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取 名驾驶员先
后在无酒状态、酒后状态下进行“停车距离”测试。测试的方案:电脑模拟驾驶,以某速度匀速行驶,记
录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子停下所需的距离),无酒状态与酒后状态下的
实验数据分别列于表1和表2。
表1
停车距离d(米) (10,20] (20,30] (30,40] (40,50] (50,60]
频数 26 40 24 8 2
表2
平均每毫升血液酒精含量x(毫克) 10 30 50 70 90
平均停车距离y(米) 30 50 60 70 90
请根据表1、表2回答以下问题:
(1)根据表1估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程
y^=b^ x+a^
;
(3)该测试团队认为:驾驶员酒后驾车的“平均停车距离”y大于(1)中无酒状态下的停车距离平均数
的3倍,则认定驾驶员是“醉驾”。请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克
时为“醉驾”?n n
∑(x −x)(y −y) ∑x⋅y −n⋅x⋅y
i i i i
b^=i=1 =i=1
n n
参考公式:
∑(x
i
−x)2 ∑x
i
2−n⋅x2
,
a^=y−b^ x
。
i=1 i=1
【解析】(1)依题意,驾驶员无酒状态下停车距离的平均数为:
26 40 24 8 2
15× +25× +35× +45× +55× =27
100 100 100 100 100
; 3
分
x=50 y=60
(2)依题意可得: , , 4
分
10×30+30×50+50×60+70×70+90×90−5×50×60
b^ = =0.7
102 +302 +502 +702 +902 −5×502
, 6
分
a^=60−0.7×50=25
,则回归方程为
y^=0.7x+25
; 8
分
y>27×3=81
(3)由(1)知当 时认定驾驶员是“醉驾”, 9
分
令
y^=81 得0.7x+25>81 ,解得x>80
, 11
分
80
当每毫升血液酒精含量大于 毫克时为“醉驾”。 12
分
19.(本小题满分12分)学校食堂统计了最近5天到餐厅就餐的人数x(百人)与食堂向食材公司购买所
需食材(原材料)的数量y(袋),得到如下统计表:
第三
第一天 第二天 第四天 第五天
天
就餐人数x(百
13 9 8 10 12
人)
原材料y(袋) 32 23 18 24 28
(1)根据所给的5组数据,求出y关于x的线性回归方程
y^=b^ x+a^
;
C=¿{400y− 20 ,02√5≈4.5
,
∴为了放心食用该蔬菜,估计需要用4.5千克的清水清洗一千克的蔬菜。
12分
21.(本小题满分12分)基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,
带给人们新的出行体验、某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个
月内的市场占有率进行了统计,结果如下表:
月份 2019.8 2019.9 2019.10 2019.11 2019.12 2020.1
月份代码x 1 2 3 4 5 6
市场占有率y( % 16 15 20 21
11 13
)
(1)请在给出的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率y与月
份代码x之间的关系;
(2)求y关于x的线性回归方程,并预测该公司 2020 年2月份的市场占有率;
(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为 1000 元/辆和 800 元/辆的A、
B两款车型报废年限各不相同,考虑到公司的经济效益,该公司决定先对两款单车各 100 辆进行科学模拟测试,得到两款单车使用寿命频数表如下:
报废年限
1年 2年 3年 4年 总计
车型
A 10 30 40 20 100
B 15 40 35 10 100
500
经测算,平均每辆单车每年可以为公司带来收入 元。不考虑除采购成本之外的其他成本,假设每
辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为
决策依据、如果你是该公司的负责人,你会选择采购哪款车型?
6 6
∑(x
i
−x)2=17.5 ∑(x
i
−x)(y
i
−y)=35 √1330≈36.5
参考数据:i=1 ,i=1 , 。
n
∑(x−x)(y −y)
i i
r= i=1
√ n n
∑(x−x)2∑(y −y)2
i i
参考公式:相关系数 i=1 i=1 ;
n
∑(x−x)(y−y)
i i
b^=i=1
n
回归直线方程为
y^=b^ x+a^
,其中
∑(x
i
−x)2
,
a^=y−b^ x
。
i=1
【解析】(1)散点图如图所示, 1
分
11+13+16+15+20+21 6
y= =16 ∑(y −y)2=76
6 i
,∴i=1 , 3
分
n
∑(x−x)(y−y)
i i 35 35 35
r= i=1 = = = ≈0.96
√ n n √17.5×76 √1330 36.5
∑(x−x)2∑(y−y)2
i i
∴ i=1 i=1 , 4
分
∴两变量之间具有较强的线性相关关系,
故可用线性回归模型拟合两变量之间的关系; 5
分
n
∑(x−x)(y−y)
i i 35
b^=i=1
∑
n
(x−x)2
= 17.5 =2
x=
1+2+3+4+5+6
=3.5
(2)
i=1
i ,又 6 , 6分a^=y−b^x=16−2×3.5=9
y^=2x+9
∴ ,∴回归直线方程为 ; 7分
∴ 2020 年2月的月份代码x=7,∴ y=2×7+9=23 ,
∴估计 2020 年2月的市场占有率为 23% ; 8分
(3)用频率估计概率,A款单车的利润X 的分布列为:
X −500 0 500 1000
P 0.1 0.3 0.4 0.2
E(X)=−500×0.1+0×0.3+500×0.4+1000×0.2=350
∴ (元), 10
分
B款单车的利润Y 的分布列为:
Y −300 200 700 1200
P 0.15 0.4 0.35 0.1
E(Y)=−300×0.15+200×0.4+700×0.35+1200×0.1=400
∴ (元),
以每辆单车产生利润的期望值为决策依据,故应选择B款车型。 12
分
2019
22.(本小题满分12分) 年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,但某地
二手房交易却“逆市”而行。如图是该地某小区 2018 年11月至 2019 年11月间,当月在售二手房均价
(单位:万元/平方米)的散点图。
(图中月份代码1−13 分别对应 2018 年11月~ 2019 年11月)
根据散点图选择
y=a+b√x
和
y=c+dlnx
两个模型进行拟合,经过数据处理得到两个回归方程分别为
y^=0.9369+
0.0285√x y^=0.9554+0.0306lnx
和 ,并得到以下一些统计量的值:
y^=0.9369+0.0285√x y^=0.9554+0.0306lnx
13
∑(y −y^ )2 0.000591 0.000164
i i
i=1
13
∑(y −¯y)2 0.006050
i
i=1
(1)请利用相关指数R2
判断哪个模型的拟合效果更好;
(2)某位购房者拟于 2020 年4月购买这个小区m( 70≤m≤160 )平方米的二手房(欲购房为其家庭首
套房)。若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解
决以下问题:
y^=0.9554+0.0306lnx
(i)估算该购房者应支付的购房金额;(购房金额=房款+税费,房屋均价精确到万元/平方米)
100
(ii)若该购房者拟用不超过 万元的资金购买该小区一套二手房,试估算其可购买的最大面积。(精确
到1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格=房款)进
行征收的。
房产证满2年但未满5年的征收方式如下:首套面积 90 平方米以内(含 90 平方米)为1% ;首套面积 90
平方米以上且
140
平方米以内(含
140 平方米)1.5%
;首套面积
140 平方米以上或非首套为3%
。
参考数据: ln2≈0.69 、ln31.10、ln172.83、ln192.94、 √2≈1.41 、 √3≈1.73 、 √17≈4.12 、
√19≈4.36
。
n
∑(y −y^ )2
i i
R2=1−i=1
n
∑(y −¯y)2
参考公式:相关指数 i 。
i=1
【解析】(1)模型一中,
y^=0.9369+0.0285√x
的残差平方和为0.000591
,
0.000591
R2 =1− ≈0.923
相关指数为
0.006050
, 2
分
模型二中,
y^=0.9554+0.0306lnx 的残差平方和为0.000164
,
0.000164
R2 =1− ≈0.973
0.006050
相关指数为 , 4
分
∴相关指数较大的模型二拟合效果好些; 5
分
(2)通过散点图确定
2020 年4月对应的x=18
,
代入(1)中拟合效果更好的模型二,代入计算:
y^=0.9554+0.0306ln18=0.9554+0.0306(ln2+2ln3)≈1.044
(万元/平方米), 7
分
则
2020 年4月份二手房均价的预测值为1.044
(万元/平方米),
(i)设该购房者应支付的购房金额h万元,∵税费中淵方只需缴纳契税,
①当
70≤m≤90 时,契税为计税价格的1%
,∴
h=m×1.044×(1%+1)=1.05444
m,
②当
90