文档内容
专题38 《成对数据的统计分析》单元测试卷
一、单选题
1.(2020·甘肃省会宁县第二中学期中(文))某商品销售量y(件)与销售价格x(元/件)负相关,则
其回归方程可能是( )
yˆ 10x200 yˆ 10x200
A. B.
yˆ 10x200 yˆ 10x200
C. D.
【答案】A
【解析】
x yˆ
因为商品销售量 与销售价格 负相关,所以排除B,D选项,
x0 yˆ 10x200 yˆ 2000
将 代入 可得 ,不符合实际.故A正确.
yˆ b ˆ xaˆ b ˆ 0 x,yˆ b ˆ 0 x,yˆ
点睛:线性回归方程 当 时 负相关;当 时 正相关.
2.(2020·福建湖里·厦门双十中学高二期中)在一组样本数据 (x 1, y 1 ) , (x 2, y 2 ) , , (x n, y n )(n�2 ,
1
y x2
x
1
, x
2
, x
n
不全相等)的散点图中,若所有样本点(x
i
,y
i
)(i1,2,,n)都在直线 3
上,则这组样本数据的样本相关系数为( )
1
A.1 B.0 C. 3 D.1
【答案】A
【解析】
1
y x2
因为回归直线方程是 3 ,
所以这两个变量是负相关,故这组样本数据的样本相关系数为负值,
(x y )(i1 n)
又所有样本点 i, i ,2, , 都在直线上,r 1
所以 ,
所以相关系数r 1.
故选:A.
3.(2020·福建湖里·厦门双十中学高二期中)已知四个命题:
R2 R2
①在回归分析中, 可以用来刻画回归效果, 的值越大,模型的拟合效果越好;
K2
②在独立性检验中,随机变量 的值越大,说明两个分类变量有关系的可能性越大;
y 0.2x12 x y
③在回归方程 中,当解释变量 每增加1个单位时,预报变量 平均增加1个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;
其中真命题是:
A.①④ B.②④ C.①② D.②③
【答案】C
【解析】
R2 R2
对于①,在回归分析中, 可以用来刻画回归效果, 的值越大,模型的拟合效果越好,正确;对于②;
K2
在独立性检验中,随机变量 的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回
yˆ 0.2x12 x yˆ 0.2
归方程 中,当解释变量 每增加1个单位时,预报变量 平均增加 个单位,错误;对于
④,两个随机变量相关性越强,则相关系数的绝对值越接近于1,错误;故选C.
4.(2020·河南南阳·期末(理))利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通
过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:得到
的正确结论是( )
P(K2 k) 0.01 0.05 0.025 0.010 0.005 0.001
0
k 2.706 3.841 5.024 6.635 7.879 10.828
0
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”、
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
【答案】B
【解析】
K2 7.2456.635
由 ,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B
5.(2020·四川邻水实验学校开学考试(理))在一次独立性检验中得到如下列联表:
A A 总计
1 2
B 200 800 1000
1
B 180 a 180+a
2
总计 380 800+a 1180+a
若这两个分类变量A和B没有关系,则a的可能值是( )
A.200 B.720
C.100 D.180
【答案】B
【解析】
当a=720时,k=
=0,
易知此时两个分类变量没有关系.
故答案为B
6.(2020·赣州市赣县第三中学月考(文))某市政府在调查市民收入增减与旅游愿望的关系时,采用
K2 k 6.023
独立性检验法抽查了3000人,计算发现 的观测值 ,根据这一数据查阅表,市政府断言“市民
收入增减与旅游愿望有关系”这一断言犯错误的概率不超过( )
P K2 k 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0
k 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0A.0.005 B.0.025 C.0.05 D.0.1
【答案】B
【解析】
k 6.023
∵ ,6.023>5.024,
∴市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过0.025,
故选:B.
7.(2020·福建期末)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观侧
数据.用4种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根
据残差图,拟合效果最好的模型是( )
A.模型一 B.模型二 C.模型三 D.模型四
【答案】D
【解析】
当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,
这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,
对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.
故选:D.
x,y
8.(2020·辽宁期末)相关变量 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根
y bxa r (10,21)
据图中所有数据,得到线性回归方程 1 1,相关系数为 1;方案二:剔除点 ,根据剩下数
y b xa r
据得到线性回归直线方程: 2 2,相关系数为 2.则( )0r r 1
A. 1 2
0r r 1
B. 2 1
1r r 0
C. 1 2
1r r 0
D. 2 1
【答案】D
【解析】
r,r 0 10,21 r
由散点图得负相关,所以 1 2 ,因为剔除点 后,剩下点数据更具有线性相关性, 更接近1,
1r r 0
所以 2 1 .选D.
二、多选题
22 K2
9.(2020·山东省招远第一中学高二月考)某课外兴趣小组通过随机调查,利用 残联表和 统计量
P K2 6.635 0.010
研究数学成绩优秀是否与性别有关.计算得K2 6.748,经查阅临界值表知 ,则
下列判断正确的是( )
100 1
A.每 个数学成绩优秀的人当中就会有 名是女生
0.010
B.若某人数学成绩优秀,那么他为男生的概率是
99%
C.有 的把握认为“数学成绩优秀与性别有关”1%
D.在犯错误的概率不超过 的前提下认为“数学成绩优秀与性别有关”
【答案】CD
【解析】
K2 6.7486.635 99%
因为 ,所以有 的把握认为“数学成绩优秀与性别有关”即在犯错误的概率不超
过1%的前提下认为“数学成绩优秀与性别有关”.
故选:CD
10.(2020·南京市秦淮中学开学考试)为了对变量 x 与 y 的线性相关性进行检验,由样本点 x 1 ,y 1 、
x ,y x ,y
2 2 、、 10 10 求得两个变量的样本相关系数为r,那么下面说法中错误的有( )
y 2x1 r 1
A.若所有样本点都在直线 上,则
y 2x1 r 2
B.若所有样本点都在直线 上,则
r x y
C.若 越大,则变量 与 的线性相关性越强
r x y
D.若 越小,则变量 与 的线性相关性越强
【答案】ABD
【解析】
y 2x1 r 1
若所有样本点都在直线 上,且直线斜率为负数,则 ,A、B选项均错误;
r x y
若 越大,则变量 与 的线性相关性越强,C选项正确,D选项错误.
故选:ABD.
11.(2020·广东梅州·高二期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关
4
“作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的5 ,女生喜欢抖音的
3
人数占女生人数5,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人附表:
P K2 k 0.100 0.050 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
n(ad bc)2
K2
附: (ab)(cd)(ac)(bd)
A.25 B.35 C.45 D.60
【答案】CD
【解析】
设男生可能有x人,依题意得女生有x人,可得22列联表如下:
喜欢抖音 不喜欢抖音 总计
4 1
男生 x x x
5 5
3 2
女生 x x x
5 5
7 3
合计 x x 2x
5 5
K2 3.841
若有95%的把握认为是否喜欢抖音和性别有关,则 ,
2
4 2 3 1
2x x x x x
5 5 5 5 2
K x 3.841
即 7 3 21 ,解得 ,
x xxx
5 5 x 40.335
x0
由题意知 ,且x是5的整数倍,所以45和60都满足题意.
故选:CD.
12.(2020·广东南海·期末)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间
的对应数据如下表所示:
广告支出费用x 2.2 2.6 4.0 5.3 5.9
销售量y 3.8 5.4 7.0 11.6 12.2y 2.27xa R2 0.96
根据表中的数据可得回归直线方程 , ,以下说法正确的是( )
A.第三个样本点对应的残差e 1
3
B.在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中
C.销售量的多少有96%是由广告支出费用引起的
D.用该回归方程可以比较准确地预测广告费用为20万元时的销售量
【答案】AC
【解析】
2.22.64.05.35.9 3.85.47.011.612.2
x 4, y 8
由题意得 5 5 ,将之代入回归方程
y 2.27xa中得82.274a,得a 1.08,故回归直线方程为y 2.27x1.08,所以
e 72.2741.081,A正确;
3
R2 0.96
由于 ,所以该回归模型拟合的效果比较好,故对应的残差图中残差点应该比较均匀地分布在水
平的带状区域中,B错误;
R2
在线性回归模型中 表示解释变量对于预报变量的贡献率,R2≈0.96,则销售量的多少有96%是由广告支
出费用引起的,C正确;
由于样本的取值范围会影响回归方程的使用范围,而广告费用20万元远大于表格中广告费用值,故用该回
归方程不能准确地预测广告费用为20万元时的销售量,故D错误.
故选:AC.
三、填空题
13.(2020·吉林高二期末(文))某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对
22 abd
外翻译工作,在如表“性别与会外语”的 列联表中, ___________.
会外语 不会外语 总计
男 a b 20女 6 d
总计 18 50
【答案】44
【解析】
a618
ab20
由题意有:
abd 650
a12 b8 d 24 abd 1282444
所以 , , , .
故答案为:44.
14.(2020·湖南期末)某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国
100
外潜在用户代表各 名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,
______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.
(参考公式与数据:
nad bc2
K2
,其中 )
abcdacbd
nabcd
P K2 k 0.05 0.01 0.005 0.001
0k 3.841 6.635 7.879 10.828
0
【答案】有
【解析】
依题意,可得出如下22列联表:
国内代表 国外代表 合计
不乐观 40 60 100
乐观 60 40 100
合计 100 100 200
200 402 6022
K2 87.879,
1004
所以有99.5%以上的把握认为持乐观态度和国内外差异有关.
故答案为:有.
y 0.85x85.7
15.(2019·湖北期中(理))由样本数据得到,女大学生的身高预报体重的回归方程是
y cm kg
170,61
(其中x, 的单位分别是 , ),则此方程在样本 处残差的绝对值是______.
【答案】2.2
【解析】
y 0.85x85.7
由样本数据得到,女大学生的身高预报体重的回归方程是 ,
x170 y 0.8517085.758.8
当 时, ;
170,61 58.861 2.2
此方程在样本 处残差的绝对值: .
故答案为:2.2.
16.(2017·北京石景山·高三一模(文))在环境保护部公布的2016年74城市PM2.5月均浓度排名情况中,
某14座城市在74城的排名情况如下图所示,甲、乙、丙为某三座城市.从排名情况看,
① 在甲、乙两城中,2月份名次比1月份名次靠前的城市是_________;
②在第1季度的三个月中,丙城市的名次最靠前的月份是_________.
【答案】乙 二月份
【解析】
结合题设中提供的散点图可知:城市乙更靠近回归直线,答案应填乙;结合第二个散点图可以看出丙城市
的名次更靠近二月份,答案应填二月份.
四、解答题
17.(2020·沙坪坝·重庆一中高三其他(文))截止2020年5月15日,新冠肺炎全球确诊数已经超过
440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构
收集了1000名患者的病毒潜伏期的信息,将数据统计如下表所示:
潜伏期 0-2天 2-4天 4-6天 6-8天 8-10天 10-12天 12-14天
人数 40 160 300 360 60 60 20
x
(1)求1000名患者潜伏期的平均数 (同一组中的数据用该组区间的中点值作代表);
(2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期高于平均数的患者,称为“长潜伏者”.为研究
潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中
抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有99.9%的把握认为潜伏期
长短与患者年龄有关.短潜伏者 长潜伏者 合计
60岁及以上 100
60岁以下 140
合计 300
附表及公式:
P K2 k 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
n(ad bc)2
K2
(ab)(cd)(ac)(bd)
【答案】(1)6;(2)填表见解析;有99.9%的把握认为潜伏期长短与患者年龄有关
【解析】
40 160 300 360 60 60 20
x 1 3 5 7 9 11 13
(1) 1000 1000 1000 1000 1000 1000 1000
4048015002520540660260 6000
1000 1000 6.
40160300
300 150
(2)抽取的短潜伏者的总人数为 1000 ,长潜伏者的总人数为300150150.
列联表如下:
短潜伏者 长潜伏者 合计
60岁及以上 100 60 160
60岁以下 50 90 140
合计 150 150 300
300(100905060)2 150
K2
150150140160 7 21.429 10.828.
故有99.9%的把握认为潜伏期长短与患者年龄有关.2019
18.(2020·甘肃省会宁县第二中学期中(文)) 年中央电视台在周日晚上推出的一档新的综艺节目,
为了解节目效果,一次节目结束后,现随机抽取了500名观众(含200名女性)的评分(百分制)进行分
析,分别得到如图所示的两个频率分布直方图.
(1)计算女性观众评分的中位数与男性观众评分的平均分;
70 70
(2)若把评分低于 分定为“不满意”,评分不低于 分定为“满意”.
(i)试比较男观众与女观众不满意的概率大小,并说明理由;
22 95%
(ii)完成下列 列联表,并回答是否有 的把握认为性别和对该综艺节目是否满意有关.
女性观众 男性观众 合计
“满意”
“不满意”
合计
n(ad bc)2
K2
参考数据: (ab)(cd)(ac)(bd)
P K2 k 0.05 0.010 0.001
k 3.841 6.635 10.82875 73.5
【答案】(1)女性观众评分的中位数为 ,男性观众评分的平均数为 (2)(i)男性观众不满意的
95%
概率大,详见解析(ii)填表见解析;有 的把握认为性别和对该综艺节目是否满意有关
【解析】
x
(1)根据题意,设女性观众评分的中位数为 ,
100.01100.02(x70)0.040.5
,
x75
.
550.15650.25750.3850.2950.173.5
男性观众评分的平均数为 .
(2)(i)男性观众不满意的概率大,
C C
PC
记 A表示事件:“女性观众不满意”; B表示事件:“男性观众不满意”,由直方图得 A 的估计值为
(0.010.02)100.3
,
PC
(0.0150.025)100.4
B 的估计值为 ,
所以男性观众不满意的概率大.
(ii)列联表如下图:
女性观众 男性观众 合计
“满意” 140 180 320
“不满意” 60 120 180
合计 200 300 500
500(14012018060)2
K2 5.2083.841
所以 200300320180
95%
故有 的把握认为性别和对该综艺节目是否满意有关.
19.(2019·扶风县法门高中月考(文))下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产
量x(吨)与相应的生产能耗 y (吨标准煤)的几组对照数据x 3 4 5 6
y
2.5 3.5 4 5
y x yˆ b ˆ xaˆ
(1)请根据上表提供的数据,用最小二乘法求出 关于 的线性回归方程 ;
(2)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产
100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
y 0.8x0.15
【答案】(1) (2)9.85
【解析】
(1)由系数公式可知,
4.5, 3.75,
y 0.8x0.15
所以y关于x的线性回归方程为 .
(2)当x=100时,
,90-80.15=9.85,
所以技术改造后预测生产100吨甲产品的生产能耗80.15吨标准煤,比技术改造前降低9.85吨标准煤.
20.(2020·江苏广陵·扬州中学开学考试)某企业新研发了一种产品,产品的成本由原料成本及非原料
成本组成.每批产品的非原料总成本 y (元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x 1 2 3 4 5 6 7
y
6 11 21 34 66 101 196
根据以上数据,绘制如图所示的散点图.y ablnx
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型 和指数函数模型
y cdx
分别对两个变量的关系进行拟合.
y ablnx y cdx c d
(1)根据散点图判断, 与 ( , 均为大于零的常数)哪一个适宜作为非原料总
成本 y 关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,建立 y 关于x的回归方程;
(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千
件产品.
参考数据:
7 7
y v x y xv 100.54
i i i i
i1 i1
62.14 1.54 2535 50.12 3.47
1 n
v v
其中v lgy , 7 i .
i i i1
u ,v u ,v u ,v vˆ aˆ ˆ u
参考公式:对于一组数据 1 1 , 2 2 ,…, n n ,其回归直线 的斜率和截距的最小n
uv nuv
i i
ˆ i1
二乘估计公式分别为 n , .
u2 nu2
i aˆ v ˆ u
i1
y cdx y 3.47100.25x
【答案】(1) 适宜;(2) ;(3)12千件产品.
【解析】
y cdx
(1)根据散点图判断, 适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型.
(2)由y cdx,两边同时取常用对数得 lg y lg
cdx
lgc xlgd .
lgy v vlgc xlgd
设 ,∴ ,
7
x 4,v 1.54,x2 140
∵ i ,
i1
7
xv 7xv
i i 50.12741.54 7
lgd i1 0.25
∴ 7 140742 28 .
x2 7x2
i
i1
(4,1.54) vlgcxlgd lgc0.54
把 代入 ,得 ,
vˆ0.540.25x lgyˆ 0.540.25x
∴ ,∴ ,
yˆ 100.540.25x 3.47100.25x
∴ ,
yˆ 3.47100.25x
即y关于x的回归方程为 .
g(x)3.47100.25x x101000
(3)设生产了x千件该产品.则生产总成本为 .
g(x)3.47100.25x 10000x g(12)3.47103120000123470
又 在其定义域内单调递增,且 ,
故最多能生产12千件产品.
21.(2020·四川武侯·成都七中高三开学考试(理))某厂生产不同规格的一种产品,根据检测标准,yg
x(mm) ycxb
其合格产品的质量 与尺寸 之间近似满足关系式 (b,c为大于0的常数).按照某指
(0.302,0.388)
标测定,当产品质量与尺寸的比在区间 内时为优等品.现随机抽取6件合格产品,测得数据
如下:
尺寸x(mm) 38 48 58 68 78 88
质量y(g) 16.8 18.8 20.7 22.4 24 25.5
y
质量与尺寸的比 0.442 0.392 0.357 0.329 0.308 0.290
x
(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率;
(2)根据测得数据作了初步处理,得相关统计量的值如下表:
6 6 6 6
lnx ln y lnx lny lnx 2
i i i i i
i1 i1 i1 i1
75.3 24.6 18.3 101.4
根据所给统计量,求y关于x的回归方程.
v ,u (i 1,2, ,6)
附:对于样本 i i ,其回归直线ubva的斜率和截距的最小二乘法估计公式分别为:
n n
v vu u vu nvu
i i i i
ˆ
b i1 i1
n n , , .
v v2 v2 nv2
i i aˆ u b ˆ v e2.7183
i1 i1
1
【答案】(1)5;(2)yˆ ex0.5 .
【解析】
y
(0.302,0.388)
(1)由已知,优等品的质量与尺寸的比 x ,
a,b,c
则随机抽取的6件合格产品中,有3件为优等品,记为 ,d,e, f
有3件为非优等品,记为 ,
现从抽取的6件合格产品中再任选2件,基本事件为:
(a,b),(a,c),(a,d),(a,e)(a, f),(b,c),(b,d),(b,e),(b, f),(c,d)
(c,e),(c, f),(d,e),(d, f),(e, f)
,
(a,b),(a,c),(b,c)
选中的两件均为优等品的事件为 ,
3 1
所以所求概率为 .
15 5
ycxb ln ylncblnx
(2)对 两边取自然对数得
令 v i lnx i ,u i ln y i,则 ubva ,且 alnc
由所给统计量及最小二乘估计公式有:
6
vu 6uv
i i 75.324.618.36 0.27 1
b ˆ i1
6 101.424.62 6 0.54 2
v2 6v2
i
i1
1
18.3 24.6
ˆ 2
aˆ u bv 1,
6
由aˆlncˆ得cˆe,
y x yˆ ex0.5
所以 关于 的回归方程为 .
22.(2020·梅河口市第五中学其他(理))2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,
但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价
(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)y ab x y cdlnx
根据散点图选择 和 两个模型进行拟合,经过数据处理得到两个回归方程分别为
y 0.93690.0285 x y 0.95540.0306lnx
和 ,并得到以下一些统计量的值:
y 0.93690.0285 x y 0.95540.0306lnx
13 2
y y 0.000591 0.000164
i i
i1
13 y y 2 0.006050
i
i1
R2
(1)请利用相关指数 判断哪个模型的拟合效果更好;
m(70m160)
(2)某位购房者拟于2020年4月购买这个小区 平方米的二手房(欲购房为其家庭首套
房).
若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问
题:
(i)估算该购房者应支付的购房金额;(购房金额房款税费,房屋均价精确到0.001万元/平方米)
(ii)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精
确到1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格房款)进
行征收的.1%
房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为 ;首套面积90
1.5% 3%
平方米以上且140平方米以内(含140平方米) ;首套面积140平方米以上或非首套为 .
ln20.69 ln31.10 ln172.83 ln192.94 2 1.41 3 1.73
参考数据: , , , , , ,
17 4.12 19 4.36
, .
n 2
y y
i i
R2 1 i1
参考公式:相关指数 n y y 2 .
i
i1
【答案】(1)模型二拟合效果好;(2)(i)2020年4月份二手房均价的预测值为1.044(万元/平方
米);(ii)最大面积为94平方米;
【解析】
yˆ 0.93690.0285 x
解:(1)模型一中, 的残差平方和为0.000591,
0.000591
相关指数为1 0.923;
0.006050
yˆ 0.95540.0306lnx
模型二中, 的残差平方和为0.000164,
0.000164
相关指数为1 0.973;
0.006050
相关指数较大的模型二拟合效果好些;
x18
(2)通过散点图确定2020年4月对应的 ,
代入(1)中拟合效果更好的模型二,代入计算
yˆ 0.95540.0306ln18
0.95540.0306(ln22ln3)
0.95540.0306(0.6921.10)
1.044(万元/平方米);
则2020年4月份二手房均价的预测值为1.044(万元/平方米);(i) h
设该购房者应支付的购房金额 万元,因为税费中买方只需缴纳契税,
70剟m 90 1%
①当 时,契税为计税价格的 ,
hm1.044(1%1)1.05444m
故 ;
90m�144 1.5%
②当 时,契税为计税价格的 ,
hm1.044(1.5%1)1.05966m
故 ;
144m�160 3%
③当 时,契税为计税价格的 ,
hm1.044(3%1)1.07532m
故 ;
1.05444m,70剟m 90
h1.05966m,90m�144
;
1.07532m,144m�160
70剟m 90 1.05444m
当 时购房金额为 万元,
90m�144 1.05966m
当 时购房金额为 万元,
144m�160 1.07532m
当 时购房金额为 万元;
(ii) t
设该购房者可购买该小区二手房的最大面积为 平方米,
(i) 70剟m 90 1.05444t
由 知,当 时,应支付的购房金额为 ,
1.05444t�1.0544490100
又 ;
/ t 100 90�t 100
又因为房屋均价约为1.044万元 平方米,所以 ,所以 ,
100 100
t� 94.4
由1.05966t�100,解得 1.05966,且1.05966 ,
所以该购房者可购买该小区二手房的最大面积为94平方米.