当前位置:首页>文档>专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)

专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)

  • 2026-02-15 17:56:18 2026-02-15 11:55:22

文档预览

专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)
专题38成对数据的统计分析(单元测试卷)解析版_E015高中全科试卷_数学试题_选修3_05.专项训练_专题38成对数据的统计分析(单元测试卷)

文档信息

文档格式
doc
文档大小
0.774 MB
文档页数
22 页
上传时间
2026-02-15 11:55:22

文档内容

专题38 《成对数据的统计分析》单元测试卷 一、单选题 1.(2020·甘肃省会宁县第二中学期中(文))某商品销售量y(件)与销售价格x(元/件)负相关,则 其回归方程可能是( ) yˆ 10x200 yˆ 10x200 A. B. yˆ 10x200 yˆ 10x200 C. D. 【答案】A 【解析】 x yˆ 因为商品销售量 与销售价格 负相关,所以排除B,D选项, x0 yˆ 10x200 yˆ 2000 将 代入 可得 ,不符合实际.故A正确. yˆ b ˆ xaˆ b ˆ 0 x,yˆ b ˆ 0 x,yˆ 点睛:线性回归方程 当 时 负相关;当 时 正相关. 2.(2020·福建湖里·厦门双十中学高二期中)在一组样本数据 (x 1, y 1 ) , (x 2, y 2 ) ,  , (x n, y n )(n�2 , 1 y  x2 x 1 , x 2 , x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i1,2,,n)都在直线 3 上,则这组样本数据的样本相关系数为( ) 1  A.1 B.0 C. 3 D.1 【答案】A 【解析】 1 y  x2 因为回归直线方程是 3 , 所以这两个变量是负相关,故这组样本数据的样本相关系数为负值, (x y )(i1  n) 又所有样本点 i, i ,2, , 都在直线上,r 1 所以 , 所以相关系数r 1. 故选:A. 3.(2020·福建湖里·厦门双十中学高二期中)已知四个命题: R2 R2 ①在回归分析中, 可以用来刻画回归效果, 的值越大,模型的拟合效果越好; K2 ②在独立性检验中,随机变量 的值越大,说明两个分类变量有关系的可能性越大; y 0.2x12 x y ③在回归方程 中,当解释变量 每增加1个单位时,预报变量 平均增加1个单位; ④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是: A.①④ B.②④ C.①② D.②③ 【答案】C 【解析】 R2 R2 对于①,在回归分析中, 可以用来刻画回归效果, 的值越大,模型的拟合效果越好,正确;对于②; K2 在独立性检验中,随机变量 的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回 yˆ 0.2x12 x yˆ 0.2 归方程 中,当解释变量 每增加1个单位时,预报变量 平均增加 个单位,错误;对于 ④,两个随机变量相关性越强,则相关系数的绝对值越接近于1,错误;故选C. 4.(2020·河南南阳·期末(理))利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通 过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:得到 的正确结论是( ) P(K2 k) 0.01 0.05 0.025 0.010 0.005 0.001 0 k 2.706 3.841 5.024 6.635 7.879 10.828 0 A.有99%以上的把握认为“爱好该项运动与性别无关” B.有99%以上的把握认为“爱好该项运动与性别有关”、 C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关” 【答案】B 【解析】 K2 7.2456.635 由 ,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B 5.(2020·四川邻水实验学校开学考试(理))在一次独立性检验中得到如下列联表: A A 总计 1 2 B 200 800 1000 1 B 180 a 180+a 2 总计 380 800+a 1180+a 若这两个分类变量A和B没有关系,则a的可能值是( ) A.200 B.720 C.100 D.180 【答案】B 【解析】 当a=720时,k= =0, 易知此时两个分类变量没有关系. 故答案为B 6.(2020·赣州市赣县第三中学月考(文))某市政府在调查市民收入增减与旅游愿望的关系时,采用 K2 k 6.023 独立性检验法抽查了3000人,计算发现 的观测值 ,根据这一数据查阅表,市政府断言“市民 收入增减与旅游愿望有关系”这一断言犯错误的概率不超过( ) P  K2 k  0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 0A.0.005 B.0.025 C.0.05 D.0.1 【答案】B 【解析】 k 6.023 ∵ ,6.023>5.024, ∴市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过0.025, 故选:B. 7.(2020·福建期末)红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观侧 数据.用4种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根 据残差图,拟合效果最好的模型是( ) A.模型一 B.模型二 C.模型三 D.模型四 【答案】D 【解析】 当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适, 这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好, 对比4个残差图,可知模型四的图对应的带状区域的宽度最窄. 故选:D. x,y 8.(2020·辽宁期末)相关变量 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根 y bxa r (10,21) 据图中所有数据,得到线性回归方程 1 1,相关系数为 1;方案二:剔除点 ,根据剩下数 y b xa r 据得到线性回归直线方程: 2 2,相关系数为 2.则( )0r r 1 A. 1 2 0r r 1 B. 2 1 1r r 0 C. 1 2 1r r 0 D. 2 1 【答案】D 【解析】 r,r 0 10,21 r 由散点图得负相关,所以 1 2 ,因为剔除点 后,剩下点数据更具有线性相关性, 更接近1, 1r r 0 所以 2 1 .选D. 二、多选题 22 K2 9.(2020·山东省招远第一中学高二月考)某课外兴趣小组通过随机调查,利用 残联表和 统计量 P  K2 6.635  0.010 研究数学成绩优秀是否与性别有关.计算得K2 6.748,经查阅临界值表知 ,则 下列判断正确的是( ) 100 1 A.每 个数学成绩优秀的人当中就会有 名是女生 0.010 B.若某人数学成绩优秀,那么他为男生的概率是 99% C.有 的把握认为“数学成绩优秀与性别有关”1% D.在犯错误的概率不超过 的前提下认为“数学成绩优秀与性别有关” 【答案】CD 【解析】 K2 6.7486.635 99% 因为 ,所以有 的把握认为“数学成绩优秀与性别有关”即在犯错误的概率不超 过1%的前提下认为“数学成绩优秀与性别有关”. 故选:CD 10.(2020·南京市秦淮中学开学考试)为了对变量 x 与 y 的线性相关性进行检验,由样本点 x 1 ,y 1  、 x ,y  x ,y  2 2 、、 10 10 求得两个变量的样本相关系数为r,那么下面说法中错误的有( ) y 2x1 r 1 A.若所有样本点都在直线 上,则 y 2x1 r 2 B.若所有样本点都在直线 上,则 r x y C.若 越大,则变量 与 的线性相关性越强 r x y D.若 越小,则变量 与 的线性相关性越强 【答案】ABD 【解析】 y 2x1 r 1 若所有样本点都在直线 上,且直线斜率为负数,则 ,A、B选项均错误; r x y 若 越大,则变量 与 的线性相关性越强,C选项正确,D选项错误. 故选:ABD. 11.(2020·广东梅州·高二期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关 4 “作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的5 ,女生喜欢抖音的 3 人数占女生人数5,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人附表: P  K2 k  0.100 0.050 0.010 0.005 0.001 k 2.706 3.841 6.635 7.879 10.828 n(ad bc)2 K2  附: (ab)(cd)(ac)(bd) A.25 B.35 C.45 D.60 【答案】CD 【解析】 设男生可能有x人,依题意得女生有x人,可得22列联表如下: 喜欢抖音 不喜欢抖音 总计 4 1 男生 x x x 5 5 3 2 女生 x x x 5 5 7 3 合计 x x 2x 5 5 K2 3.841 若有95%的把握认为是否喜欢抖音和性别有关,则 , 2 4 2 3 1  2x x x x x  5 5 5 5  2 K   x 3.841 即 7 3 21 ,解得 , x xxx 5 5 x 40.335 x0 由题意知 ,且x是5的整数倍,所以45和60都满足题意. 故选:CD. 12.(2020·广东南海·期末)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间 的对应数据如下表所示: 广告支出费用x 2.2 2.6 4.0 5.3 5.9 销售量y 3.8 5.4 7.0 11.6 12.2y 2.27xa R2 0.96 根据表中的数据可得回归直线方程 , ,以下说法正确的是( )  A.第三个样本点对应的残差e 1 3 B.在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中 C.销售量的多少有96%是由广告支出费用引起的 D.用该回归方程可以比较准确地预测广告费用为20万元时的销售量 【答案】AC 【解析】 2.22.64.05.35.9 3.85.47.011.612.2 x 4, y  8 由题意得 5 5 ,将之代入回归方程  y 2.27xa中得82.274a,得a 1.08,故回归直线方程为y 2.27x1.08,所以  e 72.2741.081,A正确; 3 R2 0.96 由于 ,所以该回归模型拟合的效果比较好,故对应的残差图中残差点应该比较均匀地分布在水 平的带状区域中,B错误; R2 在线性回归模型中 表示解释变量对于预报变量的贡献率,R2≈0.96,则销售量的多少有96%是由广告支 出费用引起的,C正确; 由于样本的取值范围会影响回归方程的使用范围,而广告费用20万元远大于表格中广告费用值,故用该回 归方程不能准确地预测广告费用为20万元时的销售量,故D错误. 故选:AC. 三、填空题 13.(2020·吉林高二期末(文))某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对 22 abd  外翻译工作,在如表“性别与会外语”的 列联表中, ___________. 会外语 不会外语 总计 男 a b 20女 6 d 总计 18 50 【答案】44 【解析】  a618   ab20 由题意有:  abd 650  a12 b8 d 24 abd 1282444 所以 , , , . 故答案为:44. 14.(2020·湖南期末)某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国 100 外潜在用户代表各 名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图, ______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关. (参考公式与数据: nad bc2 K2  ,其中 ) abcdacbd nabcd P  K2 k  0.05 0.01 0.005 0.001 0k 3.841 6.635 7.879 10.828 0 【答案】有 【解析】 依题意,可得出如下22列联表: 国内代表 国外代表 合计 不乐观 40 60 100 乐观 60 40 100 合计 100 100 200 200  402 6022 K2  87.879, 1004 所以有99.5%以上的把握认为持乐观态度和国内外差异有关. 故答案为:有. y 0.85x85.7 15.(2019·湖北期中(理))由样本数据得到,女大学生的身高预报体重的回归方程是 y cm kg 170,61 (其中x, 的单位分别是 , ),则此方程在样本 处残差的绝对值是______. 【答案】2.2 【解析】 y 0.85x85.7 由样本数据得到,女大学生的身高预报体重的回归方程是 , x170 y 0.8517085.758.8 当 时, ; 170,61 58.861 2.2 此方程在样本 处残差的绝对值: . 故答案为:2.2. 16.(2017·北京石景山·高三一模(文))在环境保护部公布的2016年74城市PM2.5月均浓度排名情况中, 某14座城市在74城的排名情况如下图所示,甲、乙、丙为某三座城市.从排名情况看, ① 在甲、乙两城中,2月份名次比1月份名次靠前的城市是_________; ②在第1季度的三个月中,丙城市的名次最靠前的月份是_________. 【答案】乙 二月份 【解析】 结合题设中提供的散点图可知:城市乙更靠近回归直线,答案应填乙;结合第二个散点图可以看出丙城市 的名次更靠近二月份,答案应填二月份. 四、解答题 17.(2020·沙坪坝·重庆一中高三其他(文))截止2020年5月15日,新冠肺炎全球确诊数已经超过 440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构 收集了1000名患者的病毒潜伏期的信息,将数据统计如下表所示: 潜伏期 0-2天 2-4天 4-6天 6-8天 8-10天 10-12天 12-14天 人数 40 160 300 360 60 60 20 x (1)求1000名患者潜伏期的平均数 (同一组中的数据用该组区间的中点值作代表); (2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期高于平均数的患者,称为“长潜伏者”.为研究 潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中 抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有99.9%的把握认为潜伏期 长短与患者年龄有关.短潜伏者 长潜伏者 合计 60岁及以上 100 60岁以下 140 合计 300 附表及公式: P  K2 k  0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 0 n(ad bc)2 K2  (ab)(cd)(ac)(bd) 【答案】(1)6;(2)填表见解析;有99.9%的把握认为潜伏期长短与患者年龄有关 【解析】 40 160 300 360 60 60 20 x 1 3 5 7 9 11 13 (1) 1000 1000 1000 1000 1000 1000 1000 4048015002520540660260 6000   1000 1000 6. 40160300 300 150 (2)抽取的短潜伏者的总人数为 1000 ,长潜伏者的总人数为300150150. 列联表如下: 短潜伏者 长潜伏者 合计 60岁及以上 100 60 160 60岁以下 50 90 140 合计 150 150 300 300(100905060)2 150 K2   150150140160 7 21.429 10.828. 故有99.9%的把握认为潜伏期长短与患者年龄有关.2019 18.(2020·甘肃省会宁县第二中学期中(文)) 年中央电视台在周日晚上推出的一档新的综艺节目, 为了解节目效果,一次节目结束后,现随机抽取了500名观众(含200名女性)的评分(百分制)进行分 析,分别得到如图所示的两个频率分布直方图. (1)计算女性观众评分的中位数与男性观众评分的平均分; 70 70 (2)若把评分低于 分定为“不满意”,评分不低于 分定为“满意”. (i)试比较男观众与女观众不满意的概率大小,并说明理由; 22 95% (ii)完成下列 列联表,并回答是否有 的把握认为性别和对该综艺节目是否满意有关. 女性观众 男性观众 合计 “满意” “不满意” 合计 n(ad bc)2 K2  参考数据: (ab)(cd)(ac)(bd) P  K2 k  0.05 0.010 0.001 k 3.841 6.635 10.82875 73.5 【答案】(1)女性观众评分的中位数为 ,男性观众评分的平均数为 (2)(i)男性观众不满意的 95% 概率大,详见解析(ii)填表见解析;有 的把握认为性别和对该综艺节目是否满意有关 【解析】 x (1)根据题意,设女性观众评分的中位数为 , 100.01100.02(x70)0.040.5 , x75 . 550.15650.25750.3850.2950.173.5 男性观众评分的平均数为 . (2)(i)男性观众不满意的概率大, C C PC  记 A表示事件:“女性观众不满意”; B表示事件:“男性观众不满意”,由直方图得 A 的估计值为 (0.010.02)100.3 , PC  (0.0150.025)100.4 B 的估计值为 , 所以男性观众不满意的概率大. (ii)列联表如下图: 女性观众 男性观众 合计 “满意” 140 180 320 “不满意” 60 120 180 合计 200 300 500 500(14012018060)2 K2  5.2083.841 所以 200300320180 95% 故有 的把握认为性别和对该综艺节目是否满意有关. 19.(2019·扶风县法门高中月考(文))下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产 量x(吨)与相应的生产能耗 y (吨标准煤)的几组对照数据x 3 4 5 6 y 2.5 3.5 4 5 y x yˆ b ˆ xaˆ (1)请根据上表提供的数据,用最小二乘法求出 关于 的线性回归方程 ; (2)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产 100吨甲产品的生产能耗比技术改造前降低多少吨标准煤? y 0.8x0.15 【答案】(1) (2)9.85 【解析】 (1)由系数公式可知, 4.5, 3.75, y 0.8x0.15 所以y关于x的线性回归方程为 . (2)当x=100时, ,90-80.15=9.85, 所以技术改造后预测生产100吨甲产品的生产能耗80.15吨标准煤,比技术改造前降低9.85吨标准煤. 20.(2020·江苏广陵·扬州中学开学考试)某企业新研发了一种产品,产品的成本由原料成本及非原料 成本组成.每批产品的非原料总成本 y (元)与生产该产品的数量x(千件)有关,经统计得到如下数据: x 1 2 3 4 5 6 7 y 6 11 21 34 66 101 196 根据以上数据,绘制如图所示的散点图.y ablnx 观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型 和指数函数模型 y cdx 分别对两个变量的关系进行拟合. y ablnx y cdx c d (1)根据散点图判断, 与 ( , 均为大于零的常数)哪一个适宜作为非原料总 成本 y 关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表1中的数据,建立 y 关于x的回归方程; (3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千 件产品. 参考数据: 7 7 y v x y xv 100.54 i i i i i1 i1 62.14 1.54 2535 50.12 3.47 1 n v  v 其中v lgy , 7 i . i i i1 u ,v  u ,v  u ,v  vˆ aˆ ˆ u 参考公式:对于一组数据 1 1 , 2 2 ,…, n n ,其回归直线 的斜率和截距的最小n uv nuv i i  ˆ  i1 二乘估计公式分别为 n , . u2 nu2 i aˆ v  ˆ u i1 y cdx y 3.47100.25x 【答案】(1) 适宜;(2) ;(3)12千件产品. 【解析】 y cdx (1)根据散点图判断, 适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型. (2)由y cdx,两边同时取常用对数得 lg y lg  cdx lgc xlgd . lgy v vlgc xlgd 设 ,∴ , 7 x 4,v 1.54,x2 140 ∵ i , i1 7 xv 7xv i i 50.12741.54 7 lgd  i1   0.25 ∴ 7 140742 28 . x2 7x2 i i1 (4,1.54) vlgcxlgd lgc0.54 把 代入 ,得 , vˆ0.540.25x lgyˆ 0.540.25x ∴ ,∴ , yˆ 100.540.25x 3.47100.25x ∴ , yˆ 3.47100.25x 即y关于x的回归方程为 . g(x)3.47100.25x x101000 (3)设生产了x千件该产品.则生产总成本为 . g(x)3.47100.25x 10000x g(12)3.47103120000123470 又 在其定义域内单调递增,且 , 故最多能生产12千件产品. 21.(2020·四川武侯·成都七中高三开学考试(理))某厂生产不同规格的一种产品,根据检测标准,yg x(mm) ycxb 其合格产品的质量 与尺寸 之间近似满足关系式 (b,c为大于0的常数).按照某指 (0.302,0.388) 标测定,当产品质量与尺寸的比在区间 内时为优等品.现随机抽取6件合格产品,测得数据 如下: 尺寸x(mm) 38 48 58 68 78 88 质量y(g) 16.8 18.8 20.7 22.4 24 25.5 y 质量与尺寸的比 0.442 0.392 0.357 0.329 0.308 0.290 x (1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表: 6 6 6 6 lnx ln y  lnx  lny  lnx 2 i i i i i i1 i1 i1 i1 75.3 24.6 18.3 101.4 根据所给统计量,求y关于x的回归方程. v ,u (i 1,2, ,6) 附:对于样本 i i  ,其回归直线ubva的斜率和截距的最小二乘法估计公式分别为: n n v vu u vu nvu i i i i ˆ b i1  i1 n n , , . v v2 v2 nv2 i i aˆ u b ˆ v e2.7183 i1 i1 1 【答案】(1)5;(2)yˆ ex0.5 . 【解析】 y (0.302,0.388) (1)由已知,优等品的质量与尺寸的比 x , a,b,c 则随机抽取的6件合格产品中,有3件为优等品,记为 ,d,e, f 有3件为非优等品,记为 , 现从抽取的6件合格产品中再任选2件,基本事件为: (a,b),(a,c),(a,d),(a,e)(a, f),(b,c),(b,d),(b,e),(b, f),(c,d) (c,e),(c, f),(d,e),(d, f),(e, f) , (a,b),(a,c),(b,c) 选中的两件均为优等品的事件为 , 3 1 所以所求概率为  . 15 5 ycxb ln ylncblnx (2)对 两边取自然对数得 令 v i lnx i ,u i ln y i,则 ubva ,且 alnc 由所给统计量及最小二乘估计公式有: 6 vu 6uv i i 75.324.618.36 0.27 1 b ˆ  i1    6 101.424.62 6 0.54 2 v2 6v2 i i1  1  18.3 24.6   ˆ  2  aˆ u bv  1, 6 由aˆlncˆ得cˆe, y x yˆ ex0.5 所以 关于 的回归方程为 . 22.(2020·梅河口市第五中学其他(理))2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重, 但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价 (单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)y ab x y cdlnx 根据散点图选择 和 两个模型进行拟合,经过数据处理得到两个回归方程分别为 y 0.93690.0285 x y 0.95540.0306lnx 和 ,并得到以下一些统计量的值: y 0.93690.0285 x y 0.95540.0306lnx 13  2  y  y 0.000591 0.000164 i i i1  13  y  y 2 0.006050 i i1 R2 (1)请利用相关指数 判断哪个模型的拟合效果更好; m(70m160) (2)某位购房者拟于2020年4月购买这个小区 平方米的二手房(欲购房为其家庭首套 房). 若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问 题: (i)估算该购房者应支付的购房金额;(购房金额房款税费,房屋均价精确到0.001万元/平方米) (ii)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精 确到1平方米) 附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格房款)进 行征收的.1% 房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为 ;首套面积90 1.5% 3% 平方米以上且140平方米以内(含140平方米) ;首套面积140平方米以上或非首套为 . ln20.69 ln31.10 ln172.83 ln192.94 2 1.41 3 1.73 参考数据: , , , , , , 17 4.12 19 4.36 , . n  2  y  y i i R2 1 i1 参考公式:相关指数  n  y  y 2 . i i1 【答案】(1)模型二拟合效果好;(2)(i)2020年4月份二手房均价的预测值为1.044(万元/平方 米);(ii)最大面积为94平方米; 【解析】 yˆ 0.93690.0285 x 解:(1)模型一中, 的残差平方和为0.000591, 0.000591 相关指数为1 0.923; 0.006050 yˆ 0.95540.0306lnx 模型二中, 的残差平方和为0.000164, 0.000164 相关指数为1 0.973; 0.006050  相关指数较大的模型二拟合效果好些; x18 (2)通过散点图确定2020年4月对应的 , 代入(1)中拟合效果更好的模型二,代入计算 yˆ 0.95540.0306ln18 0.95540.0306(ln22ln3) 0.95540.0306(0.6921.10) 1.044(万元/平方米); 则2020年4月份二手房均价的预测值为1.044(万元/平方米);(i) h 设该购房者应支付的购房金额 万元,因为税费中买方只需缴纳契税, 70剟m 90 1% ①当 时,契税为计税价格的 , hm1.044(1%1)1.05444m 故 ; 90m�144 1.5% ②当 时,契税为计税价格的 , hm1.044(1.5%1)1.05966m 故 ; 144m�160 3% ③当 时,契税为计税价格的 , hm1.044(3%1)1.07532m 故 ; 1.05444m,70剟m 90  h1.05966m,90m�144 ;  1.07532m,144m�160   70剟m 90 1.05444m 当 时购房金额为 万元, 90m�144 1.05966m 当 时购房金额为 万元, 144m�160 1.07532m 当 时购房金额为 万元; (ii) t 设该购房者可购买该小区二手房的最大面积为 平方米, (i) 70剟m 90 1.05444t 由 知,当 时,应支付的购房金额为 , 1.05444t�1.0544490100 又 ; / t 100 90�t 100 又因为房屋均价约为1.044万元 平方米,所以 ,所以 , 100 100 t� 94.4 由1.05966t�100,解得 1.05966,且1.05966 , 所以该购房者可购买该小区二手房的最大面积为94平方米.