当前位置:首页>文档>第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章

第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章

  • 2026-03-26 11:36:48 2026-03-26 11:33:49

文档预览

第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章
第九章 §9.3 线性回归分析、独立性检验_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(苏教版)_第七章~第十章

文档信息

文档格式
docx
文档大小
0.617 MB
文档页数
18 页
上传时间
2026-03-26 11:33:49

文档内容

§9.3 线性回归分析、独立性检验 课标要求 1.了解相关系数的统计含义.2.了解线性回归模型和2×2列联表,会运用这些方 法解决简单的实际问题.3.会利用统计软件进行数据分析. 知识梳理 1.变量的相关关系 (1)相关关系:两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相 关关系. (2)相关关系的分类:正相关和负相关. (3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线 附近,我们称这两个变量线性相关. 2.相关系数 (1)r= = =. (2)-1≤r≤1. (3)r>0时y与x呈正相关关系,r<0时y与x呈负相关关系. (4)|r|越接近1,y与x相关的程度就越强,|r|越接近0,y与x相关的程度就越弱. 通常情况下,当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关 系. 3.线性回归方程 我们将y=bx+a称为y关于x的线性回归方程, 其中b= ==, a=-b. 4.列联表与独立性检验 (1)一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即 类1和类2.我们得到如下列联表所示的抽样数据: Ⅱ 合计 类1 类2 类A a b a+b Ⅰ 类B c d c+d 合计 a+c b+d a+b+c+d上述表格称为2×2列联表. (2)计算随机变量χ2=,利用χ2的取值推断分类变量Ⅰ和Ⅱ是否独立的方法称为χ2独立性检 验. P(χ2≥x) 0.10 0.05 0.010 0.005 0.001 0 x 2.706 3.841 6.635 7.879 10.828 0 常用结论 1.回归直线过点(,). 2.求b时,常用公式b=. 3.回归分析和独立性检验都是基于样本观测数据进行估计或推断,得出的结论都可能犯错 误. 自主诊断 1.判断下列结论是否正确.(请在括号中打“√”或“×”) (1)散点图是判断两个变量相关关系的一种重要方法和手段.( √ ) (2)回归直线y=bx+a至少经过点(x,y),(x,y),…,(x,y)中的一个点.( × ) 1 1 2 2 n n (3)相关系数的绝对值越接近1,样本数据的线性相关程度越强.( √ ) (4)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( × ) 2.(多选)(2023·石嘴山模拟)下列有关回归分析的说法中正确的是( ) A.相关关系是一种确定性的关系 B.回归直线就是散点图中经过样本数据点最多的那条直线 C.当相关系数r>0时,两个变量正相关 D.两个变量的线性相关性越弱,|r|越接近于0 答案 CD 解析 相关关系是不确定的关系,故A错; 回归直线在散点图中可能不经过任一样本数据点,故B错; 当相关系数r>0时,两个变量正相关,故C对; 两个变量的线性相关性越弱,|r|越接近于0,故D对. 3.(2023·福州统考)已知变量x和y的统计数据如表: x 6 7 8 9 10 y 3.5 4 5 6 6.5 若由表中数据得到线性回归方程为y=0.8x+a,则当x=10时的残差为________(注:实际观 测值减去预测值称为残差).答案 -0.1 解析 ==8, ==5, 则a=5-0.8×8=-1.4, 所以y=0.8x-1.4,当x=10时,y=6.6, 所以当x=10时的残差为6.5-6.6=-0.1. 4.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表所 示: 主修专业 性别 合计 非统计专业 统计专业 男 13 10 23 女 7 20 27 合计 20 30 50 为了判断主修专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2>3.841, 所以有________的把握可以判定主修专业与性别有关系. 附: P(χ2≥x) 0.05 0.01 0.001 0 x 3.841 6.635 10.828 0 答案 95% 解析 因为χ2>3.841, 所以有95%的把握可以判定主修专业与性别有关. 题型一 变量的相关性 例1 (1)(2023·天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中样本相关系 数r=0.824 5,则下列说法正确的是( ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈负相关 C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5 答案 C 解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故A错误; 散点的分布是从左下到右上,从而花瓣长度和花萼长度呈正相关,故B错误,C正确; 由于r=0.824 5是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱, 即取出的数据的相关系数不一定是0.824 5,故D错误. (2)(多选)(2023·湛江模拟)某服装生产商为了解青少年的身高和体重的关系,在 15岁的男生 中随机抽测了10人的身高和体重,数据如表所示: 编号 1 2 3 4 5 6 7 8 9 10 身高/cm 165 168 170 172 173 174 175 177 179 182 体重/kg 55 89 61 65 67 70 75 75 78 80 由表中数据制作成如图所示的散点图, 由最小二乘法计算得到回归直线 l 的方程为y=bx+a ,相关系数为r ,经过分析确定 1 1 1 1 (168,89)为离群点,把它去掉后,再用剩下的9对数据计算得到回归直线l 的方程为y=bx+ 2 2 a,相关系数为r.则以下结论中正确的有( ) 2 2 A.a>a B.ar 1 2 1 2 1 2 1 2 答案 AC 解析 身高的平均数为 =173.5, 因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大, 所以去掉离群点后回归直线的截距变小, 所以a>a,所以A正确,B错误; 1 2 去掉离群点后样本数据的线性相关程度更强,拟合效果会更好, 所以r0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强. (3)线性回归方程:当b>0时,正相关;当b<0时,负相关. 跟踪训练1 (1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到样本 数据如表所示: x 3 4 5 6 7 y 3.5 2.4 1.1 -0.2 -1.3 根据表格中的数据求得线性回归方程为y=bx+a,则下列说法中正确的是( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案 B 解析 由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以 b<0.又=×(3+4+5+6+7)=5,=×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5b+a,所以a =1.1-5b>0. (2)已知相关变量x和y的散点图如图所示,若用y=b·ln(kx)与y=kx+b 拟合时的相关系数 1 1 2 2 分别为r,r 则比较r,r 的大小结果为( ) 1 2 1 2 A.r>r B.r=r 1 2 1 2 C.r|r|, 1 1 2 2 1 2 又因为x,y负相关,所以-r>-r,即r0.75时,两个变量之间具有很强的线性相关关 系. 参考数据:≈5.9. 解 (1)因为==5, ==18. (x-)(y-)=16+12+5+0+0+3+6+27=69, i i (x-)2=4+4+1+0+0+1+1+9=20, i (y-)2=64+36+25+0+1+9+36+81=252, i 所以r===≈0.97. 由于|r|>0.75且r非常接近1, 所以y与x具有很强的线性相关关系. 经计算可得 b===3.45, a=-b=18-3.45×5=0.75, 所以所求线性回归方程为y=3.45x+0.75. (2)①当x=10时,y=3.45×10+0.75=35.25, 所以预计能带动的消费达35.25百万元. ②因为≈14.89%>10%, 所以发放的该轮消费券助力消费复苏不理想. 发放消费券只是影响消费的其中一个因素,还有其他重要因素,比如:A城市经济发展水平 不高,居民的收入水平直接影响了居民的消费水平;A城市人口数量有限、商品价格水平、 消费者偏好、消费者年龄构成等因素一定程度上影响了消费总量.(只要写出一个原因即可). 命题点2 非线性回归模型 例3 (2024·朝阳模拟)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警 之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始 在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下: 日期 第一天 第二天 第三天 第四天 第五天 第六天 第七天 日期代码x 1 2 3 4 5 6 7 杯数y 4 15 22 26 29 31 32 (1)请根据以上数据,绘制散点图,并根据散点图判断,y=a+bx与y=c+dln x哪一个更适 宜作为y关于x的回归方程模型(给出判断即可,不必说明理由); (2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一 天售出的奶茶才能超过35杯? 参考数据: y y e2.1 i i i i 22.7 1.2 759 235.1 13.2 8.2 其中u=ln x,=. i i i 参考公式: 在线性回归方程y=bx+a中,b=, a=-b. 解 (1)根据散点图,知y=c+dln x更适宜作为y关于x的回归方程模型. (2)令u=ln x,则y=c+du, 由已知数据得d==≈14.2, c=-d≈22.7-14.2×1.2≈5.7, 所以y=5.7+14.2u, 故y关于x的回归方程为y=5.7+14.2ln x, 令5.7+14.2ln x>35,整理得ln x>2.1,即x>e2.1≈8.2, 故当x=9时,即到第9天才能超过35杯. 思维升华 求线性回归方程的步骤 跟踪训练2 小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20 家服装店,统计得到了它们的面积x(单位:m2)和日均客流量y(单位:百人)的数据(x,y)(i i i =1,2,…,20),并计算得 =2 400,=210,(x-)2=42 000,(x-)·(y-)=6 300. i i i i i (1)求y关于x的线性回归方程; (2)已知服装店每天的经济效益W=k+mx(k>0,m>0),该商场现有60~150 m2的商铺出租, 根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺? 附:回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=, a=-b. 解 (1)由已知可得==120, i ==10.5, i b===0.15, a=-b=10.5-0.15×120=-7.5, 所以线性回归方程为y=0.15x-7.5. (2)根据题意得Z==+m,60≤x≤150. 设f(x)==-, 令t=,≤t≤, 则f(x)=g(t)=0.15t-7.5t2=-7.5×(t-0.01)2+0.000 75, 当t=0.01,即x=100时,f(x)取最大值, 又因为k>0,m>0,所以此时Z也取最大值, 因此,小李应该租100 m2的商铺. 题型三 列联表与独立性检验 例4 (2023·全国甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地 将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环 境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位: g). (1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的概率分布和数学期望;(2)试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数 据的个数,完成如下列联表: 3.841, 所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 思维升华 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断. 跟踪训练3 (2024·哈尔滨模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的 《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他 们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生问题, 同时也在讨论青春中国的社会问题,受到了青年观众的喜爱.为了了解观众对节目的喜爱程 度,电视台随机调查了A,B两个地区的100名观众,得到如表所示的2×2列联表. 非常喜欢 喜欢 合计 A 30 15 B 合计 已知在被调查的100名观众中随机抽取1名,该观众来自B地区且喜爱程度为“非常喜欢” 的概率为0.35. (1)现从100名观众中根据喜爱程度用分层抽样的方法抽取20名进行问卷调查,则应抽取喜 爱程度为“非常喜欢”的A,B地区的人数各是多少? (2)完成上述表格,能否认为观众的喜爱程度与所在地区有关? 附:χ2=, n=a+b+c+d. P(χ2≥x) 0.15 0.10 0.05 0.01 0.001 0 x 2.072 2.706 3.841 6.635 10.828 0 解 (1)由题意得来自B地区且喜爱程度为“非常喜欢”的观众为0.35×100=35(人), 所以应从A地区抽取30×=6(人), 从B地区抽取35×=7(人). (2)完成表格如表: 非常喜欢 喜欢 合计 A 30 15 45 B 35 20 55合计 65 35 100 提出假设H:观众的喜爱程度与所在地区无关. 0 χ2== ≈0.1<2.072, 因为当H 成立时,χ2≥0.1的概率大于15%,这个概率较大,所以不能否定假设H ,即不能 0 0 认为观众的喜爱程度与所在地区有关. 课时精练 一、单项选择题 1.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学 生,得到如下2×2列联表: 男 女 合计 喜欢 a b 73 不喜欢 c 25 合计 74 则a-b-c等于( ) A.7 B.8 C.9 D.10 答案 C 解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21, ∴a-b-c=52-21-22=9. 2.(2023·黄冈中学模拟)在一组样本数据(x ,y),(x ,y),…,(x ,y)(n≥2,x ,x ,…, 1 1 2 2 n n 1 2 x 互不相等)的散点图中,若所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上,则这组 n i i 样本数据的相关系数为( ) A.- B. C.-1 D.1 答案 D 解析 由题意可知,所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上, i i 则这组样本数据完全正相关,且相关系数为1. 3.下列关于独立性检验的说法正确的是( ) A.独立性检验是对两个变量是否具有线性相关关系的一种检验 B.独立性检验可以100%确定两个变量之间是否具有某种关系 C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关 系时,则我们可以说在100个吸烟的人中,有99人患肺病D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大 答案 D 解析 对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法, 并非检验二者是否是线性相关,故错误; 对于B,独立性检验并不能100%确定两个变量相关,故错误; 对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率, 故错误; 对于D,根据卡方计算的定义可知该选项正确. 4.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回 简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是( ) 身高 营养品 合计 有明显增长 无明显增长 食用 a 10 50 未食用 b 30 50 合计 60 40 100 参考公式:χ2=,其中n=a+b+c+d. 参考数据: P(χ2≥x) 0.1 0.05 0.01 0.005 0.001 0 x 2.706 3.841 6.635 7.879 10.828 0 A.a=b=30 B.χ2≈12.667 C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是 D.有99.9%的把握认为该营养品对儿童身高增长有影响 答案 D 解析 由题可知a=50-10=40,b=50-30=20,所以A错误; χ2=≈16.667, 所以我们有99.9%的把握认为该营养品对儿童身高增长有影响,所以B错误,D正确; 从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是=,所以 C错误. 5.某市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售 价x(元)和销售量y(件)之间的一组数据如表所示: 价格x(元) 90 95 100 105 110 销售量y(件) 11 10 8 6 5用最小二乘法求得y关于x的线性回归方程是y=-0.32x+a,相关系数r=-0.992 3,则下 列说法不正确的是( ) A.变量x与y负相关且相关性很强 B.a=40 C.当x=85时,y的估计值为15 D.当x=120时,y的估计值为1.6 答案 C 解析 由线性回归方程可得变量x与y 负相关,且由相关系数|r|=0.992 3,可知相关性很强, 故A正确; 由表中数据可得=×(90+95+100+105+110)=100,=×(11+10+8+6+5)=8,故回归直 线过点(100,8), 故8=-0.32×100+a,解得a=40,故B正确; 当x=85时,y=-0.32×85+40=12.8,故C错误; 当x=120时,y=-0.32×120+40=1.6,故D正确. 6.(2024·重庆模拟)设两个相关变量x和y分别满足下表: x 1 2 3 4 5 y 1 2 8 8 16 若相关变量x和y可拟合为非线性回归方程y=2bx+a,则当x=6时,y的估计值为( ) (参考公式:回归直线v=α+βu中,β=,a=-β;参考数据:1.155≈2) A.33 B.37 C.65 D.73 答案 B 解析 因为非线性回归方程为y=2bx+a, 则有log y=bx+a, 2 令log y=v,即v=bx+a, 2 列出相关变量x,y,v关系如表: x 1 2 3 4 5 y 1 2 8 8 16 v 0 1 3 3 4 所以 v=0+2+9+12+20=43, i i ==3, ==,=1+4+9+16+25=55, 所以b===1, 所以a=-b=-3=-,所以v=x-, 即log y=x-,即y= , 2 因为1.155≈2,所以 ≈1.15, 当x=6时,y= ≈32×1.15=36.8≈37. 二、多项选择题 7.(2024·南通模拟)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的 χ2独立性检验中的相应的临界值,作出下列判断,正确的是( ) P(χ2≥x) 0.1 0.05 0.01 0.005 0.001 0 x 2.706 3.841 6.635 7.879 10.828 0 A.有95%的把握认为变量x与y相互独立 B.有95%的把握认为变量x与y不相互独立 C.变量x与y相互独立,这个结论犯错误的概率不超过0.1 D.变量x与y不相互独立,这个结论犯错误的概率不超过0.1 答案 AD 解析 因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过 0.1. 8.沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要 种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长, 同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到 统计表如表所示: 年份t 2018 2019 2020 2021 2022 年份代码x 1 2 3 4 5 种植面积y/万亩 8 14 15 20 28 附:①相关系数r=; ②在线性回归方程y=bx+a中,b==,a=-b;≈47.33. 根据此表,下列结论正确的是( ) A.该地区这5年沃柑的种植面积的方差为212 B.种植面积y与年份代码x的相关系数约为0.972(精确到0.001)C.y关于x的线性回归方程为y=4.6x+3.2 D.预测该地区沃柑种植面积最早在2027年能突破40万亩 答案 BC 解析 根据题意,得==17, s=×[(-9)2+(-3)2+(-2)2+32+112] =44.8,故A错误; 由题意得==3, y=1×8+2×14+3×15+4×20+5×28=301, i i =12+22+32+42+52=55,=82+142+152+202+282=1 669, 所以r= = =≈≈0.972,故B正确; 因为b===4.6, a=-b=17-4.6×3=3.2, 所以y关于x的线性回归方程为y=4.6x+3.2,故C正确; 令y=4.6x+3.2≥40,得x≥8, 所以最小的整数为8,2 017+8=2 025, 所以该地区沃柑种植面积最早在2025年能突破40万亩,故D错误. 三、填空题 9.(2023·辽宁实验中学模拟)为了比较甲、乙、丙、丁四组数据的线性相关性的强弱,小明 分别计算了甲、乙、丙、丁四组数据的相关系数,其数值分别为-0.95,-0.87,0.76,0.92, 则这四组数据中线性相关性最强的是________组数据. 答案 甲 解析 根据题意,因为相关系数的绝对值越大,线性相关性越强. 甲、乙、丙、丁四组数据的相关系数分别为-0.95,-0.87,0.76,0.92, 所以甲组数据的线性相关性最强. 10.(2024·安庆模拟)对于数据组(x,y)(i=1,2,…,n),如果由线性回归方程得到的对应自 i i 变量x的估计值是y,那么将y-y称为对应点(x,y)的残差.某商场为了给一种新商品进行 i i i i i i 合理定价,将该商品按事先拟定的价格进行试销,得到如表所示的数据: 单价x/元 8.2 8.4 8.6 8.8 销量y/件 84 83 78 m 根据表中的数据,得到销量y(单位:件)与单价x(单位:元)之间的线性回归方程为y=-16x +a,据计算,样本点(8.4,83)处的残差为1.4,则m=_______.答案 75 解析 由条件知当x=8.4时,y=83-1.4=81.6, 2 2 代入y=-16x+a, 解得a=81.6+16×8.4=216, 于是y=-16x+216, 又=8.5,所以=80, 即=80,解得m=75. 11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取 100只 基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失): 被某病毒感染 未被某病毒感染 合计 注射疫苗 10 50 未注射疫苗 30 50 合计 30 100 计算可知,有________的把握认为 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染 的效果”. 附:χ2=,其中,n=a+b+c+d. P(χ2≥x) 0.1 0.05 0.01 0.005 0.001 0 x 2.706 3.841 6.635 7.879 10.828 0 答案 95% 解析 完善2×2列联表如下: 被某病毒感染 未被某病毒感染 合计 注射疫苗 10 40 50 未注射疫苗 20 30 50 合计 30 70 100 提出假设H:给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果. 0 因为χ2=≈4.762, 因为H 成立时,χ2≥3.841的概率约为0.05, 0 所以有95%的把握认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”. 12.(2023·桂林模拟)一只红铃虫产卵数 y 和温度 x 有关,现测得一组数据(x,y)(i= i i 1,2,…,10),可用模型y= 拟合,设z=ln y,其变换后的线性回归方程为z=bx- 4,若x+x+…+x =300,yy…y =e50,e为自然常数,则cc=________. 1 2 10 1 2 10 1 2答案 0.3e-4 解析 y= 经过z=ln y变换后, 得到z=ln y=cx+ln c, 2 1 根据题意得ln c=-4,故c=e-4, 1 1 又x+x+…+x =300,故=30, 1 2 10 yy…y =e50⇒ln y+ln y+…+ln y =50, 1 2 10 1 2 10 故=5, 于是回归直线z=bx-4一定经过点(30,5), 故30b-4=5, 解得b=0.3,即c=0.3,于是cc=0.3e-4. 2 1 2 四、解答题 13.(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了 比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下 表: 一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计 270 130 400 (1)甲机床、乙机床生产的产品中一级品的频率分别是多少? (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异? 附:χ2=,n=a+b+c+d. P(χ2≥x) 0.050 0.010 0.001 0 x 3.841 6.635 10.828 0 解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品 中一级品的频率是=0.6. (2)根据题表中的数据可得 χ2==≈10.256. 因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异. 14.(2023·绵阳模拟)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至 2022年底,我国移动物联网连接数达 18.45亿户,成为全球主要经济体中首个实现“物超 人”的国家.如图是2018-2022年移动物联网连接数w与年份代码t的散点图,其中年份 2018-2022对应的t分别为1~5.(1)根据散点图推断两个变量是否线性相关.计算相关系数(精确到0.01),并推断它们的相关 程度; (2)求w关于t的线性回归方程,并预测2024年移动物联网连接数. 附:相关系数r=,b=,a=-b,≈41.7. 解 (1)由图可知,两个变量线性相关. 由已知条件可得==3, ==15, 所以(t-)(w-)=16+3+0+4+18=41, i i ==,==, 所以相关系数r=≈≈0.98, 因此,两个变量具有很强的线性相关性. (2)结合(1)可知,b==4.1,a=-b·=15-4.1×3=2.7,所以线性回归方程是w=4.1t+2.7, 当t=7时,有w=4.1×7+2.7=31.4, 即预测2024年移动物联网连接数为31.4亿户.