当前位置:首页>文档>第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章

第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章

  • 2026-03-26 11:32:58 2026-03-26 11:32:58

文档预览

第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章
第九章 §9.3 成对数据的统计分析_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(人教A版)_第七章~第十章

文档信息

文档格式
docx
文档大小
0.607 MB
文档页数
19 页
上传时间
2026-03-26 11:32:58

文档内容

§9.3 成对数据的统计分析 课标要求 1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会 运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析. 知识梳理 1.变量的相关关系 (1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程 度,这种关系称为相关关系. (2)相关关系的分类:正相关和负相关. (3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线 附近,我们就称这两个变量线性相关. 2.样本相关系数 (1)r=. (2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. (3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样 本数据的线性相关程度越弱. 3.一元线性回归模型 (1)我们将y=bx+a称为Y关于x的经验回归方程, 其中 (2)残差:观测值减去预测值称为残差. 4.列联表与独立性检验 (1)关于分类变量X和Y的抽样数据的2×2列联表: Y X 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d n=a+b+c+d (2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检 验. 常用结论 1.经验回归直线过点(,). 2.求b时,常用公式b=.3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能 犯错误. 自主诊断 1.判断下列结论是否正确.(请在括号中打“√”或“×”) (1)散点图是判断两个变量相关关系的一种重要方法和手段.( √ ) (2)经验回归直线y=bx+a至少经过点(x,y),(x,y),…,(x,y)中的一个点.( × ) 1 1 2 2 n n (3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( √ ) (4)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( × ) 2.(多选)(2023·石嘴山模拟)下列有关回归分析的说法中正确的是( ) A.相关关系是一种确定性的关系 B.经验回归直线就是散点图中经过样本数据点最多的那条直线 C.当样本相关系数r>0时,两个变量正相关 D.两个变量的线性相关性越弱,|r|越接近于0 答案 CD 解析 相关关系是不确定的关系,故A错;经验回归直线在散点图中可能不经过任一样本 数据点,故B错;当样本相关系数r>0时,两个变量正相关,故C对;两个变量的线性相 关性越弱,|r|越接近于0,故D对. 3.(2023·福州统考)已知变量x和y的统计数据如表: x 6 7 8 9 10 y 3.5 4 5 6 6.5 若由表中数据得到经验回归方程为y=0.8x+a,则当x=10时的残差为________(注:观测 值减去预测值称为残差). 答案 -0.1 解析 ==8, ==5, 则a=5-0.8×8=-1.4, 所以y=0.8x-1.4,当x=10时,y=6.6, 所以当x=10时的残差为6.5-6.6=-0.1. 4.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表所 示: 主修专业 性别 合计 非统计专业 统计专业 男 13 10 23 女 7 20 27合计 20 30 50 为了判断主修专业是否与性别有关系,根据表中的数据,得到 χ2=≈4.844,因为 χ2>3.841,所以判定主修专业与性别有关系,那么这种判断出错的可能性________0.05(填 “大于”或“小于”). 附: α 0.1 0.05 0.01 0.001 x 2.706 3.841 6.635 10.828 α 答案 小于 解析 因为χ2>3.841=x , 0.05 所以依据小概率值α=0.05的独立性检验,认为主修专业与性别有关,这种判断出错的可 能性小于0.05. 题型一 成对数据的相关性 例1 (1)(2023·天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中样本相关系 数r=0.824 5,则下列说法正确的是( ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈负相关 C.花瓣长度和花萼长度呈正相关 D.若从样本中抽取一部分,则这部分的样本相关系数一定是0.824 5 答案 C 解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故A错误; 散点的分布是从左下到右上,从而花瓣长度和花萼长度呈正相关,故B错误,C正确; 由于r=0.824 5是全部数据的样本相关系数,取出来一部分数据,相关性可能变强,可能 变弱,即取出的数据的样本相关系数不一定是0.824 5,故D错误. (2)(多选)(2023·湛江模拟)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生 中随机抽测了10人的身高和体重,数据如表所示:编号 1 2 3 4 5 6 7 8 9 10 身高/cm 165 168 170 172 173 174 175 177 179 182 体重/kg 55 89 61 65 67 70 75 75 78 80 由表中数据制作成如图所示的散点图, 由最小二乘法计算得到经验回归直线l 的方程为y=bx+a ,样本相关系数为r ,决定系数 1 1 1 1 为R;经过残差分析确定(168,89)为离群点(对应残差过大),把它去掉后,再用剩下的9对 数据计算得到经验回归直线l 的方程为y=bx+a,样本相关系数为r,决定系数为R.则以 2 2 2 2 下结论中正确的有( ) A.a>a B.b>b 1 2 1 2 C.rR 1 2 答案 AC 解析 身高的平均数为 =173.5, 因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大, 所以去掉离群点后经验回归直线的截距变小而斜率变大, 所以a>a,b0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强. (3)经验回归方程:当b>0时,正相关;当b<0时,负相关. 跟踪训练1 (1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到样本 数据如表所示: x 3 4 5 6 7y 3.5 2.4 1.1 -0.2 -1.3 根据表格中的数据求得经验回归方程为y=bx+a,则下列说法中正确的是( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案 B 解析 由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以 b<0.又=×(3+4+5+6+7)=5,=×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5b+a,所以 a=1.1-5b>0. (2)已知相关变量x和y的散点图如图所示,若用y=b·ln(kx)与y=kx+b 拟合时的样本相 1 1 2 2 关系数分别为r,r 则比较r,r 的大小结果为( ) 1 2 1 2 A.r>r B.r=r 1 2 1 2 C.r|r|, 1 1 2 2 1 2 又因为x,y负相关,所以-r>-r,即r0.75时,两个变量之间具有很强的线性 相关关系.参考数据:≈5.9. 解 (1)因为==5, ==18. (x-)(y-)=16+12+5+0+0+3+6+27=69, i i (x-)2=4+4+1+0+0+1+1+9=20, i (y-)2=64+36+25+0+1+9+36+81=252, i 所以r===≈0.97. 由于|r|>0.75且r非常接近1, 所以y与x具有很强的线性相关关系. 经计算可得 b===3.45, a=-b=18-3.45×5=0.75, 所以所求经验回归方程为y=3.45x+0.75. (2)①当x=10时,y=3.45×10+0.75=35.25, 所以预计能带动的消费达35.25百万元. ②因为≈14.89%>10%, 所以发放的该轮消费券助力消费复苏不理想. 发放消费券只是影响消费的其中一个因素,还有其他重要因素,比如:A城市经济发展水 平不高,居民的收入水平直接影响了居民的消费水平;A城市人口数量有限、商品价格水 平、消费者偏好、消费者年龄构成等因素一定程度上影响了消费总量.(只要写出一个原因 即可). 命题点2 非线性回归模型 例3 (2024·朝阳模拟)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警 之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开 始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前 7天每天售出的奶 茶数量(单位:杯)如下: 日期 第一天 第二天 第三天 第四天 第五天 第六天 第七天 日期代码x 1 2 3 4 5 6 7 杯数y 4 15 22 26 29 31 32 (1)请根据以上数据,绘制散点图,并根据散点图判断,y=a+bx与y=c+dln x哪一个更 适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);(2)建立y关于x的经验回归方程(结果保留1位小数),并根据建立的经验回归方程,试预测 要到哪一天售出的奶茶才能超过35杯? 参考数据: y y e2.1 i i i i 22.7 1.2 759 235.1 13.2 8.2 其中u=ln x,=. i i i 参考公式: 在经验回归方程y=bx+a中,b=,a=-b. 解 (1)根据散点图,知y=c+dln x更适宜作为y关于x的回归方程模型. (2)令u=ln x,则y=c+du, 由已知数据得d==≈14.2, c=-d≈22.7-14.2×1.2≈5.7, 所以y=5.7+14.2u, 故y关于x的经验回归方程为y=5.7+14.2ln x, 令5.7+14.2ln x>35, 整理得ln x>2.1,即x>e2.1≈8.2, 故当x=9时,即到第9天才能超过35杯. 思维升华 求经验回归方程的步骤跟踪训练2 小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了 20 家服装店,统计得到了它们的面积x(单位:m2)和日均客流量y(单位:百人)的数据(x,y)(i i i =1,2,…,20),并计算得 =2 400,=210,(x-)2=42 000,(x-)(y-)=6 300. i i i i i (1)求y关于x的经验回归方程; (2)已知服装店每天的经济效益W=k+mx(k>0,m>0),该商场现有60~150 m2的商铺出租, 根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺? 附:经验回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=,a=-b. 解 (1)由已知可得==120, i ==10.5, i b===0.15, a=-b=10.5-0.15×120=-7.5, 所以经验回归方程为y=0.15x-7.5. (2)根据题意得Z==+m,60≤x≤150. 设f(x)==-, 令t=,≤t≤, 则f(x)=g(t)=0.15t-7.5t2=-7.5×(t-0.01)2+0.000 75, 当t=0.01,即x=100时,f(x)取最大值, 又因为k>0,m>0,所以此时Z也取最大值, 因此,小李应该租100 m2的商铺. 题型三 列联表与独立性检验 例4 (2023·全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选 40只小白鼠, 随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓 度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量 (单位:g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8 9.2 11.4 12.4 13.2 15.5 16.518.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (1)计算试验组的样本平均数; (2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的 数据的个数,完成如下列联表: 3.841=x , 0.05 依据小概率值α=0.05的独立性检验,我们推断H 不成立,即认为小白鼠在高浓度臭氧环 0 境中与在正常环境中体重的增加量有差异,此推断犯错误的概率不超过0.05. 思维升华 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算.(3)比较χ2与临界值的大小关系,作统计推断. 跟踪训练3 (2024·哈尔滨模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的 《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享 他们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生 问题,同时也在讨论青春中国的社会问题,受到了青年观众的喜爱.为了了解观众对节目 的喜爱程度,电视台随机调查了A,B两个地区的100名观众,得到如表所示的2×2列联 表. 非常喜欢 喜欢 合计 A 30 15 B 合计 已知在被调查的100名观众中随机抽取1名,该观众来自B地区且喜爱程度为“非常喜 欢”的概率为0.35. (1)现从100名观众中根据喜爱程度用按比例分配的分层随机抽样的方法抽取20名进行问卷 调查,则应抽取喜爱程度为“非常喜欢”的A,B地区的人数各是多少? (2)完成上述表格,依据小概率值α=0.05的独立性检验,能否认为观众的喜爱程度与所在 地区有关? 附:χ2=,n=a+b+c+d. α 0.05 0.01 0.001 x 3.841 6.635 10.828 α 解 (1)由题意得来自B地区且喜爱程度为“非常喜欢”的观众为0.35×100=35(人), 所以应从A地区抽取30×=6(人), 从B地区抽取35×=7(人). (2)完成表格如表: 非常喜欢 喜欢 合计 A 30 15 45 B 35 20 55 合计 65 35 100 零假设为H:观众的喜爱程度与所在地区无关. 0 χ2==≈0.1<3.841=x , 0.05 根据小概率值α=0.05的独立性检验,没有充分证据推断H 不成立,因此认为H 成立,即 0 0 观众的喜爱程度与所在地区无关.课时精练 一、单项选择题 1.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了 120位学 生,得到如下2×2列联表: 男 女 合计 喜欢 a b 73 不喜欢 c 25 合计 74 则a-b-c等于( ) A.7 B.8 C.9 D.10 答案 C 解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21, ∴a-b-c=52-21-22=9. 2.(2023·黄冈中学模拟)在一组样本数据(x ,y),(x ,y),…,(x ,y)(n≥2,x , 1 1 2 2 n n 1 x ,…,x 互不相等)的散点图中,若所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上, 2 n i i 则这组样本数据的样本相关系数为( ) A.- B. C.-1 D.1 答案 D 解析 由题意可知,所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上, i i 则这组样本数据完全正相关,且样本相关系数为1. 3.(2023·聊城模拟)根据分类变量x与y的成对样本数据,计算得到χ2=6.147.依据小概率 值α=0.01的独立性检验(x =6.635),结论为( ) 0.01 A.变量x与y不独立 B.变量x与y不独立,这个结论犯错误的概率不超过0.01 C.变量x与y独立 D.变量x与y独立,这个结论犯错误的概率不超过0.01 答案 C 解析 按照独立性检验的知识及比对的参数值,当χ2=6.147,我们可以下结论变量x与y 独立.故排除A,B; 依据小概率值α=0.01的独立性检验(x =6.635),6.147<6.635,所以我们不能得到“变量 0.01 x与y独立,这个结论犯错误的概率不超过0.01”这个结论,故C正确,D错误. 4.(2023·武汉模拟)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表如表所示: 跳绳 性别 合计男 女 爱好 40 20 60 不爱好 20 30 50 合计 60 50 110 附:χ2=,其中n=a+b+c+d. α 0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 α 则以下结论正确的是( ) A.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关 B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错 误的概率不超过0.001 C.根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别无关 D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关 答案 A 解析 由题意知χ2=≈7.822,因为7.822<10.828,所以根据小概率值α=0.001的独立性检 验,我们认为爱好跳绳与性别无关,且这个结论犯错误的概率超过 0.001,故A正确,B错 误; 又因为7.822>6.635,所以根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别 有关,或在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别有关,故C和D 错误. 5.某市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售 价x(元)和销售量y(件)之间的一组数据如表所示: 价格x(元) 90 95 100 105 110 销售量y(件) 11 10 8 6 5 用最小二乘法求得y关于x的经验回归方程是y=-0.32x+a,样本相关系数r=-0.992 3, 则下列说法不正确的是( ) A.变量x与y负相关且相关性很强 B.a=40 C.当x=85时,y的估计值为15 D.对应点(105,6)的残差为-0.4 答案 C 解析 由经验回归方程可得变量x与y 负相关,且由样本相关系数|r|=0.992 3,可知相关性很强,故A正确; 由表中数据可得=×(90+95+100+105+110)=100,=×(11+10+8+6+5)=8,故经验 回归直线过点(100,8), 故8=-0.32×100+a,解得a=40,故B正确; 当x=85时,y=-0.32×85+40=12.8,故C错误; 对应点(105,6)的残差为6-(-0.32×105+40)=-0.4,故D正确. 6.(2024·重庆模拟)设两个相关变量x和y分别满足下表: x 1 2 3 4 5 y 1 2 8 8 16 若相关变量x和y可拟合为非线性经验回归方程y=2bx+a,则当x=6时,y的估计值为( ) 附:对于一组数据(u ,v),(u ,v),…,(u ,v),其经验回归直线v=α+βu的斜率和截 1 1 2 2 n n 距的最小二乘估计公式分别为β=,a=-β;1.155≈2. A.33 B.37 C.65 D.73 答案 B 解析 因为非线性经验回归方程为y=2bx+a, 则有log y=bx+a, 2 令log y=v,即v=bx+a, 2 列出相关变量x,y,v关系如表: x 1 2 3 4 5 y 1 2 8 8 16 v 0 1 3 3 4 所以 v=0+2+9+12+20=43, i i ==3, ==, =1+4+9+16+25=55, 所以b===1, 所以a=-b=-3=-,所以v=x-, 即log y=x-,即y= , 2 因为1.155≈2,所以 ≈1.15,当x=6时,y= = =25.2=25× ≈32×1.15=36.8≈37. 二、多项选择题 7.(2024·厦门模拟)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素 是否对本校学生体育锻炼的经常性有影响,随机抽取了 300名学生,对他们是否经常锻炼 的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的 2倍,绘制其等高堆积条 形图,如图所示,则( ) 附:χ2=,其中n=a+b+c+d. α 0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 α A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多 B.从参与调查的学生中任取一人,已知该学生为女生,则该学生经常锻炼的概率为 C.依据小概率值α=0.1的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推 断犯错误的概率不超过0.1 D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等 高堆积条形图也不变,依据小概率值α=0.05的独立性检验,认为性别因素影响学生体育 锻炼的经常性,该推断犯错误的概率不超过0.05 答案 ABD 解析 由题意知经常锻炼人数是不经常锻炼人数的2倍, 故经常锻炼人数为200人,不经常锻炼人数为100人, 故男生中经常锻炼的人数为200×0.5=100(人),不经常锻炼的人数为100×0.6=60(人), 故男生中经常锻炼的人数比不经常锻炼的人数多,故A正确; 女生中经常锻炼的人数为200×0.5=100(人),不经常锻炼的人数为100×0.4=40(人), 故从参与调查的学生中任取一人,已知该学生为女生,则该学生经常锻炼的概率为=,故 B正确; 由题意结合男、女生中经常锻炼和不经常锻炼的人数,可得列联表如表所示: 经常锻炼 不经常锻炼 合计 男 100 60 160 女 100 40 140合计 200 100 300 则χ2=≈2.679<2.706=x , 0.1 故依据小概率值α=0.1的独立性检验,不能认为性别因素影响学生体育锻炼的经常性,故 C错误; 由题意可得 经常锻炼 不经常锻炼 合计 男 200 120 320 女 200 80 280 合计 400 200 600 则此时χ2=≈5.357>3.841=x , 0.05 故依据小概率值α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推 断犯错误的概率不超过0.05,故D正确. 8.沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要 种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长 同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得 到统计表如表所示: 年份t 2018 2019 2020 2021 2022 年份代码x 1 2 3 4 5 种植面积y/万亩 8 14 15 20 28 附:①样本相关系数r=; ②在经验回归方程y=bx+a中,b==,a=-b;≈47.33. 根据此表,下列结论正确的是( ) A.该地区这5年沃柑的种植面积的方差为212 B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001) C.y关于x的经验回归方程为y=4.6x+3.2 D.预测该地区沃柑种植面积最早在2027年能突破40万亩 答案 BC 解析 根据题意,得==17, s=×[(-9)2+(-3)2+(-2)2+32+112]=44.8,故A错误; 由题意得==3, y=1×8+2×14+3×15+4×20+5×28=301, i i=12+22+32+42+52=55,=82+142+152+202+282=1 669, 所以r== =≈≈0.972,故B正确; 因为b===4.6, a=-b=17-4.6×3=3.2, 所以y关于x的经验回归方程为y=4.6x+3.2,故C正确; 令y=4.6x+3.2≥40,得x≥8, 所以最小的整数为8,2 017+8=2 025, 所以该地区沃柑种植面积最早在2025年能突破40万亩,故D错误. 三、填空题 9.(2023·辽宁实验中学模拟)为了比较甲、乙、丙、丁四组数据的线性相关性的强弱,小明 分别计算了甲、乙、丙、丁四组数据的样本相关系数,其数值分别为-0.95,- 0.87,0.76,0.92,则这四组数据中线性相关性最强的是________组数据. 答案 甲 解析 根据题意,因为样本相关系数的绝对值越大,线性相关性越强. 甲、乙、丙、丁四组数据的样本相关系数分别为-0.95,-0.87,0.76,0.92, 所以甲组数据的线性相关性最强. 10.(2024·安庆模拟)对于数据组(x,y)(i=1,2,…,n),如果由经验回归方程得到的对应自 i i 变量x的估计值是y,那么将y-y称为对应点(x,y)的残差.某商场为了给一种新商品进 i i i i i i 行合理定价,将该商品按事先拟定的价格进行试销,得到如表所示的数据: 单价x/元 8.2 8.4 8.6 8.8 销量y/件 84 83 78 m 根据表中的数据,得到销量y(单位:件)与单价x(单位:元)之间的经验回归方程为y=-16x +a,据计算,样本点(8.4,83)处的残差为1.4,则m=____. 答案 75 解析 由条件知当x=8.4时,y=83-1.4=81.6, 2 2 代入y=-16x+a, 解得a=81.6+16×8.4=216,于是y=-16x+216, 又=8.5,所以=80, 即=80,解得m=75. 11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100 只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失): 被某病毒感染 未被某病毒感染 合计 注射疫苗 10 50未注射疫苗 30 50 合计 30 100 计算可知,根据小概率值α=________的独立性检验,认为 “给基因编辑小鼠注射该种疫 苗能起到预防该病毒感染的效果”. 附:χ2=,其中n=a+b+c+d. α 0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 α 答案 0.05 解析 完善2×2列联表如下: 被某病毒感染 未被某病毒感染 合计 注射疫苗 10 40 50 未注射疫苗 20 30 50 合计 30 70 100 零假设为H:给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果. 0 因为χ2=≈4.762,3.841<4.762<6.635, 所以根据小概率值α=0.05的独立性检验,推断H 不成立,即认为“给基因编辑小鼠注射 0 该种疫苗能起到预防该病毒感染的效果”. 12.(2023·桂林模拟)一只红铃虫产卵数 y 和温度 x 有关,现测得一组数据(x,y)(i= i i 1,2,…,10),可用模型y= 拟合,设z=ln y,其变换后的经验回归方程为z=bx- 4,若x+x+…+x =300,yy…y =e50,e为自然常数,则cc=________. 1 2 10 1 2 10 1 2 答案 0.3e-4 解析 y= 经过z=ln y变换后, 得到z=ln y=cx+ln c, 2 1 根据题意得ln c=-4,故c=e-4, 1 1 又x+x+…+x =300, 1 2 10 故=30, yy…y =e50⇒ln y+ln y+…+ln y =50, 1 2 10 1 2 10 故=5, 于是经验回归直线z=bx-4一定经过点(30,5), 故30b-4=5, 解得b=0.3,即c=0.3,于是cc=0.3e-4. 2 1 2四、解答题 13.(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品, 为了比较两台机床产品的质量,分别用两台机床各生产了 200件产品,产品的质量情况统 计如表: 一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计 270 130 400 (1)甲机床、乙机床生产的产品中一级品的频率分别是多少? (2)依据小概率值α=0.01的独立性检验,能否认为甲机床的产品质量与乙机床的产品质量 有差异? 附:χ2=,n=a+b+c+d. α 0.05 0.01 0.001 x 3.841 6.635 10.828 α 解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产 品中一级品的频率是=0.6. (2)零假设为H:甲机床的产品质量与乙机床的产品质量无差异,根据题表中的数据可得 0 χ2= =≈10.256>6.635=x , 0.01 所以依据小概率值α=0.01的独立性检验,推断H 不成立,即认为甲机床的产品质量与乙 0 机床的产品质量有差异. 14.(2023·绵阳模拟)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至 2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超 人”的国家.如图是2018-2022年移动物联网连接数w与年份代码t的散点图,其中年份 2018-2022对应的t分别为1~5. (1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们 的相关程度; (2)求w关于t的经验回归方程,并预测2024年移动物联网连接数. 附:样本相关系数r=,b=,a=-b,≈41.7.解 (1)由图可知,两个变量线性相关. 由已知条件可得==3, ==15, 所以(t-)(w-)=16+3+0+4+18=41, i i ==,==, 所以样本相关系数r=≈≈0.98, 因此,两个变量具有很强的线性相关性. (2)结合(1)可知,b==4.1,a=-b·=15-4.1×3=2.7,所以经验回归方程是w=4.1t+ 2.7, 当t=7时,有w=4.1×7+2.7=31.4, 即预测2024年移动物联网连接数为31.4亿户.