当前位置:首页>文档>第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章

第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章

  • 2026-03-26 11:34:34 2026-03-26 11:34:34

文档预览

第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章
第九章 §9.3 统计案例_2.2025数学总复习_2025年新高考资料_一轮复习_2025高考大一轮复习讲义+课件(完结)_2025高考大一轮复习数学(北师大版)_配套Word版文档第七章_第十章

文档信息

文档格式
docx
文档大小
0.576 MB
文档页数
16 页
上传时间
2026-03-26 11:34:34

文档内容

§9.3 统计案例 课标要求 1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运 用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析. 知识梳理 1.变量的相关关系 (1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程 度,这种关系称为相关关系. (2)相关关系的分类:正相关和负相关. (3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线 附近,我们就称这两个变量线性相关. 2.样本相关系数 (1)r=. (2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. (3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本 数据的线性相关程度越弱. 3.一元线性回归模型 (1)我们将Y=bX+a称为Y关于X的线性回归方程, 其中 (2)偏差:观测值减去预测值,称为偏差. 4.列联表与独立性检验 (1)一般地,假设有两个分类变量X和Y,它们的取值分别为{A ,A}和{B ,B},其2×2列 1 2 1 2 联表为 B B 总计 1 2 A a b a+b 1 A c d c+d 2 总计 a+c b+d a+b+c+d (2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检 验. 常用结论 1.回归直线过点(,). 2.求b时,常用公式b=.3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能 犯错误. 自主诊断 1.判断下列结论是否正确.(请在括号中打“√”或“×”) (1)散点图是判断两个变量相关关系的一种重要方法和手段.( √ ) (2)回归直线Y=bX+a至少经过点(x,y),(x,y),…,(x,y)中的一个点.( × ) 1 1 2 2 n n (3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( √ ) (4)若事件X,Y关系越密切,则由观测数据计算得到的χ2的值越小.( × ) 2.(多选)(2023·石嘴山模拟)下列有关回归分析的说法中正确的是( ) A.相关关系是一种确定性的关系 B.回归直线就是散点图中经过样本数据点最多的那条直线 C.当样本相关系数r>0时,两个变量正相关 D.两个变量的线性相关性越弱,|r|越接近于0 答案 CD 解析 相关关系是一种不确定的关系,故A错; 回归直线在散点图中可能不经过任一样本数据点,故B错; 当样本相关系数r>0时,两个变量正相关,故C对; 两个变量的线性相关性越弱,|r|越接近于0,故D对. 3.(2023·福州统考)已知变量X和Y的统计数据如表: X 6 7 8 9 10 Y 3.5 4 5 6 6.5 若由表中数据得到线性回归方程为Y=0.8X+a,则当x=10时的偏差为________(注:观测 值减去预测值称为偏差). 答案 -0.1 解析 ==8, ==5, 则a=5-0.8×8=-1.4, 所以y=0.8x-1.4,当x=10时,y=6.6, 所以当x=10时的偏差为6.5-6.6=-0.1. 4.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表所 示: 主修专业 性别 非统计专业 统计专业 总计男 13 10 23 女 7 20 27 总计 20 30 50 为了判断主修专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2>3.841, 所以________95%的把握认为主修专业与性别有关.(填“有”或“没有”) 答案 有 解析 因为χ2>3.841, 所以有95%的把握认为主修专业与性别有关. 题型一 成对数据的相关性 例1 (1)(2023·天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中样本相关系 数r=0.824 5,则下列说法正确的是( ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈负相关 C.花瓣长度和花萼长度呈正相关 D.若从样本中抽取一部分,则这部分的样本相关系数一定是0.824 5 答案 C 解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故A错误; 散点的分布是从左下到右上,从而花瓣长度和花萼长度呈正相关,故B错误,C正确; 由于r=0.824 5是全部数据的样本相关系数,取出来一部分数据,相关性可能变强,可能变 弱,即取出的数据的样本相关系数不一定是0.824 5,故D错误. (2)(多选)(2023·湛江模拟)某服装生产商为了解青少年的身高和体重的关系,在 15岁的男生 中随机抽测了10人的身高和体重,数据如表所示: 编号 1 2 3 4 5 6 7 8 9 10 身高/cm 165 168 170 172 173 174 175 177 179 182 体重/kg 55 89 61 65 67 70 75 75 78 80 由表中数据制作成如图所示的散点图,求得的回归直线l 的方程为Y=bX+a ,样本相关系数为r ;经过偏差分析确定(168,89)为 1 1 1 1 离群点(对应偏差过大),把它去掉后,再用剩下的9对数据计算得到回归直线l 的方程为Y 2 =bX+a,样本相关系数为r.则以下结论中正确的有( ) 2 2 2 A.bb 1 2 1 2 C.rr 1 2 1 2 答案 AC 解析 身高的平均数为 =173.5, 因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大, 所以去掉离群点后回归直线的斜率变大, 所以b0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强. (3)线性回归方程:当b>0时,正相关;当b<0时,负相关. 跟踪训练1 (1)(2023·保定模拟)已知两个变量X和Y之间有线性相关关系,经调查得到样本 数据如表所示: X 3 4 5 6 7 Y 3.5 2.4 1.1 -0.2 -1.3 根据表格中的数据求得线性回归方程为Y=bX+a,则下列说法中正确的是( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案 B 解析 由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以b<0.又=×(3+4+5+6+7)=5,=×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5b+a,所以a =1.1-5b>0. (2)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( ) A.r0,r>0,图(2)与图(4)是负相关,故r<0, 1 3 2 r<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r0.75时,两个变量之间具有很强的线性相 关关系. 参考数据:≈5.9.解 (1)因为==5, ==18. (x-)(y-)=16+12+5+0+0+3+6+27=69, i i (x-)2=4+4+1+0+0+1+1+9=20, i (y-)2=64+36+25+0+1+9+36+81=252, i 所以r===≈0.97. 由于|r|>0.75且r非常接近1, 所以y与x具有很强的线性相关关系. 经计算可得b===3.45, a=-b=18-3.45×5=0.75, 所以所求线性回归方程为Y=3.45X+0.75. (2)①当x=10时,y=3.45×10+0.75=35.25, 所以预计能带动的消费达35.25百万元. ②因为≈14.89%>10%, 所以发放的该轮消费券助力消费复苏不理想. 发放消费券只是影响消费的其中一个因素,还有其他重要因素,比如:A城市经济发展水平 不高,居民的收入水平直接影响了居民的消费水平;A城市人口数量有限、商品价格水平、 消费者偏好、消费者年龄构成等因素一定程度上影响了消费总量.(只要写出一个原因即可). 思维升华 求线性回归方程的步骤 跟踪训练2 小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20 家服装店,统计得到了它们的面积X(单位:m2)和日均客流量Y(单位:百人)的数据(x,y)(i i i =1,2,…,20),并计算得 =2 400,=210,(x-)2=42 000,(x-)(y-)=6 300. i i i i i (1)求Y关于X的线性回归方程; (2)已知服装店每天的经济效益W=k+mx(k>0,m>0),该商场现有60~150 m2的商铺出租, 根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺? 参考公式:b=,a=-b. 解 (1)由已知可得==120, i ==10.5, i b===0.15,a=-b=10.5-0.15×120=-7.5, 所以线性回归方程为Y=0.15X-7.5. (2)根据题意得Z==+m,60≤x≤150. 设f(x)==-, 令t=,≤t≤, 则f(x)=g(t)=0.15t-7.5t2=-7.5×(t-0.01)2+0.000 75, 当t=0.01,即x=100时,f(x)取最大值, 又因为k>0,m>0,所以此时Z也取最大值, 因此,小李应该租100 m2的商铺. 题型三 列联表与独立性检验 例3 (2023·全国甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地 将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环 境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位: g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (1)计算试验组的样本平均数; (2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数 据的个数,完成如下列联表: 3.841, 所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 思维升华 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断. 跟踪训练3 (2024·哈尔滨模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的 《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他 们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生问题, 同时也在讨论青春中国的社会问题,受到了青年观众的喜爱.为了了解观众对节目的喜爱程 度,电视台随机调查了A,B两个地区的100名观众,得到如表所示的2×2列联表. 非常喜欢 喜欢 总计 A 30 15 B 总计 已知在被调查的100名观众中随机抽取1名,该观众来自B地区且喜爱程度为“非常喜欢” 的概率为0.35. (1)现从100名观众中根据喜爱程度用分层随机抽样的方法抽取20名进行问卷调查,则应抽 取喜爱程度为“非常喜欢”的A,B地区的人数各是多少? (2)完成上述表格,是否有95%的把握认为观众的喜爱程度与所在地区有关? 附:χ2=, n=a+b+c+d. 解 (1)由题意得来自B地区且喜爱程度为“非常喜欢”的观众为0.35×100=35(人), 所以应从A地区抽取30×=6(人), 从B地区抽取35×=7(人). (2)完成表格如表: 非常喜欢 喜欢 总计A 30 15 45 B 35 20 55 总计 65 35 100 χ2==≈0.1<3.841, 所以没有95%的把握认为观众的喜爱程度与所在地区有关. 课时精练 一、单项选择题 1.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学 生,得到如下2×2列联表: 男 女 总计 喜欢 a b 73 不喜欢 c 25 总计 74 则a-b-c等于( ) A.7 B.8 C.9 D.10 答案 C 解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21, ∴a-b-c=52-21-22=9. 2.(2023·黄冈中学模拟)在一组样本数据(x ,y),(x ,y),…,(x ,y)(n≥2,x ,x ,…, 1 1 2 2 n n 1 2 x 互不相等)的散点图中,若所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上,则这组 n i i 样本数据的样本相关系数为( ) A.- B. C.-1 D.1 答案 D 解析 由题意可知,所有样本点(x,y)(i=1,2,…,n)都在直线y=x-5上, i i 则这组样本数据完全正相关,且样本相关系数为1. 3.(2023·洛阳模拟)为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据: 流感 药物 患流感 未患流感 服用 2 18 未服用 8 12 根据表中数据,计算χ2=,若由此认为“该药物预防流感有效果”,则该结论有多大把握( )A.95% B.90% C.99% D.99.5% 答案 A 解析 由题意知,χ2==4.8>3.841, 所以有95%的把握认为“该药物预防流感有效果”. 4.根据如表样本数据: X 2 3 4 5 6 Y 4 2.5 -0.5 -2 -3 得到的线性回归方程为Y=bX+a,则( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案 B 解析 由表中的数据可得,变量Y随着X的增大而减小,则b<0, ==4, ==0.2, 又线性回归方程Y=bX+a经过点(4,0.2),可得a>0. 5.某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人, 选考历史的有80人,统计各选科人数如表,则下列说法正确的是( ) 选择科目 思想政治 地理 化学 生物 选考类型 物理类 80 100 145 115 历史类 50 45 30 35 A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高 B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高 C.选择生物与选考类别无关 D.有99%的把握认为选择生物与选考类别有关 答案 C 解析 对于A,物理类的学生中选择政治的比例为=, 历史类的学生中选择政治的比例为=, 因为<,故选项A不正确; 对于B,物理类的学生中选择地理的比例为=, 历史类的学生中选择地理的比例为=, 因为<,故选项B不正确;对于C和D, 根据已知数据可得2×2列联表如表: 选生物 不选生物 总计 物理类 115 105 220 历史类 35 45 80 总计 150 150 300 所以χ2==≈1.705<2.706, 即认为选择生物与选考类别无关,故选项C正确,选项D不正确. 6.某市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售 价X(元)和销售量Y(件)之间的一组数据如表所示: 价格X(元) 90 95 100 105 110 销售量Y(件) 11 10 8 6 5 用最小二乘法求得Y关于X的线性回归方程是Y=-0.32X+a,样本相关系数r=-0.992 3,则下列说法不正确的是( ) A.变量X与Y负相关且相关性很强 B.a=40 C.当x=85时,y的估计值为15 D.对应点(105,6)的偏差为-0.4 答案 C 解析 由线性回归方程可得变量X与Y负相关,且由样本相关系数|r|=0.992 3,可知相关性 很强,故A正确; 由表中数据可得=×(90+95+100+105+110)=100,=×(11+10+8+6+5)=8,故回归直 线过点(100,8), 故8=-0.32×100+a,解得a=40,故B正确; 当x=85时,y=-0.32×85+40=12.8,故C错误; 对应点(105,6)的偏差为6-(-0.32×105+40)=-0.4,故D正确. 二、多项选择题 7.(2024·厦门模拟)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素 是否对本校学生体育锻炼的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的 情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图, 如图所示,则( )A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多 B.从参与调查的学生中任取一人,已知该学生为女生,则该学生经常锻炼的概率为 C.有90%的把握认为性别因素影响学生体育锻炼的经常性 D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高 堆积条形图也不变,有95%的把握认为性别因素影响学生体育锻炼的经常性 附:χ2=,其中n=a+b+c+d. 答案 ABD 解析 由题意知经常锻炼人数是不经常锻炼人数的2倍, 故经常锻炼人数为200人,不经常锻炼人数为100人, 故男生中经常锻炼的人数为200×0.5=100(人),不经常锻炼的人数为100×0.6=60(人), 故男生中经常锻炼的人数比不经常锻炼的人数多,故A正确; 女生中经常锻炼的人数为200×0.5=100(人),不经常锻炼的人数为100×0.4=40(人), 故从参与调查的学生中任取一人,已知该学生为女生,则该学生经常锻炼的概率为=,故 B 正确; 由题意结合男、女生中经常锻炼和不经常锻炼的人数,可得列联表如表所示: 经常锻炼 不经常锻炼 总计 男 100 60 160 女 100 40 140 总计 200 100 300 则χ2=≈2.679<2.706, 故没有90%的把握认为性别因素影响学生体育锻炼的经常性,故C错误; 由题意可得 经常锻炼 不经常锻炼 总计 男 200 120 320 女 200 80 280 总计 400 200 600 则此时χ2=≈5.357>3.841, 所以有95%的把握认为性别因素影响学生体育锻炼的经常性,故D正确.8.沃柑,因其口感甜柔、低酸爽口,且营养成分高,成为大家喜欢的水果之一,目前主要 种植于我国广西、云南、四川、湖南等地.得益于物流的快速发展,沃柑的销量大幅增长, 同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行调查,得到 统计表如表所示: 年份T 2018 2019 2020 2021 2022 年份代码X 1 2 3 4 5 种植面积Y/万亩 8 14 15 20 28 附:①样本相关系数r=; ②在线性回归方程Y=bX+a中,b==,a=-b;≈47.33. 根据此表,下列结论正确的是( ) A.该地区这5年沃柑的种植面积的方差为212 B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001) C.Y关于X的线性回归方程为Y=4.6X+3.2 D.预测该地区沃柑种植面积最早在2027年能突破40万亩 答案 BC 解析 根据题意,得==17, s=×[(-9)2+(-3)2+(-2)2+32+112]=44.8,故A错误; 由题意得==3, y=1×8+2×14+3×15+4×20+5×28=301, i i =12+22+32+42+52=55,=82+142+152+202+282=1 669, 所以r== =≈≈0.972,故B正确; 因为b===4.6, a=-b=17-4.6×3=3.2, 所以Y关于X的线性回归方程为Y=4.6X+3.2,故C正确; 令4.6x+3.2≥40,得x≥8, 所以最小的整数为8,2 017+8=2 025, 所以该地区沃柑种植面积最早在2025年能突破40万亩,故D错误. 三、填空题 9.(2023·辽宁实验中学模拟)为了比较甲、乙、丙、丁四组数据的线性相关性的强弱,小明 分别计算了甲、乙、丙、丁四组数据的样本相关系数,其数值分别为-0.95,- 0.87,0.76,0.92,则这四组数据中线性相关性最强的是________组数据. 答案 甲 解析 根据题意,因为样本相关系数的绝对值越大,线性相关性越强.甲、乙、丙、丁四组数据的样本相关系数分别为-0.95,-0.87,0.76,0.92, 所以甲组数据的线性相关性最强. 10.(2024·安庆模拟)对于数据组(x,y)(i=1,2,…,n),如果由线性回归方程得到的对应自 i i 变量x的估计值是y,那么将y-y称为对应点(x,y)的偏差.某商场为了给一种新商品进行 i i i i i i 合理定价,将该商品按事先拟定的价格进行试销,得到如表所示的数据: 单价X/元 8.2 8.4 8.6 8.8 销量Y/件 84 83 78 m 根据表中的数据,得到销量Y(单位:件)与单价X(单位:元)之间的线性回归方程为Y=- 16X+a,据计算,样本点(8.4,83)处的偏差为1.4,则m=__________. 答案 75 解析 由条件知当x=8.4时,y=83-1.4=81.6, 2 2 代入Y=-16X+a, 解得a=81.6+16×8.4=216, 于是Y=-16X+216, 又=8.5, 所以=80, 即=80, 解得m=75. 11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取 100只 基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失): 被某病毒感染 未被某病毒感染 总计 注射疫苗 10 50 未注射疫苗 30 50 总计 30 100 计算可知,有________的把握认为 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染 的效果”. 附:χ2=,其中n=a+b+c+d. 答案 95% 解析 完善2×2列联表如下: 被某病毒感染 未被某病毒感染 总计 注射疫苗 10 40 50 未注射疫苗 20 30 50 总计 30 70 100因为χ2=≈4.762,3.841<4.762<6.635, 所以有95%的把握认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”. 12.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表: 疾病 药物 未患病 患病 总计 服用 a 50-a 50 未服用 80-a a-30 50 总计 80 20 100 若在本次考察中得出“有99%的把握认为药物有效”的结论,则a的最小值为________. (其中a≥40且a∈N )(参考数据:≈2.58,≈3.29) + 附:χ2=,n=a+b+c+d. 答案 46 解析 由题意可得 χ2=≥6.635, 整理得(100a-4 000)2≥502×42×6.635, 所以100a-4 000≥200×≈200×2.58=516或100a-4 000≤-200×≈-200×2.58=-516, 解得a≥45.16或a≤34.84, 又因为a≥40且a∈N , + 所以a≥46, 所以a的最小值为46. 四、解答题 13.(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了 比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如表: 一级品 二级品 总计 甲机床 150 50 200 乙机床 120 80 200 总计 270 130 400 (1)甲机床、乙机床生产的产品中一级品的频率分别是多少? (2)是否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异? 附:χ2=,n=a+b+c+d. 解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品 中一级品的频率是=0.6.(2)根据题表中的数据可得 χ2= =≈10.256>6.635, 所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异. 14.(2023·绵阳模拟)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至 2022年底,我国移动物联网连接数达 18.45亿户,成为全球主要经济体中首个实现“物超 人”的国家.如图是2018-2022年移动物联网连接数W与年份代码T的散点图,其中年份 2018-2022对应的T分别为1~5. (1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的 相关程度; (2)求W关于T的经验回归方程,并预测2024年移动物联网连接数. 附:样本相关系数r=,b=,a=-b,≈41.7. 解 (1)由图可知,两个变量线性相关. 由已知条件可得==3, ==15, 所以(t-)(w-)=16+3+0+4+18=41, i i ==, ==, 所以样本相关系数r=≈≈0.98, 因此,两个变量具有很强的线性相关性. (2)结合(1)可知,b==4.1,a=-b· =15-4.1×3=2.7, 所以线性回归方程是W=4.1T+2.7, 当t=7时,有w=4.1×7+2.7=31.4, 即预测2024年移动物联网连接数为31.4亿户.