当前位置:首页>文档>第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习

第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习

  • 2026-04-14 06:33:50 2026-04-14 01:17:29

文档预览

第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习
第49练成对数据的统计分析(精练:基础+重难点)一轮复习讲义2024年高考数学高频考点题型归纳与方法总结(新高考通用)原卷版_2024年新高考资料_1.2024一轮复习

文档信息

文档格式
docx
文档大小
2.268 MB
文档页数
45 页
上传时间
2026-04-14 01:17:29

文档内容

【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用) 第 49 练 成对数据的统计分析(精练) 刷真题 明导向 一、单选题 1.(2023·天津·统考高考真题)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数 ,下列说法正确的是( ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈现负相关 C.花瓣长度和花萼长度呈现正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是 二、解答题 2.(2023·全国·统考高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将 其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小 白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (1)计算试验组的样本平均数; (2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数, 完成如下列联表对照 组 试验 组 (ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增 加量有差异? 附: , 0.100 0.050 0.010 2.706 3.841 6.635 3.(2022·全国·统考高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司 长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表: 准点班次数 未准点班次数 A 240 20 B 210 30 (1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率; (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附: , 0.100 0.050 0.010 2.706 3.841 6.635 4.(2022·全国·统考高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某 种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量(单 位: ),得到如下数据: 样本号i 1 2 3 4 5 6 7 8 9 10 总和 根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9 并计算得 . (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01); (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已 知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数 . 5.(2021·全国·统考高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比 较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表: 一级 二级品 合计 品 甲机床 150 50 200 乙机床 120 80 200 合计 270 130 400 (1)甲机床、乙机床生产的产品中一级品的频率分别是多少? (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异? 附: 0.050 0.010 0.001 k 3.841 6.635 10.828 【A组 在基础中考查功底】 一、单选题 1.已知x与y之间的一组数据:x 0 1 2 3 y 1 3 5 7 则y与x的线性回归方程 必过点( ) A.(0.5,3) B.(1.5,0) C.(1,2) D.(1.5,4) 2.中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时 间x和茶水温度y的一组数据 ,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和 的值分别是1.23、0.80、0.12、1.36.则拟合效果最好的模型是( ) A.模型① B.模型② C.模型③ D.模型④ 3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表: 文化程度与月收入列联表(单位:人) 收入 月收入2000元以下 月收入2000元及以上 合计 文化程度 高中文化以上 10 45 55 高中文化及以 20 30 50 下 合计 30 75 105 由上表中数据计算得 .如果认为文化程度与月收入有关系,那么犯错误的 概率不会超过( ) 附表: α 0.10 0.05 0.010 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 A.0.01 B.0.025 C.0.03 D.0.05 4.下列说法错误的是( ) A.决定系数 越大,模型的拟合效果越好 B.若变量x和y之间的样本相关系数为 ,则变量x和y之间的负相关程度很强C.残差平方和越小的模型,拟合的效果越好 D.在经验回归方程 中,当解释变量x每增加1个单位时,响应变量y平均增加3个单位 5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下: 优秀 非优秀 总计 甲班 乙班 总计 105 已知在全部105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正确的是( ) A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50 C.列联表中c的值为20,b的值为50 D.由列联表可看出成绩与班级有关系 6.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据, 得到回归直线方程 ,相关系数为 ;方案二:剔除点 ,根据剩下的数据得到回归直线方 程 ,相关系数为 .则( ) A. B. C. D. 7.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行 独立性检验,经计算χ2=8.01,则所得到的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为 ( ) 附:A.0.1% B.0.5% C.99.5% D.99.9% 8.如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系 用下列函数模型近似刻画最好的是( ) A. B. C. D. 9.已知一组成对数据 中 关于 的一元非线性回归方程 ,已知 , , ,则 ( ) A.3 B.1 C. D. 10.如图,5个 数据,去掉 后,下列说法正确的是( ) A.样本相关系数r变小B.残差平方和变大 C.决定系数 变大 D.解释变量x与响应变量 y的相关性变弱 11.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中.已知该产品的色 度y和色差x之间满足线性相关关系,且 ,现有一对测量数据为 ,若该数据的残差为 0.6,则 ( ) 2 色差x 21 25 27 3 1 色度y 15 19 20 8 A.23.4 B.23.6 C.23.8 D.24.0 12.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼 夜温差 与实验室种子浸泡后的发芽数 (颗)之间的线性回归方程: ,且对应数据如表: 温差 1 2 3 4 5 发芽数 3 7 8 10 12 颗 如果昼夜温差为 时,那么种子的发芽数大约是( ) A.21颗 B.23颗 C.25颗 D.27颗 13.某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出 下面的散点图:该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一: ;模型二: ,下列说法正确的是( ) A.变量y与x负相关 B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况 C.若选择模型二, 的图象一定经过点 D.当 时,通过模型计算得GDP值为70,实际GDP的值为71,则残差为1 14.新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的 成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示: 周数(x) 1 2 3 4 5 3 治愈人数(Y) 2 17 103 142 6 由表格可得Y关于x的非线性回归方程为 ,则此回归模型第5周的残差为( ) A.0 B.2 C.3 D.―2 15.某学习小组用计算机软件对一组数据 进行回归分析,甲同学首先求出经验回归方 程 ,样本点的中心为 .乙同学对甲的计算过程进行检查,发现甲将数据 误输成 , 数据 误输成 ,将这两个数据修正后得到经验回归方程 ,则实数 ( ) A. B. C. D. 16.已知由样本数据点集合 ,求得的回归直线方程 为 ,且 .现发 现两个数据点 和 误差较大,去除这两点后重新求得的回归直线方程 的斜率为 ,则正 确的是( ) A.变量 与 具有负相关关系B.去除后 的估计值增加速度变快 C.去除后回归方程为 D.去除后相应于样本点(2,3.75)的残差为 二、多选题 17.下面的各图中,散点图与相关系数r符合的是( ) A. B. C. D. 18.某制药公司为了研究某种治疗高血压的药物在饭前和饭后服用的药效差异,随机抽取了200名高血压 患者开展试验,其中100名患者饭前服药,另外100名患者饭后服药,随后观察药效,将试验数据绘制成 如图所示的等高条形图,已知 ,且 ,则下列说法正确的 是( ) A.饭前服药的患者中,药效强的频率为 B.药效弱的患者中,饭后服药的频率为 C.在犯错误的概率不超过0.01的条件下,可以认为这种药物饭前和饭后服用的药效有差异 D.在犯错误的概率不超过0.01的条件下,不能认为这种药物饭前和饭后服用的药效有差异19.以下四个命题,其中不正确的是( ) A.在对吸烟与患肺病这两个分类变量的独立性检验中,(参考数据: ) 若 的观 测值满足 ,那么在100个吸烟的人中约有99人患有肺病 B.两个随机变量的线性相关性越强,相关系数就越接近于1 C.对于独立性检验, 的观测值越大,判定“两变量有关系”的把握越大 D.回归方程 对应的直线至少经过其样本数据点中的一个点 20.“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有 多亿元的餐桌浪费,被倒掉的食 物相当于 亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动” 某机构 为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了 位来店就餐的客人,制成如下表所 示的列联表,通过计算得到 的观测值为 已知 , ,则下列 判断正确的是( ) . 认可 不认可 岁以下 岁以上 含 岁 A.在该餐厅用餐的客人中大约有 的客人认可“光盘行动” B.在该餐厅用餐的客人中大约有 的客人认可“光盘行动” C.有 的把握认为“光盘行动”的认可情况与年龄有关 D.在犯错误的概率不超过 的前提下,认为“光盘行动”的认可情况与年龄有关 21.如图是从2013年到2018年六年间我国公共图书馆业机构数与对应年份编号的散点图(为便于计算, 将2013年编号为1,2014年编号为2,…,2018年编号为6,把每年的公共图书馆业机构数作为预报变量, 把年份编号作为解释变量进行回归分析),得到回归直线方程为 ,其相关系数 ,下列结论正确的是( )A.公共图书馆业机构数与年份编号的正相关性较强 B.在2014—2018年间,2016年公共图书馆业机构数增加量最多 C.公共图书馆业机构数平均每年约增加14 D.可预测2022年公共图书馆业机构数为3232 22.若冬季昼夜温差x(单位: )与某新品种反季节大豆的发芽数量y(单位:颗)具有线性相关关系, 根据一组样本数据 ,用最小二乘法近似得到线性回归方程为 ,则下列结论 中正确的是( ) A.y与x具有正相关关系 B.相应于点 的残差为 C.若冬季昼夜温差的大小为 ,则该新品种反季节大豆的发芽数一定是35颗 D.若冬季昼夜温差增加1 ℃,则该新品种反季节大豆的发芽数约增加3.8颗 23.在一次 独立性检验中得到如下 列联表: 总计 20 800 1000 0 18 m 0 38 总计 0 已知 , ,根据上面的 列联表,若依据小概率值的 独立性检验,可以认为这两个分类变量A和B没有关系,则下列选项中m可能取到的为 ( ) A.200 B.720 C.100 D.800 24.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为 ,计 算其相关系数为 .经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归 直线的方程为 ,相关系数为 ,以下结论中,正确的是( ) A. B. C. D. 三、填空题 25.下列命题: ①线性回归直线必过样本数据的中心点 ; ②如果两个变量的相关性越强,则相关性系数r就越接近于1; ③当相关性系数 时,两个变量正相关; ④残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高; ⑤甲、乙两个模型的 分别约为0.88和0.80,则模型乙的拟合效果更好. 其中正确的命题有 .(填序号) 26.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶震生产产量(单位:万盒)的数据如表所 示:若 线性相关,线性回归方程为 ,则当 时, 的预测值为 万盒. (月份) 1 2 3 4 5 (万 5 6 5 6 8 盒)27.已知 的取值如下表: 1 2 3 4 32 48 72 88 根据表中的数据求得 关于 的回归直线方程为 ,则表中第2个记录数据的残差 . 28.某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同 年份的该酒品,并测定了其芳香度(如下表). 年份 芳香度 由最小二乘法得到线性回归方程 ,但不小心在检测后滴到表格上一滴检测液,污损了一个 数据,请你推断该数据为 . 29.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别 合计 统计专 非统计专业 业 男 13 10 23 女 7 20 27 合计 20 30 50 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2= ≈4.844,因为 χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为 . 附: 30.某池塘中水生植物的覆盖水塘面积x(单位: )与水生植物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型 去拟合x与y的关系,设 ,x与z的数据如表格所示: x 3 4 6 7 z 2 2.5 4.5 7 得到x与z的线性回归方程 ,则 . 四、解答题 31.新疆农科所在土壤环境不同的A、B两块实验地分别种植某品种的棉花,为了评价该品种的棉花质量, 在棉花成熟后,分别从A、B两地的棉花中各随机抽取40根棉花纤维进行统计,结果如表:(记纤维长度 不低于300mm的为长纤维,其余为短纤维). (0, 纤维长度 [100,200) [200,300) [300,400) [400,500] 100) A地(根数) 4 9 2 17 8 B地(根数) 2 1 2 20 15 由以上统计数据,填写下面2×2列联表,并依据 的独立性检验,分析纤维长度与土壤环境是否有关. 单位:根 A地 B地 总计 长纤 维 短纤 维 总计 附: . 32. 年北京冬奥会的成功申办与“ 亿人上冰雪”庄严承诺的提出,推动了冰雪运动的普及与发展. 北京某大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了 人进行调查,其中女生 人,且女生中对冰球运动有兴趣的占 ,而男生中有 人表示对冰球运动没 有兴趣.(1)完成 列联表 没兴 有兴趣 合计 趣 男生 女生 合计 (2)能否有 的把握认为“对冰球是否有兴趣与性别有关”? 附表: 33.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需 要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析, 得到样本数据 ,其中 和 分别表示第i个县城的人口(单位:万人)和该县年垃圾产生 总量(单位:吨),并计算得: , , , , . (1)求这20个县年垃圾产生总量的平均值; (2)请用相关系数说明该组数据中 与 之间的关系可用线性回归模型进行拟合.(当 时, 与 的相关关系较强,否则相关关系较弱.) 参考公式:相关系数 . 34.某学校共有 名学生参加知识竞赛,其中男生 人,为了解该校学生在知识竞赛中的情况,采用分层随机抽样的方法抽取了 名学生进行调查,分数分布在 分之间,根据调查的结果绘制的学 生分数频率分布直方图如图所示.将分数不低于 分的学生称为“高分选手”. 属于“高分选 不属于“高分选 合计 手” 手” 男生 女生 合计 (1)求 的值; (2)若样本中属于“高分选手”的女生有 人,试完成 列联表,依据 的独立性检验,能否认 为该校学生属于“高分选手”与“性别”有关联? (参考公式: ,其中 ) 35.“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展, 下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表: 年份 2015 2016 2017 2018 2019 销量(万台) 8 10 13 25 24 某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示: 购车种类 车主 合计 新能源 传统燃油车 车男性 6 24 女性 2 合计 30 (1)求新能源乘用车的销量y关于年份x的相关系数r,并判断y与x是否线性相关; (2)请将上述2×2列联表补充完整,并依据χ2的值判断,购车车主购置新能源乘用车与性别是否有关. 附: . 36.某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情 况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:h). (1)应收集多少位女生样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图如图所示,其中样本数据分 组区间为: .估计该校学生每周平均体育运动时间超过4个小时的概率. (3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请制作每周平均体育运动时间与 性别的 列联表,并判断是否有 的把握认为“该校学生的每周平均体育运动时间与性别有关”. 37.某高中生参加社会实践活动,对某公司1月份至5月份销售的某种配件的销售量及销售单价进行了调 查,销售单价 和销售量 之间的一组数据如下表所示: 月份 1 2 3 4 5 销售单价 元 9 9.5 10 10.5 11 销售量 件 11 10 8 6 5(1)由上表数据知,可用线性回归模型拟合 与 的关系,请用相关系数加以说明;(精确到0.01) (2)求出 关于 的线性回归方程; (3)预计在今后的销售中,销售量与销售单价仍然服从(2)中的关系,如果该种配件的成本是2.5元/件, 那么该种配件的销售单价应定为多少元才能获得最大利润?(注:利润 销售收入 成本) 参考公式:相关系数 ,线性回归方程 的斜率和截距的最小二乘法估 计分别为 . 参考数据: 38.随着我国经济的发展,人民的生活质量日益提高,对商品的需求也日益增多.商家销售商品,既满足顾 客需要,又为商家创造效益,是一种相互依存的合作关系.为较好地达到这个目的,商家需要运用数学模型 分析商品销售的规律并确定最优的销售价格.某商店以每件2元的价格购进一种小商品,经过一段时间的试 销后,得到下表的统计数据: 售价 (元/件) 3 4 5 6 7 5 4 日销量 (件) 69 54 30 7 0 (1)由上表数据知,可用线性回归模型拟合y与 的关系,请用相关系数加以说明;(精确到0.01) (2)求 关于 的线性回归方程; (3)试问商家将每件售价定为多少元时,可使其获得最大日利润?(结果保留整数) 附;相关系数 ,线性回归方程 的斜率和截距的最小二乘法估计分别为 , . 参考数据: , , , . 39.某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业,产品主要应用于森 林消防、物流运输、航空测绘、军事侦察等领域,获得市场和广大观众的一致好评,该公司生产的甲、乙 两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.该公司分别收集 了甲、乙两种类型无人运输机在5个不同的地点测试的某项指标数 , ,数据如下表所示: 地点1 地点2 地点3 地点4 地点5 甲型无人运输机指标数x 2 4 5 6 8 乙型无人运输机指标数y 3 4 4 4 5 (1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若 ,则线性相 关程度很高) (2)从这5个地点中任抽2个地点,求抽到的这2个地点,甲型无人运输机指标数均高于乙型无人运输机指 标数的概率. 附:相关公式及数据: , . 40.为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下: 天数x 1 2 3 4 5 6 繁殖个数y 6 12 25 49 95 190(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断 (a,b为常数)与 ( , 为常数,且 , )哪一个适宜作为繁殖个数y关于天数x变 化的回归方程类型?(给出判断即可,不必说明理由) (2)对于非线性回归方程 ( , 为常数,且 , ),令 ,可以得到繁殖个数的 对数z关于天数x具有线性关系及一些统计量的值. 3.50 62.83 3.53 17.50 596.57 12.09 ①证明:“对于非线性回归方程 ,令 ,可以得到繁殖个数的对数z关于天数x具有线性关 系(即 ,β,α为常数)”; ②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数). 附:对于一组数据 , ,…, ,其回归直线方程 的斜率和截距的最小二乘估 计分别为 , . 41.近几年,电商的蓬勃发展带动了快递行业的迅速增长.为了获得更大的利润,某快递公司在 城市的网 点对“一天中收发一件块递的平均成本 (单位:元)与当天揽收的快递件数 (单位:千件)之间的关 系”进行调查研究,得到相关数据如下表: 每天揽收快递件数 (千件) 2 3 4 5 8每件快递的平均成本 (元) 5.6 4.8 4.4 4.3 4.1 根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个经验回归方程:方程甲: ,方程乙: . (1)为了评价两种模型的拟合效果,完成以下问题: ①根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数): 每天揽收快递件数xi/千件 2 3 4 5 8 每件快递的平均成本yi/元 5.6 4.8 4.4 4.3 4.1 预报值 5.2 5 4.8 模型甲 随机误差 -0.4 0.2 0.4 预报值 5.5 4.8 4.5 模型乙 随机误差 -0.1 0 0.1 (各注: 称为相应于点 的随机误差) ②分别计算模型甲与模型乙的随机误差平方和 , 并依此判断哪个模型的拟合效果更好. (2)已知该快递网点每天能揽收的快递件数 (单位:千件)与揽收一件快递的平均价格 (单位:元)之 间的关系是 ,根据(1)中拟合效果较好的模型建立的回归方程解决以下问题: ①若一天揽收快递6千件,则当天总利润的预报值是多少? ②为使每天获得的总利润最高,该快递网点应该将揽收一件快递的平均价格定为多少?(备注:利润=价 格-成本) 42.如图是某采矿厂的污水排放量 (单位:吨)与矿产品年产量 (单位:吨)的折线图:(1)依据折线图计算相关系数 (精确到0.01),并据此判断是否可用线性回归模型拟合 与 的关系? (若 ,则线性相关程度很高,可用线性回归模型拟合) (2)若可用线性回归模型拟合 与 的关系,请建立 关于 的线性回归方程,并预测年产量为10吨时的污 水排放量. 相关公式 , 参考数据: .回归方程 中, . 43.耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.还水稻的灌溉是将海水稀释后进 行灌溉.某实验基础为了研究海水浓度 ( )对亩产量 (吨)的影响,通过在试验田的种植实验,测 得了某种还水稻的亩产量与海水浓度的数据如下表: 海水浓度 亩产量 (吨) 绘制散点图发现,可用线性回归模型拟合亩产量 与海水浓度 之间的相关关系,用最小二乘法计算得 与 之间的线性回归方程为 . (1)求出 的值,并估算当浇灌海水浓度为8%时该品种的亩产量. (2)①完成下列残差表:海水浓度 亩产量 (吨) 残差 ②统计学中常用相关指数 来刻画回归效果, 越大,模型拟合效果越好,如假设 ,就说明预报 变量 的差异有 是由解释变量 引起的.请计算相关指数 (精确到0.01),并指出亩产量的变化多大 程度上是由浇灌海水浓度引起的. (附:残差公式 ,相关指数 ,参考数据 ) 【B组 在综合中考查能力】 一、单选题 1.已知某公司产品的广告投入 (万元)与利润 (万元)的一组数据如表所示 2 3 4 5 6 1 21 39 50 75 5 利润 与广告投入 之间具有较强的线性相关关系,其线性回归直线方程是 ,据此模型估计广 告投入为9万元时,利润约为( ) A.112万元 B.114.5万元 C.115万元 D.115.5万元 2.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中, 一般都会进行动物保护测试,为了考查某种疫苗预防效果,在进行动物试验时,得到如下统计数据: 发 是否发病 未发病 总计 病 未注射疫苗 20 注射疫苗 30总计 50 50 100 现从试验动物中任取一只,取得“注射疫苗”的概率为 ,则下列判断错误的是( ) 公式: 0.10 0.05 0.010 0.001 2.706 3.841 6.635 10.828 .A.注射疫苗发病的动物数为10 B.从该试验未注射疫苗的动物中任取一只,发病的概率为 C.有99%的把握判断注射疫苗与是否发病有关联 D.有95%的把握判断注射疫苗与是否发病有关联 3.下列四个命题中,正确命题的个数为( ) ①甲乙两组数据分别为:甲:28,31,39,42,45,55,57,58,66;;乙:,29,34,35,48,42, 46,55,53,55,67.则甲乙的中位数分别为45和44. ②相关系数 ,表明两个变量的相关性较弱. ③若由一个 列联表中的数据计算得 的观测值 ,那么有99%的把握认为两个变量有关. ④用最小二乘法求出一组数据 , 的回归直线方程 后要进行残差分析,相应于数 据 , 的残差是指 . 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 A.1 B.2 C.3 D.4 4.在一次独立性检验中,得出2×2列联表如下: A 合计20 B 800 1000 0 18 a 180+a 0 38 合计 800+a 1180+a 0 且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( ) A.200 B.720 C.100 D.180 5.相关变量的样本数据如下表, x 1 2 3 4 5 6 7 y 2.9 3.3 3.6 4.4 4.8 a 5.9 经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为 ,下列说法正确的是 ( ) A.x增加1时,y一定增加2.3 B.变量x与y负相关 C.当y为6.3时,x一定是8 D.a=5.2 6.已知x,y的取值如下表所示,从散点图分析可知y与x线性相关,如果线性回归方程为 , 则下列说法不正确的是( ) A.m的值为6.2 B.回归直线必过点(2,4.4) C.样本点(4,m)处的残差为0.1 D.将此图表中的点(2,4.4)去掉后,样本相关系数r不变 7.针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调 查的男、女生人数相同,男生中喜欢航天的人数占男生人数的 ,女生中喜欢航天的人数占女生人数的 , 若依据 的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生 中男生的人数不可能为( )A.25 B.45 C.60 D.75 8.杂交水稻之父袁隆平,推进粮食安全,消除贫困,造福民生做出杰出贡献,他在杂交水稻育种的某试 验中,第1个周期到第5个周期育种频数如下 周期数(x) 1 2 3 4 5 1 频数(y) 2 36 93 142 7 由表格可得 关于 的二次回归方程为 ,则此回归模型第2周期的残差(实际值与预报值之差) 为( ) A.0 B.1 C.4 D.5 二、多选题 9.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服 务给出满意或不满意的评价,得到如下所示的列联表,经计算 ,则可以推断出( ) 满 不满意 意 男 30 20 女 40 10 A.该学校男生对食堂服务满意的概率的估计值为 B.调研结果显示,该学校男生比女生对食堂服务更满意 C.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.05 D.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.01 10.某学习小组收集了7组样本数据(如下表所示): 1 2 3 4 5 6 7 0.5 1.2 0.8 1.5 1.7 2.3 2.5 他们绘制了散点图并计算样本相关系数 ,发现 与 有比较强的线性相关关系. 若 关于 的经验回归方程为 ,则( )A. 与 呈正相关关系 B. C.当 时, 的预测值为3.3 D.去掉样本点 后,样本相关系数 不变 11.总和生育率有时也简称生育率,是指一个人口群体的各年龄别妇女生育率的总和.它反映的是一名妇 女在每年都按照该年龄别现有生育率生育的假设下,在育龄期间生育的子女总数.为了了解中国人均 GDPx(单位:万元)和总和生育率y以及女性平均受教育年限z(单位:年)的关系,采用2012~2022近 十年来的数据 绘制了散点图,并得到经验回归方程 , , 对应的决定系数分别为 , ,则( ) A.人均GDP和女性平均受教育年限正相关. B.女性平均受教育年限和总和生育率负相关 C. D.未来三年总和生育率一定继续降低 12.下列命题正确的是( ) A.若样本数据 的方差为2,则数据 的方差为8 B.以模型 去拟合一组数据时,为了求出经验回归方程,设 ,求得线性回归方程为,则 的值分别是 和4 C.若某校高三(1)班8位同学身高(单位 )分别为: ,则这组数 据的上四分位数(即第75百分位数)为174 D.根据变量 与 的样本数据计算得到 ,根据 的独立性检验 ,可判 断 与 有关,且犯错误的概率不超过0.05 三、填空题 13.在研究硝酸钠的可溶性程度时,观测它在不同温度(单位: ) 的水中的溶解度(单位: ), 得到如下观测结果: 温度 溶解度 由此得到回归直线的斜率是 . 14.某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如 下表所示,其中 ,且 ,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则 的值是 . 对工作满 对工作不满意 意 男 女 附: ,其中 . 15.对于数据组 ,如果由经验回归方程得到的对应自变量 的估计值是 ,那么将称为对应点 的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进 行试销,得到如下所示数据: 单价 元 8.2 8.4 8.6 8.8 销量 件 84 83 78 m 根据表中的数据,得到销量 (单位:件)与单价 (单位:元)之间的经验回归方程为 ,据 计算,样本点 处的残差为 ,则 . 16.已知某品牌的新能源汽车的使用年限 (单位:年)与维护费用 (单位:千元)之间可以用模型 去拟合,收集了4组数据,设 与 的数据如表格所示: 4 6 8 10 2 3 5 6 利用最小二乘法得到 与 的线性回归方程 ,则 . 四、解答题 17.为了研究学生每天整理数学错题情况,某课题组在某市中学生中随机抽取了100名学生调查了他们期 中考试的数学成绩和平时整理数学错题情况,并绘制了下列两个统计图表,图1为学生期中考试数学成绩 的频率分布直方图,图2为学生一个星期内整理数学错题天数的扇形图.若本次数学成绩在110分及以上 视为优秀,将一个星期有4天及以上整理数学错题视为“经常整理”,少于4天视为“不经常整理”.已 知数学成绩优秀的学生中,经常整理错题的学生占 . 数学成绩优秀 数学成绩不优秀 合计 经常整理 不经常整理 合计(1)求图1中 的值以及学生期中考试数学成绩 的上四分位数; (2)根据图1、图2中的数据,补全上方 列联表,并根据小概率值 的独立性检验,分析数学成绩 优秀与经常整理数学错题是否有关? 附: 18.安顺市教育局为深入贯彻党的教育方针,全面落实《中共中央国务院关于全面加强新时代大中小学劳 动教育的意见》,从2022年起,安顺市中小学积极推进劳动教育课程改革,某高中积极响应教育局安排, 先后开发开设了具有安顺特色的烹饪、手工、园艺、职业体验、非物质文化遗产等劳动实践类校本课程, 为调研学生对新开设劳动课程的满意度并不断改进劳动教育,该校从2022年1月到10月每两个月从全校 3000名学生中随机抽取150名学生进行问卷调查,统计数据如下表: 月份 2 4 6 8 10 8 满意人数 95 100 105 120 0 (1)由表中看出,满意人数 与月份 之间存在很强的线性正相关关系,请用相关系数 加以证明(一般认 为 时有很强的线性相关关系);并求 关于 的经验回归方程 ,请用该方程预测12月份该 校全体学生中对劳动课程的满意人数; (2)10月份时,该校为进一步深化劳动教育改革,了解不同性别的学生对劳动课程是否满意,经调研得如下 统计表: 满意 不满意 合计男生 65 10 75 女生 55 20 75 合计 120 30 150 请根据 的独立性检验,能否认为该校的学生性别与对劳动课程是否满意有关联? 参考公式: , ; 0.10 0.05 0.025 0.010 0.005 2.706 3.841 5.024 6.635 7.879 ,其中 , , . 19.为了实现五育并举,鼓励学生在学好文化知识的同时也要锻炼好身体,某学校随机抽查了100名学生, 统计他们每天参加体育运动的时间,并把他们之中每天参加体育运动时间大于或等于60分钟的记为“达 标”,运动时间小于60分钟的记为“不达标”,统计情况如下图: 参考公式: ; 参考数据: 0.05 0.025 0.010 3.841 5.024 6.635 (1)完成列联表,并判断能否在犯错误的概率不超过0.025的前提下认为“运动达标”与“性别”有关. 运动达 运动不达标 总计 标男生 女生 总计 (2)现从“不达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2人进行体育运动 指导,求选中的2人都是女生的概率. 20.某通信公司为了更好地满足消费者对流量的需求,推出了不同定价的流量包,经过一个月的统计,获 取了容量为 万人的样本.同时为了进一步了解年龄因素是否对流量包价格有影响,统计了小于 岁和 大于等于 岁两个年龄段人群的购买人数,收集数据整理如表所示. 表1 3 定价 (元/月) 20 50 60 0 1 岁(万人) 10 7 8 5 1 岁(万人) 20 6 2 2 购买总人数 (万 2 30 13 10 人) 7 表2 流量包 年龄段 合计 元 元 岁 岁 合计 (1)试根据这些数据建立购买总人数关于定价的经验回归方程,并估计定价为 元/月的流量包的购买人数; (2)若把 元/月以下(不包括 元)的流量包称为低价流量包, 元/月以上(包括 元)的流量包称为 高价流量包,根据以上数据完成列联表,依据 的独立性检验,判断年龄段和流量包价格是否有关 联.附:, , . 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 21.已知一系列样本点 , , , ,其中 , .响应变量 关于 的线性回 归方程为 .对于响应变量 ,通过观测得到的数据称为观测值,通过线性回归方程得到的 称为 预测值,观测值减去预测值,称为残差,即 ,称为相应于点 的残 差. 参考公式: , , . (1)证明: ; (2)证明: ,并说明 与线性回归模型拟合效果的关系. 22.《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第 个指 导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智 慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网 红直播中,统计了 名网红直播的观看人次 和农产品销售量 的数据,得到如图所示的 散点图.(1)利用散点图判断, 和 哪一个更适合作为观看人次 和销售量 的回归方程类型; (只要给出判断即可,不必说明理由) (2)对数据作出如下处理:得到相关统计量的值如表: 其中令 , . 根据(1)的判断结果及表中数据,求 (单位:千件)关于 (单位:十万次)的回归方程,并预测当观 看人次为 万人时的销售量; 参考数据和公式: , 附:对于一组数据 、 、 、 ,其回归线 的斜率和截距的最小二乘估计分别 为: , . 23.某公司对其产品研发的年投资额 (单位:百万元)与其年销售量 (单位:千件)的数据进行统计, 整理后得到如下统计表: (1)求变量 和 的样本相关系数 (精确到 ),并推断变量 和 的线性相关程度;(若 ,则线性相关性程度很强;若 ,则线性相关性程度一般,若 ,则线性相关性程度很 弱.) (2)求年销售量 关于年投资额 的经验回归方程.并预测投资额为700万无时的销售量.(参考: ) 参考: , , . 24.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下: 航空公司编号 1 2 3 4 5 6 7 8 9 10 航班正点率/% 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5 顾客投诉次数 21 58 85 68 74 93 72 122 18 125 (1)绘制散点图,说明二者之间的关系形态; (2)若顾客投诉次数与航班正点率之间具有相关关系,求回归直线方程; (3)如果航班正点率为80%,试估计顾客投诉次数. 25.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其 主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在 我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人 员密集的地方更容易被传染.某幼儿园将去年春季该园患流感的小朋友按照年龄与人数统计,得到如下数据: 年龄 2 3 4 5 6 2 1 患病人数 20 14 10 1 5 (1)求 关于 的线性回归方程;(2)计算变量 的相关系数 (计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人 数与年龄负相关很强? 附:回归方程 中, ,相关系数 . 26.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产 量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件 数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平 均生产件数分成5组: 分别加以统计,得到如图所示的频率分布直 方图. (1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下”工人的概 率; (2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件列出 列联表,并判断是否 有 的把握认为“生产能手”与“工人所在的年龄组有关”? 27.一个车间为了估计加工某种新型零件所花费的时间,进行了10次试验,测得的数据如下: 4 零件个数x 10 20 30 50 60 70 80 90 100 0 8 10 加工时间y/min 62 68 75 89 95 102 115 122 1 8 (1)y与x之间是否具有相关关系? (2)如果y与x之间具有相关关系,求回归直线方程.(3)据此估计加工110个零件所用的时间. 28.某新能源汽车制造公司,为鼓励消费者购买其生产的特斯拉汽车,约定从今年元月开始,凡购买一辆 该品牌汽车,在行驶三年后,公司将给予适当金额的购车补贴.某调研机构对已购买该品牌汽车的消费者, 就购车补贴金额的心理预期值进行了抽样调查,得其样本频率分布直方图如图所示. 月份 元月 2月 3月 4月 5月 销售量(万 0.5 0.6 1.0 1.4 1.7 辆) 参考公式: , (1)估计已购买该品牌汽车的消费群体对购车补贴金额的心理预期值的平均数和中位数(精确到0.01); (2)统计今年以来元月~5月该品牌汽车的市场销售量,得其频数分布表如上,预测该品牌汽车在今年6月份 的销售量约为多少万辆? 29.为研究质量 (单位:克)对弹簧长度 (单位:厘米)的影响,对不同质量的6个物体进行测量,数据如 表所示: 5 10 15 20 25 30 7.25 8.12 8.95 9.90 10.9 11.8 (1)作出散点图并求线性回归方程; (2)求出 ; (3)进行残差分析. 30.为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下: 天数x 1 2 3 4 5 6 繁殖个数y 6 12 25 49 95 190(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断 (a,b为常数)与 ( , 为常数,且 , )哪一个适宜作为繁殖个数y关于天数x变 化的回归方程类型?(给出判断即可,不必说明理由) (2)对于非线性回归方程 ( , 为常数,且 , ),令 ,可以得到繁殖个数的 对数z关于天数x具有线性关系及一些统计量的值. 3.50 62.83 3.53 17.50 596.57 12.09 ①证明:“对于非线性回归方程 ,令 ,可以得到繁殖个数的对数z关于天数x具有线性关 系(即 ,β,α为常数)”; ②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数). 附:对于一组数据 , ,…, ,其回归直线方程 的斜率和截距的最小二乘估 计分别为 , . 31.某研发小组为了解年研发资金投入量 (单位:亿元)对年销售额 (单位:亿元)的影响,结合近 10年的年研发资金投入量 和年销售额 的数据( ),建立了两个函数模型:① , ② ,其中 , , , 均为常数, 为自然对数的底数.设 , ,经过计 算得如下数据.20 66 770 200 14 460 4.20 3125000 0.308 21500 (1)设 和 的相关系数为 , 和 的相关系数为 ,请从相关系数的角度,选择一个拟合程度更 好的模型. (2)根据(1)中选择的模型及表中数据,建立 关于 的线性回归方程(系数精确到0.01),根据线性回归 方程,若当年的销售额大致为 亿元,则估计当年的研发资金投入量为多少亿元. 参考公式:相关系数 , 线性回归直线 中斜率和截距的最小二乘法估计参数分别为 , . 32.2019年上半年我国多个省市暴发了“非洲猪瘟”疫情,生猪大量病死,存栏量急剧下降,一时间猪肉 价格暴涨,其他肉类价格也跟着大幅上扬,严重影响了居民的生活.为了解决这个问题,我国政府一方面鼓 励有条件的企业和散户防控疫情,扩大生产;另一方面积极向多个国家开放猪肉进口,扩大肉源,确保市 场供给稳定.某大型生猪生产企业分析当前市场形势,决定响应政府号召,扩大生产,决策层调阅了该企业 过去生产相关数据,就“一天中一头猪的平均成本与生猪存栏数量之间的关系”进行研究.现相关数据统计 如下表: 生猪存栏数量 (千头) 2 3 4 5 8 头猪每天平均成本 3.2 2.4 2 1.9 1.5 (元) (1)研究员甲根据以上数据认为 与 具有线性回归关系,请帮他求出 关于 的线性回归方程(保留小数点后两位有效数字) (2)研究员乙根据以上数据得出 与 的回归模型: .为了评价两种模型的拟合结果,请完 成以下任务: ①完成下表(计算结果精确到0.01元)(备注: 称为相应于点 的残差); 生猪存栏数量 (千头) 2 3 4 5 8 头猪每天平均成本 (元) 3.2 2.4 2 1.9 1.5 估计值 模型甲 残差 估计值 3.2 2.4 2 1.76 1.4 模型乙 残差 0 0 0 0.14 0.1 ②分别计算模型甲与模型乙的残差平方和 及 ,并通过比较 与 的大小,判断哪个模型拟合效果更 好; (3)根据市场调查,生猪存栏数量达到1万头时,饲养一头猪每一天的平均收入为7.5元;生猪存栏数量 达到1.2万头时,饲养一头猪每一天的平均收入为7.2元.若按(2)中拟合效果较好的模型计算一天中一头 猪的平均成本,问该生猪存栏数量选择1万头还是1.2万头能获得更多利润?请说明理由.(利润=收入-成 本) 参考公式: , 参考数据: .【C组 在创新中考查思维】 一、单选题 1.设两个相关变量 和 分别满足 , , ,2,…,6,若相关变量 和 可拟合为非线性 回归方程 ,则当 时, 的估计值为( ) A.32 B.63 C.64 D.128 二、多选题 2.小明在家独自用下表分析高三前5次月考中数学的班级排名y与考试次数x的相关性时,忘记了第二次 和第四次月考排名,但小明记得平均排名 ,于是分别用m=6和m=8得到了两条回归直线方程: , ,对应的相关系数分别为 、 ,排名y对应的方差分别为 、 ,则下列结论正 确的是( ) x 1 2 3 4 5 y 10 m 6 n 2 (附: , ) A. B. C. D. 三、填空题 3.有两个分类变量 和 ,其中一组观测值为如下的2×2列联表: 总计 15 50 总 20 45 65 计 其中 , 均为大于5的整数,则 时,在犯错误的概率不超过 的前提下为“ 和之间有关系”.附: 四、解答题 4.某校20名学生的数学成绩 和知识竞赛成绩 如下表: 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩 100 99 96 93 90 88 85 83 80 77 知识竞赛成绩 20 290 160 220 65 70 90 100 60 270 0 学生编号i 11 12 13 14 15 16 17 18 19 20 数学成绩 75 74 72 70 68 66 60 50 39 35 知识竞赛成绩 45 35 40 50 25 30 20 15 10 5 计算可得数学成绩的平均值是 ,知识竞赛成绩的平均值是 ,并且 , , . (1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01); (2)设 ,变量 和变量 的一组样本数据为 ,其中 两两不相同, 两两不相同.记 在 中的排名是第 位, 在 中的排名是 第 位, .定义变量 和变量 的“斯皮尔曼相关系数”(记为 )为变量 的排名和变量 的 排名的样本相关系数.(i)记 , .证明: ; (ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述 “斯皮尔曼相关系数”在分析线性相关性时的优势. 注:参考公式与参考数据. ; ; . 5.移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接 数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.右图是2018-2022年移动物联网连接 数W与年份代码t的散点图,其中年份2018-2022对应的t分别为1~5. (1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度; (2)(i)假设变量x与变量Y的n对观测数据为(x,y),(x,y),…,(x,y),两个变量满足一元线性回归模 1 1 2 2 n n 型 (随机误差 ).请推导:当随机误差平方和Q= 取得最小值时,参 数b的最小二乘估计. (ii)令变量 ,则变量x与变量Y满足一元线性回归模型 利用(i)中结论求 y关于x的经验回归方程,并预测2024年移动物联网连接数.附:样本相关系数 , , , , 6. 指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是 否健康的一个标准.对于高中男体育特长生而言,当 数值大于或等于20.5时,我们说体重较重,当 数值小于20.5时,我们说体重较轻,身高大于或等于 我们说身高较高,身高小于170cm我们说 身高较矮. (1)已知某高中共有32名男体育特长生,其身高与 指数的数据如散点图,请根据所得信息,完成下 述列联表,并判断是否有 的把握认为男生的身高对 指数有影响. 身高较矮 身高较高 合计 体重较 轻 体重较 重 合计 (2)①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示: 编号 1 2 3 4 5 6 7 8 身高 166 167 160 173 178 169 158 173 体重 57 58 53 61 66 57 50 66 根据最小二乘法的思想与公式求得线性回归方程为 .利用已经求得的线性回归方程,请完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字) ; 编号 1 2 3 4 5 6 7 8 5 体重 57 58 53 61 66 50 66 7 残差 0.1 0.3 0.9 ②通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误, 已知通过重新采集发现,该组数据的体重应该为 .请重新根据最最小二乘法的思想与公式,求出男体 育特长生的身高与体重的线性回归方程. 【参考公式】 , , , , . 【参考数据】 , , , , . 0.10 0.05 0.01 0.005 2.706 3.811 6.635 7.879