当前位置:首页>文档>专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计

专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计

  • 2026-03-18 14:41:57 2026-03-18 14:41:57

文档预览

专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计
专题五概率与统计第3讲 统计与成对数据的分析解析版_2.2025数学总复习_2025年新高考资料_二轮复习_2025高考数学二轮复习专项突破练习_专题五概率与统计

文档信息

文档格式
docx
文档大小
5.948 MB
文档页数
46 页
上传时间
2026-03-18 14:41:57

文档内容

第3讲 统计与成对数据的分析(新高考专用) 目录 【真题自测】.................................................................................................................................2 【考点突破】.................................................................................................................................9 【考点一】统计图表、数字特征.....................................................................................................9 【考点二】回归分析.....................................................................................................................14 【考点三】独立性检验..................................................................................................................22 【专题精练】...............................................................................................................................29 1 / 46 学科网(北京)股份有限公司考情分析: 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与 运用、独立性检验问题,常与概率综合考查,中等难度. 真题自测 一、单选题 1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田 的亩产量(单位:kg)并整理如下表 亩产 [900, [1000, [1050, [1150, [950,1000) [1100,1150) 量 950) 1050) 1100) 1200) 频数 6 12 18 30 24 10 根据表中数据,下列结论中正确的是( ) A.100块稻田亩产量的中位数小于1050kg B.100块稻田中亩产量低于1100kg的稻田所占比例超过80% C.100块稻田亩产量的极差介于200kg至300kg之间 D.100块稻田亩产量的平均值介于900kg至1000kg之间 2.(2023·全国·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽 样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生, 则不同的抽样结果共有( ). A. 种 B. 种 C. 种 D. 种 3.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机 抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前 和讲座后问卷答题的正确率如下图: 2 / 46 学科网(北京)股份有限公司则( ) A.讲座前问卷答题的正确率的中位数小于 B.讲座后问卷答题的正确率的平均数大于 C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差 D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差 二、解答题 4.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分 为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患 该疾病的人群中随机调查了100人(称为对照组),得到如下数据: 不够良 良好 好 病例组 40 60 对照组 10 90 (1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异? (2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该 疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标 为R. (ⅰ)证明: ; 3 / 46 学科网(北京)股份有限公司(ⅱ)利用该调查数据,给出 的估计值,并利用(ⅰ)的结果给出R的估计值. 附 , 0.050 0.010 0.001 k 3.841 6.635 10.828 5.(2022·全国·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树 木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量(单位: ),得到如下数据: 样本号i 1 2 3 4 5 6 7 8 9 10 总和 根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6 材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9 并计算得 . (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01); (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已 知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数 . 6.(2023·全国·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20 只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养 在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g). (1)设 表示指定的两只小白鼠中分配到对照组的只数,求 的分布列和数学期望; (2)实验结果如下: 对照组的小白鼠体重的增加量从小到大排序为: 4 / 46 学科网(北京)股份有限公司15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 实验组的小白鼠体重的增加量从小到大排序为: 7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如 下列联表: 对照组 实验组 (ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加 量有差异. 附: 0.100 0.050 0.010 2.706 3.841 6.635 参考答案: 题号 1 2 3 答案 C D B 1.C 【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计 算方法即可判断C;根据平均值计算公式即可判断D. 【详解】对于 A, 根据频数分布表可知, , 所以亩产量的中位数不小于 , 故 A 错误; 24+10=34 对于B,亩产量不低于 的频数为 , 所以低于 的稻田占比为 ,故B错误; 对于C,稻田亩产量的极差最大为 ,最小为 ,故C正确; 5 / 46 学科网(北京)股份有限公司对于D,由频数分布表可得,平均值为 ,故D错误. 故选;C. 2.D 【分析】利用分层抽样的原理和组合公式即可得到答案. 【详解】根据分层抽样的定义知初中部共抽取 人,高中部共抽取 , 根据组合公式和分步计数原理则不同的抽样结果共有 种. 故选:D. 3.B 【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解. 【详解】讲座前中位数为 ,所以 错; 讲座后问卷答题的正确率只有一个是 个 ,剩下全部大于等于 ,所以讲座后问卷答题的正确率 的平均数大于 ,所以B对; 讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所 以C错; 讲座后问卷答题的正确率的极差为 , 讲座前问卷答题的正确率的极差为 ,所以 错. 故选:B. 4.(1)答案见解析 (2)(i)证明见解析;(ii) ; 【分析】(1)由所给数据结合公式求出 的值,将其与临界值比较大小,由此确定是否有99%的把握认为 患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii) 根据(i)结合已知数据求 . 6 / 46 学科网(北京)股份有限公司【详解】(1)由已知 , 又 , , 所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. (2)(i)因为 , 所以 所以 , (ii) 由已知 , , 又 , , 所以 5.(1) ; (2) (3) 【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木 平均一棵的根部横截面积与平均一棵的材积量; (2)代入题给相关系数公式去计算即可求得样本的相关系数值; (3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估 计值. 7 / 46 学科网(北京)股份有限公司【详解】(1)样本中10棵这种树木的根部横截面积的平均值 样本中10棵这种树木的材积量的平均值 据此可估计该林区这种树木平均一棵的根部横截面积为 , 平均一棵的材积量为 (2) 则 (3)设该林区这种树木的总材积量的估计值为 , 又已知树木的材积量与其根部横截面积近似成正比, 可得 ,解之得 . 则该林区这种树木的总材积量估计为 6.(1)分布列见解析, (2)(i) ;列联表见解析,(ii)能 【分析】(1)利用超几何分布的知识即可求得分布列及数学期望; (2)(i)根据中位数的定义即可求得 ,从而求得列联表; (ii)利用独立性检验的卡方计算进行检验,即可得解. 【详解】(1)依题意, 的可能取值为 , 则 , , , 所以 的分布列为: 8 / 46 学科网(北京)股份有限公司故 . (2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位 与第21位数据的平均数,观察数据可得第20位为 ,第21位数据为 , 所以 , 故列联表为: 合计 对照组 6 14 20 实验组 14 6 20 合计 20 20 40 (ii)由(i)可得, , 所以能有 的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异. 考点突破 【考点一】统计图表、数字特征 核心梳理: 1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×. 2.在频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中 点的横坐标之和. 一、单选题 1.(2024·四川·模拟预测)甲、乙两名运动员在一次射击训练中各射靶20次,命中环数的频率分布条形 图如下.设甲、乙命中环数的众数分别为 , ,方差分别为 , ,则( ) 9 / 46 学科网(北京)股份有限公司A. , B. , C. , D. , 2.(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统 计图(单位:万辆),则下列说法错误的是( )(注:同比:和上一年同期相比) A.2023年前5个月我国纯电动汽车的销量超过214万辆 B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆 C.这13个月我国纯电动汽车月度销量的众数为52.2万辆 D.和上一年同期相比,我国纯电动汽车月度销量有增有减 二、多选题 3.(2024·河南·模拟预测)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含 20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则 ( ) 10 / 46 学科网(北京)股份有限公司A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80 C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分 4.(2024·广东汕头·一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了 名 学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这 名学生中,成绩位于[80,90)内的学生成绩方差为 ,成绩位于 内的同学成绩方差为 .则 ( ) 参考公式:样本划分为 层,各层的容量、平均数和方差分别为: 、 、 ; 、 、 .记样本平均数 为 ,样本方差为 , . A. B.估计该年级学生成绩的中位数约为 C.估计该年级成绩在 分及以上的学生成绩的平均数为 D.估计该年级成绩在 分及以上的学生成绩的方差为 三、填空题 5.(2024·甘肃白银·三模)一组样本数据 的众数为 ,中位数为 . 6.(2024·山东济宁·一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本 11 / 46 学科网(北京)股份有限公司题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分, 有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题 正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的 考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选 了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 . 7.(23-24高二上·湖北武汉·开学考试)有一组按从小到大顺序排列的数据:3,5, ,8,9,10,若其极 差与平均数相等,则这组数据的中位数为 . 8.(2023·山东聊城·模拟预测)某市统计高中生身体素质的状况,规定身体素质指标值不小于60就认为 身体素质合格.现从全市随机抽取 100名高中生的身体素质指标值 , 经计算 , .若该市高中生的身体素质指标值服从正态分布 ,则估计该 市高中生身体素质的合格率为 .(用百分数作答,精确到0.1%) 参考数据:若随机变量X服从正态分布 ,则 , , . 参考答案: 题号 1 2 3 4 答案 A B BD BCD 1.A 【分析】观察给定的图表,利用众数的意义运动员命中环数的集中与分散程度判断即可. 【详解】根据图表知,甲、乙命中环数的众数均为7环,则 ; 甲运动员命中的环数比较分散,乙运动员命中的环数比较集中,则 . 故选:A 2.B 【分析】根据统计图表数据一一分析即可. 【详解】2023年前5个月我国纯电动汽车的销量为 万辆, 即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确; 将这13个月纯电动汽车的月度销量由小到大依次排列为 , 12 / 46 学科网(北京)股份有限公司, 则中位数为其中第 个数据,即 万辆,故B错误; 这些数据中只有 出现2次,其他数据均只出现1次,故众数为 万辆,故C正确; 2023年1月的同比增长率为负数,其它月份的同比增长率为正数, 故和上一年同期相比,我国纯电动汽车月度销量有增有减,故D正确. 故选:B. 3.BD 【分析】根据题意,由统计图表中的数据,结合频率分布直方图的面积和百分位数,以及平均数的计算公 式,逐项判定,即可求解. 【详解】对于A中,由年龄的扇形统计图,可得90后的考生有 人, 00后的考生有 人,可得 人,所以A不正确; 对于B中,由频率分布直方图性质,可得 , 解得 ,则前三个矩形的面积和 , 所以试成绩的 分位数为 分,所以B正确; 对于C中,设面试成绩的最低分为 ,由前三个矩形的面积和为 ,第四个矩形的面积为 ,则 分,所以C不正确; 对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为: 分,所以D正确. 故选:BD. 4.BCD 【分析】利用频率分布直方图中,所有直方图的面积之和为 ,列等式求出实数 的值,可判断A选项;利 用中位数的定义可判断B选项;利用总体平均数公式可判断C选项;利用方差公式可判断D选项. 【详解】对于A选项,在频率分布直方图中,所有直方图的面积之和为 , 则 ,解得 ,A错; 对于B选项,前两个矩形的面积之和为 , 前三个矩形的面积之和为 , 13 / 46 学科网(北京)股份有限公司设计该年级学生成绩的中位数为 ,则 , 根据中位数的定义可得 ,解得 , 所以,估计该年级学生成绩的中位数约为 ,B对; 对于C选项,估计成绩在 分以上的同学的成绩的平均数为 分,C对; 对于D选项,估计该年级成绩在 分及以上的学生成绩的方差为 ,D对. 故选:BCD. 5. 【分析】将数据从小到大重新排成一列,根据众数及中位数的定义,即可求出结果. 【详解】将样本数据 ,从小排到大得到 , 由众数及中位数的定义知:众数为 ,中位数为 , 故答案为: , . 6.11 【分析】列举出所有的得分情况,再结合中位数的概念求答案即可. 【详解】由题意得小明同学第一题得6分; 第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分; 第二题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分; 由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分 共8种情况, 所以中位数为 , 故答案为:11. 7. / 【分析】由极差和平均数求出 ,即可求出中位数. 【详解】依题意可得极差为 ,平均数为 , 14 / 46 学科网(北京)股份有限公司所以 ,解得 , 所以中位线为 . 故答案为: 8. 【分析】计算样本的平均数和方差,由此估计 ,再结合参考数据求 . 【详解】因为100个数据 , , ,…, 的平均值 , 方差 , 所以 的估计值为 , 的估计值为 . 设该市高中生的身体素质指标值为X, 由 , 得 , 所以 . 故答案为: . 规律方法: (1)对于给出的统计图表,一定要结合问题背景理解图表意义. (2)频率分布直方图中纵坐标不要误以为是频率. 【考点二】回归分析 核心梳理: 求经验回归方程的步骤 (1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略). (2)计算出,,a,b. (3)写出经验回归方程. 一、单选题 1.(2024·四川成都·模拟预测)某老师为了了解数学学习成绩得分y(单位:分)与每天数学学习时间x 15 / 46 学科网(北京)股份有限公司(单位:分钟)是否存在线性关系,搜集了100组数据 ,并据此求得y关于x 的线性回归方程为 .若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为 ( ) A.106 B.122 C.136 D.140 2.(2023·四川南充·一模)某商品的地区经销商对2023年1月到5月该商品的销售情况进行了调查,得到 如下统计表.发现销售量y(万件)与时间x(月)成线性相关,根据表中数据,利用最小二乘法求得y与 x的回归直线方程为: .则下列说法错误的是( ) 时间x(月) 1 2 3 4 5 销售量y(万件) 1 1.6 2.0 a 3 A.由回归方程可知2024年1月份该地区的销售量为6.8万件 B.表中数据的样本中心点为 C. D.由表中数据可知,y和x成正相关 二、多选题 3.(21-22高三上·重庆黔江·阶段练习)下列说法中正确的是( ) A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变 B.回归直线 恒过样本点的中心 ,且至少过一个样本点 C.用相关指数 来刻画回归效果时, 越接近1,说明模型的拟合效果越好 D.在 列联表中, 的值越大,说明两个分类变量之间的关系越弱 4.(2024·浙江·一模)为调研加工零件效率,调研员通过试验获得加工零件个数 与所用时间 (单位: )的5组数据为: ,根据以上数据可得经验回归方程为: ,则( ) 16 / 46 学科网(北京)股份有限公司A. B.回归直线 必过点 C.加工60个零件的时间大约为 D.若去掉 ,剩下4组数据的经验回归方程会有变化 三、填空题 5.(23-24高二上·四川绵阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定 的价格进行试销,得到如下数据: 单价(元) 销量(件) 由表中数据,求得线性回归方程 ,若在这些样本点中任取一点,则它在回归直线右上方的概率为 6.(2024·全国·模拟预测)某市一水果店为了了解柑橘的月销售量 (单位:千克)与月平均气温 (单 位: )之间的关系,随机统计了4个月的柑橘的月销售量与当月的平均气温,其数据如下表: 月平均气温x/ 18 12 8 2 月销售量 千 26 45 62 77 克 由表中数据得到 关于 的线性回归方程为 ,气象部门预测2024年4月该市的平均气温为 ,据此估计该水果店2024年4月柑橘的销售量为 千克. 四、解答题 7.(2024·河南郑州·三模)按照《中华人民共和国环境保护法》的规定,每年生态环境部都会会同国家发 展改革委等部门共同编制《中国生态环境状况公报》,并向社会公开发布.下表是2017-2021年五年《中 国生态环境状况公报》中酸雨区面积约占国土面积的百分比 : 年份 2017年 2018年 2019年 2020年 2021年 年份代码 1 2 3 4 5 6.4 5.5 5.0 4.8 3.8 (1)求2017—2021年年份代码 与 的样本相关系数(精确到0.01); 17 / 46 学科网(北京)股份有限公司(2)请用样本相关系数说明该组数据中 与 之间的关系可用一元线性回归模型进行描述,并求出 关于 的经验回归方程; (3)预测2024年的酸雨区面积占国土面积的百分比. (回归直线的斜率和截距的最小二乘法估计公式分别为: 附:样本相关系数, . 8.(23-24高三上·湖南衡阳·阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高 科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图, 其中年份代码1∼10分别对应年份2013∼2022. 根据散点图,分别用模型① ,② 作为年研发投入y(单位:亿元)关于年份代码x的 经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计 量的值: 75 2.25 82.5 4.5 120 28.35 表中 , . (1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经 18 / 46 学科网(北京)股份有限公司验回归方程模型?并说明理由; (2)(i)根据(1)中所选模型,求出y关于x的经验回归方程; (ii)设该科技公司的年利润 (单位:亿元)和年研发投入y(单位:亿元)满足 ( 且 ),问该科技公司哪一年的年利润最大? 附:对于一组数据(x ,y ),(x ,y ),…, ,其经验回归直线 的斜率和截距的最小二乘估 1 1 2 2 计分别为 , . 参考答案: 题号 1 2 3 4 答案 C A AC BC 1.C 【分析】利用回归方程经过样本中心可求 ,故可估计这位同学每天数学学习时间约80分钟后的数学成绩. 【详解】由题设可得 , 故 ,故 ,故 , 故当 时, , 故选:C. 2.A 【分析】根据给定数据,结合回归直线的特性逐项判断即得. 【详解】依题意, , 而y与x的回归直线方程为: ,则 , 解得 , ,表中数据的样本中心点为 ,BC正确; 19 / 46 学科网(北京)股份有限公司由 ,得y和x成正相关,D正确; 2024年1月份,即 ,由回归直线方程 ,得 , 因此2024年1月份该地区的销售量约为6.8万件,A错误. 故选:A 3.AC 【分析】 对A:由方差的性质即可判断;对B:由回归直线的性质即可判断;对C:利用相关指数 的性质即可判 断;对D:由卡方的意义即可判断. 【详解】对A:将一组数据中的每一个数据都加上或减去同一个常数后,数据的波动性不变, 故方差不变,故A正确; 对B:回归直线 恒过样本点的中心 正确,但不一定会过样本点, 故B错误; 对C:用相关指数 来刻画回归效果时, 越接近1,说明模型的拟合效果越好, 故C正确; 对D:在 列联表中, 的值越大,说明两个分类变量之间的关系越强, 故D错误. 故选:AC. 4.BC 【分析】求得数据的样本中心点可判断B;结合回归方程可求出 可判断A;将 代入回归方程 求得预测值可判断C;根据 恒过 ,可判断D. 【详解】 , , 所以 恒过 ,所以 , 解得: ,故A错误;B正确; 所以 ,令 ,则 , 故加工60个零件的时间大约为 ,故C正确; 20 / 46 学科网(北京)股份有限公司因为 恒过 , 所以剩下4组数据的经验回归方程不会有变化,故D错误. 故选:BC. 5. / 【分析】根据表中数据可得回归方程,进而确定在回归直线右上方的个数,进而可得概率. 【详解】由已知 , , 又样本中心 在回归直线 上, 即 ,解得 , 所以回归直线方程为 , 当 时, ,所以点 在回归直线上; 当 时, ,所以点 在回归直线左下方; 当 时, ,所以点 在回归直线右上方; 当 时, ,所以点 在回归直线右上方; 当 时, ,所以点 在回归直线右上方; 当 时, ,所以点 在回归直线左下方; 所以 个样本点中在回归直线右上方的有 个, 所以在这些样本点中任取一点,则它在回归直线右上方的概率为 , 故答案为: . 6.72 【分析】求出样本中心,求出 ,求出线性回归方程即可求解. 【详解】由题表得 , , 21 / 46 学科网(北京)股份有限公司所以回归直线 过点 , 得 ,解得 ,则线性回归方程为 , 所以当 时, , 故估计该水果店2024年4月柑橘的销售量为 千克. 故答案为: . 7.(1) (2) (3)预测2024年的酸雨区面积占国土面积的百分比为2.15% 【分析】(1)由表中数据结合题中数据,求出相关数值,代入相关系数 ,即可得出答案; (2)由(1)知 , 接近1,即可说明线性相关关系极强;根据(1)中求出的数据,即可求出 , ,进而得到回归直线方程; (3)将 代入回归直线方程,即可预测2024年的酸雨区面积占国土面积的百分比. 【详解】(1)由已知可得, , , 由题可列下表: 0 1 2 1.3 0.4 , . 22 / 46 学科网(北京)股份有限公司(2)由小问1知, 与 的相关系数 接近1,所以 与 之间具有极强的线性相关关系,可用 线性回归模型进行描述. 由小问1知, , , 所求经验回归方程为 . (3)令 ,则 ,预测2024年的酸雨区面积占国土面积的百分比为2.15%. 8.(1)选择模型②更适宜,理由见解析 (2)(i) ;(ii)该公司2028年的年利润最大 【分析】(1)根据残差图确定; (2)根据最小二乘法求非线性回归方程即可求解; 【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差; 模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜. (2)(i)设 ,所以 , 所以 , , 所以 关于 的经验回归方程为 (ii)由题设可得 , 当取对称轴即 ,即 时,年利润L有最大值, 故该公司2028年的年利润最大. 规律方法: (1)样本点不一定在经验回归直线上,但点(,)一定在经验回归直线上. (2)求b时,灵活选择公式,注意公式的推导和记忆. 23 / 46 学科网(北京)股份有限公司(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小. (4)区分样本相关系数r与决定系数R2. (5)通过经验回归方程求的都是估计值,而不是真实值. 【考点三】独立性检验 核心梳理: 独立性检验的一般步骤 (1)根据样本数据列2×2列联表. (2)根据公式χ2=,计算χ2的值. (3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H 成立(两类变量相互独立)的概 0 率越小,H 不成立的概率越大. 0 一、解答题 1.(2024·安徽合肥·二模)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表: 参加考试人 性别 平均成绩 标准差 数 男 30 100 16 女 20 90 19 在按比例分配分层随机抽样中,已知总体划分为2层,把第一层样本记为 ,其平均数记为 , 方差记为 ;把第二层样本记为 ,其平均数记为 ,方差记为 ;把总样本数据的平均数 记为 ,方差记为 . (1)证明: ; (2)求该班参加考试学生成绩的平均数和标准差(精确到1); (3)假设全年级学生的考试成绩服从正态分布 ,以该班参加考试学生成绩的平均数和标准差分别作 为 和 的估计值.如果按照 的比例将考试成绩从高分到低分依次划分为 四 个等级,试确定各等级的分数线(精确到1). 附: . 2.(2024·辽宁·模拟预测)土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土 壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分 24 / 46 学科网(北京)股份有限公司解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌途径为主的土壤,氮和能量 转化比较缓慢,有利于有机质存贮和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组 数据,如下表所示: 编号 1 2 3 4 5 6 7 8 细菌 百万个 70 80 90 100 110 120 130 140 真菌 百万 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0 个 其散点图如下,散点大致分布在指数型函数 的图象附近. (1)求 关于 的经验回归方程(系数精确到0.01); (2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体 分布的概率,若该实验小组随机抽查8组数据,再从中任选4组,记真菌 (单位:百万个)与细菌 (单位:百万个)的数值之比位于区间 内的组数为 ,求 的分布列与数学期望. 附:经验回归方程 的斜率和截距的最小二乘估计公式分别为 , 3.(2024·江苏南京·二模)某地5家超市春节期间的广告支出x(万元)与销售额y(万元)的数据如下: 超市 A B C D E 广告支出x 2 4 5 6 8 销售额y 30 40 60 60 70 (1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X,求随机变量 25 / 46 学科网(北京)股份有限公司X的分布列及期望 ; (2)利用最小二乘法求y关于x的线性回归方程,并预测广告支出为10万元时的销售额. 附:线性回归方程 中斜率和截距的最小二乘估计公式分别为: , . 4.(2024·黑龙江哈尔滨·一模)入冬以来,东北成为全国旅游和网络话题的“顶流”.南方的小土豆们纷 纷北上体验东北最美的冬天,这个冬天火的不只是东北的美食、东北人的热情,还有东北的洗浴中心,拥 挤程度堪比春运,南方游客直接拉着行李箱进入.东北某城市洗浴中心花式宠“且”,为给顾客更好的体 验,推出了 和 两个套餐服务,顾客可自由选择 和 两个套餐之一,并在App平台上推出了优惠券活 动,下表是该洗浴中心在App平台10天销售优惠券情况. 日期 1 2 3 4 5 6 7 8 9 10 销售量 (千 1.9 1.98 2.2 2.36 2.43 2.59 2.68 2.76 2.7 0.4 张) 经计算可得: , , . (1)因为优惠券购买火爆,App平台在第10天时系统出现异常,导致当天顾客购买优惠券数量大幅减少,现 剔除第10天数据,求 关于 的经验回归方程(结果中的数值用分数表示); (2)若购买优惠券的顾客选择 套餐的概率为 ,选择 套餐的概率为 ,并且 套餐可以用一张优惠券, 套餐可以用两张优惠券,记App平台累计销售优惠券为 张的概率为 ,求 ; (3)记(2)中所得概率 的值构成数列 . ①求 的最值; ②数列收敛的定义:已知数列 ,若对于任意给定的正数 ,总存在正整数 ,使得当 时, ,( 是一个确定的实数),则称数列 收敛于 .根据数列收敛的定义证明数列 收敛. 26 / 46 学科网(北京)股份有限公司参考公式: , . 参考答案: 1.(1)证明见解析; (2)平均数为96分,标准差为18分; (3)将 定为 等级, 定为 等级, 定为 等级, 定为 等级. 【分析】(1)利用平均数及方差公式即可求解; (2)利用平均数及方差公式,结合标准差公式即可求解; (3)根据(2)的结论及正态分布的特点即可求解. 【详解】(1) , 同理 . 所以 . (2)将该班参加考试学生成绩的平均数记为 ,方差记为 , 则 , 所以 又 ,所以 . 即该班参加考试学生成绩的平均数为96分,标准差约为18分. 27 / 46 学科网(北京)股份有限公司(3)由(2)知 ,所以全年级学生的考试成绩 服从正态分布 , 所以 . . 故可将 定为 等级, 定为 等级, 定为 等级, 定为 等级. 2.(1) (2)分布列见解析,2 【分析】(1)令 ,将指数型回归方程转化为线性回归方程,利用最小二乘法的估 计系数公式,即可求得答案; (2)确定真菌 与细菌 的数值之比位于区间 内的组数,即可确定X的取值,求出每个值对应 的概率,即可得分布列,即可求得数学期望. 【详解】(1)由于 ,故 , 令 ,则 , , 则 , , 故 ,则 关于 的经验回归方程为 ; (2)由已知图表可知从第1组到第8组的真菌 (单位:百万个)与细菌 (单位:百万个)的数值之比 依次为: , , 故样本中比值位于 内的组数有4组,则X的可能取值为: , 28 / 46 学科网(北京)股份有限公司则 , , 故X的分布列为: X 0 1 2 3 4 P 则 . 3.(1)X的分布列见解析,期望 (2) ;预测广告费支出10万元时的销售额为87万元. 【分析】(1)根据超几何分布的概率公式求解分布列,进而可求解期望, (2)利用最小二乘法求解线性回归方程即可. 【详解】(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市有C,D, E这3家超市, 则随机变量 的可能取值为1,2,3 , , , 的分布列为: 1 2 3 数学期望 . (2) , , 29 / 46 学科网(北京)股份有限公司, . 关于 的线性回归方程为 ; 在 中,取 ,得 . 预测广告费支出10万元时的销售额为87万元. 4.(1) (2) (3)①最大值为 ,最小值为 ;②证明见解析 【分析】(1)利用最小二乘法,结合数据分析与公式的变换即可得解; (2)利用全概率公式得到 ,再两次利用构造法依次求得 是常数列, 是等比数列,从而得解; (3)①结合(2)中结论,分类讨论 为偶数与 为奇数,结合数列的单调性即可得解;②理解数列收敛 的定义,取 ,从而得证. 【详解】(1)剔除第10天数据的 , , , , 30 / 46 学科网(北京)股份有限公司所以 , 故 ,所以 . (2)由题意可知 , 其中 , 所以 , 又 , 所以 是首项为 的常数列,故 , 所以 ,又 , 所以 是以首项为 ,公比为 的等比数列, 故 ,即 . (3)①当 为偶数时, 单调递减,最大值为 ; 当 为奇数时, 单调递增,最小值为 ; 综上:数列 的最大值为 ,最小值为 . ②证明:对任意 总存在正整数 ,(其中 表示取整函数), 当 时, , 31 / 46 学科网(北京)股份有限公司所以数列 收敛. 【点睛】思路点睛:本题第2小问求 的常见思路是,利用独立事件的概率公式、条件概率公式或全概率 公式等得到关于 的递推式,再利用数列的构造法即可得解. 规律方法: (1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性. (2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01. 专题精练 一、单选题 1.(2024·全国·模拟预测)某机构统计了中国2018—2022年全部工业增加值(单位:万亿元)及增长率数 据如图所示,则下列结论错误的是( ) A.2018—2022年中国的全部工业增加值逐年增加 B.2018—2022年中国全部工业增加值的增长率的极差为 C.与上一年相比,2022年中国增加的全部工业增加值是2019年增加的全部工业增加值的2倍 D.2018年中国全部工业增加值的增长率比2018—2022年中国全部工业增加值的增长率的最小值高 2.(2024·四川遂宁·三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄 分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( ) 32 / 46 学科网(北京)股份有限公司A.快递行业从业人员中,“90后”占一半以上 B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20% C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多 D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多 3.(2024·陕西西安·模拟预测)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名 学生进行中国传统文化知识考试,并将这100名学生成绩整理得到如下频率分布直方图.根据此频率分布 直方图(分成[40,50),[50,60),[60,70), ,[80,90),[90,100]六组),下列结论中不正确的是 ( ) A.图中的 B.若从成绩在 ,[80,90),[90,100]内的学生中采用分层抽样抽取10名学生,则成绩在[80,90) 内的有3人 C.这100名学生成绩的中位数约为65 D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.2 4.(23-24高三上·湖北·期末)有一组样本数据:5,6,6,6,7,7,8,8,9,9.则关于该组数据的下列 数字特征中,数值最大的为( ) A.平均数 B.第50百分位数 C.极差 D.众数 5.(2024·湖南·模拟预测)已知由小到大排列的 个数据 、 、 、 ,若这 个数据的极差是它们中位 33 / 46 学科网(北京)股份有限公司数的 倍,则这 个数据的第 百分位数是( ) A. B.6 C. D.4 6.(2024·浙江·二模)为了解某中学学生假期中每天自主学习的时间,采用样本量比例分配的分层随机抽 样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习 时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计 该校学生每天学习时间的方差为( ) A.1.4 B.1.45 C.1.5 D.1.55 7.(23-24高三下·山东·开学考试)为研究某池塘中水生植物的覆盖水塘面积 (单位: )与水生植物 的株数 (单位:株)之间的相关关系,收集了4组数据,用模型 去拟合 与 的关系,设 与 的数据如表格所示:得到 与 的线性回归方程 ,则 ( ) 3 4 6 7 2 2.5 4.5 7 A.-2 B.-1 C. D. 8.(21-22高二下·山东滨州·期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否 有关联进行了一次调查,其中被调查的男生、女生人数均为 人,男生中喜欢短视频的人数占男 生人数的 ,女生中喜欢短视频的人数占女生人数的 .零假设为 :喜欢短视频和性别相互独立.若依据 的独立性检验认为喜欢短视频和性别不独立,则 的最小值为( ) 附: ,附表: 0.05 0.01 3.841 6.635 A.7 B.8 C.9 D.10 二、多选题 34 / 46 学科网(北京)股份有限公司9.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11 天复工复产指数折线图,下列说法正确的是 A.这11天复工指数和复产指数均逐日增加; B.这11天期间,复产指数增量大于复工指数的增量; C.第3天至第11天复工复产指数均超过80%; D.第9天至第11天复产指数增量大于复工指数的增量; 10.(2024·安徽·三模)下列关于概率统计的说法中正确的是( ) A.某人在10次答题中,答对题数为 ,则答对7题的概率最大 B.设随机变量 服从正态分布 ,若 ,则 C.已知回归直线方程为 ,若样本中心为 ,则 D.两个变量 的相关系数为 ,则 越小, 与 之间的相关性越弱 11.(2024·湖北·一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽 样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( ) 数学兴趣 性别 合计 感兴趣 不感兴趣 女生 35 / 46 学科网(北京)股份有限公司男生 合计 100 参考数据:本题中 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 A.表中 B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多 C.根据小概率值 的 独立性检验,可以认为性别与对数学的兴趣有差异 D.根据小概率值 的 独立性检验,可以认为性别与对数学的兴趣没有差异 三、填空题 12.(2023·全国·模拟预测)某农业科研所在5块面积相同的长方形试验田中均种植了同-一种农作物,每 一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系: 施肥量x/kg 20 40 50 60 80 产量y/kg 600 800 1200 1000 1400 已知y与x满足线性回归方程 ,则当施肥量为80kg时,残差为 . 13.(2024·全国·模拟预测)记样本数据10,18,8,4,16,24,6,8,32的中位数为a,平均数为b,则 = . 14.(2024·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重 (单位:克)与脉搏率 (单位:心跳次数/分钟)的对应数据 ,根据生物学常识和散点图得出 与 近似满足 ( 为参数).令 , ,计算得 , , .由最小二乘法得经验回 归方程为 ,则 的值为 ;为判断拟合效果,通过经验回归方程求得预测值 36 / 46 学科网(北京)股份有限公司,若残差平方和 ,则决定系数 .(参考公式:决定系数 ) 四、解答题 15.(2024·浙江温州·二模)红旗淀粉厂2024年之前只生产食品淀粉,下表为年投入资金 (万元)与年 收益 (万元)的8组数据: 10 20 30 40 50 60 70 80 12.8 16.5 19 20.9 21.5 21.9 23 25.4 (1)用 模拟生产食品淀粉年收益 与年投入资金 的关系,求出回归方程; (2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的 .2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元) 附:①回归直线 中斜率和截距的最小二乘估计公式分别为: , ② 161 29 20400 109 603 ③ 16.(23-24高三下·全国·开学考试)2023年11月,世界首届人工智能峰会在英国举行,我国因为在该领 域取得的巨大成就受邀进行大会发言.为了研究不同性别的学生对人工智能的了解情况,我市某著名高中进 行了一次抽样调查,分别抽取男、女生各50人作为样本.设事件 “了解人工智能”, “学生为男 生”,据统计 . 37 / 46 学科网(北京)股份有限公司(1)根据已知条件,填写下列 列联表,是否有 把握推断该校学生对人工智能的了解情况与性别有关? 了解人工智 不了解人工智能 合计 能 男生 女生 合计 (2)①现从所抽取的女生中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送科普材料,求 选取的3人中至少有2人了解人工智能的概率; ②将频率视为概率,从我市所有参与调查的学生中随机抽取20人科普材料,记其中了解人工智能的人数为 X,求随机变量 的数学期望和方差. 参考公式: .常用的小概率值和对应的临界值如下表: 0.150 0.100 0.050 0.025 0.010 0.005 0.001 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考答案: 题号 1 2 3 4 5 6 7 8 9 10 答案 C D C A A B C C CD AC 题号 11 答案 ACD 1.C 【分析】根据统计图表中的数据,结合每个选项,进行逐一分析,即可判断和选择. 【详解】对A:由条形图知,2018—2022年中国的全部工业增加值逐年增加,故A正确; 对B:由折线图知,2018—2022年中国全部工业增加值的增长率的极差为 ,故B正确; 对C:由条形图知,与上一年相比,2022年中国增加的全部工业增加值为 , 2019年增加的全部工业增加值为 ,不是2倍关系,故C错误; 对D:由条形图知,2018年中国全部工业增加值的增长率为 , 2018—2022年中国全部工业增加值的增长率的最小值为 , ,故D正确. 故选:C. 2.D 【分析】根据两个图,结合选项,即可判断. 38 / 46 学科网(北京)股份有限公司【详解】由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,A正确; 快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为 ,超过 20%, 所以快递行业从业人员中,从事技术岗位的“90”后的人数超过总人数的20%;B正确; 快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为 ,超过“80 前”的人数占总人数的百分比,C正确; 快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人 数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的比未知,D不一定正确. 故选:D 3.C 【分析】根据频率分布直方图的特点逐个进行分析计算即可. 【详解】由 ,得 ,所以A正确; 这100名学生中成绩在 , , 内的频率分别为0.2,0.12,0.08,所以采用分层抽样抽 取的10名学生中成绩在 内的有 人,故B正确; 根据频率分布直方图,可知这100名学生成绩的中位数在 之间,设中位数为 ,则 ,所以 ,故C错误; 根据频率分布直方图的平均数的计算公式,可得 ,D正确. 故选:C 4.A 【分析】分别求出平均数、第50百分位数、极差、众数,即可得到答案 【详解】平均数为 ; ,则第50百分位数为 ; 极差为 ; 众数为 39 / 46 学科网(北京)股份有限公司故平均数最大 故选:A. 5.A 【分析】根据极差和中位数概念得到关于 的方程,再利用百分位数的概念即可. 【详解】由小到大排列的 个数据 、 、 、 ,则 , 这四个数为极差为 ,中位数为 , 因为这 个数据极差是它们中位数的 倍,则 ,解得 , 所以,这四个数由小到大依次为 、 、 、 , 因为 ,故这 个数据的第 百分位数是 . 故选:A. 6.B 【分析】利用分层随机抽样的均值与方差公式即可解决. 【详解】由题意可得,该校学生每天学习时间的均值为 , 该校学生每天学习时间的方差为 . 故选:B 7.C 【分析】根据已知条件,求得 ,进而代入回归方程可求得 ,从而得出 ,联立 ,即可求得本题答案. 【详解】由已知可得, , , 所以,有 ,解得 , 所以, , 由 ,得 , 所以, ,则 . 故选:C. 40 / 46 学科网(北京)股份有限公司8.C 【分析】由已知数据计算 ,根据独立性检验的结论,列不等式求 的取值范围,得最小值. 【详解】根据题意,不妨设 , 于是 , 由于依据 的独立性检验认为喜欢短视频和性别不独立, 根据表格可知 ,解得 ,于是 最小值为 . 故选:C 9.CD 【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大 小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确. 【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指 数减少,第8天到第9天复产指数减少,故A错误; 由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间, 复产指数增量小于复工指数的增量,故B错误; 由图可知,第3天至第11天复工复产指数均超过80%,故C正确; 由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确; 【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数 增量的理解与观测,属中档题. 10.AC 【分析】对于A,可利用不等式法求解;对于B,根据正态分布曲线的对称性即可验算;对于C,将样本中 心坐标代入回归方程即可验算;对于D,由相关系数的意义即可判断. 【详解】对于 ,故 , 令 ,解得 ,故 ,故A正确; 对于 ,故 错误; 41 / 46 学科网(北京)股份有限公司对于 ,回归直线必过样本中心,可得 ,解得 ,故C正确; 对于 ,两个变量 的相关系数为 越小, 与 之间的相关性越弱,故D错误. 故选:AC. 11.ACD 【分析】根据分层抽样的定义及等高条形图的特点即可得出 的列联表中的数据,利用列联表中的数据 计算观测值,再跟临界值进行比较即可求解. 【详解】由题可知,抽取男生人数为 人,女生抽取的人数 人, 由等高条形图知,抽取男生感兴趣的人数为 人,抽取男生不感兴趣的人数为 人, 抽取女生感兴趣的人数为 人,抽取女生不感兴趣的人数为 人, 的列联表如下 数学兴趣 性 合计 别 感兴趣 不感兴趣 女 生 男 生 合 100 计 由此表可知, ,故A正确; 女生不感兴趣的人数约为 人,男生不感兴趣的人数约为 人, 所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B 错误; 零假设为 :性别与对数学的兴趣没有差异 依据小概率值 的独立性检验,有充分证据推断 不成立, 因此可以认为不成立,即可以认为性别与对数学的兴趣有差异;故C正确; 42 / 46 学科网(北京)股份有限公司零假设为 :性别与对数学的兴趣没有差异 依据小概率值 的独立性检验,没有充分证据推断 不成立, 因此可以认为成立,即可以认为性别与对数学的兴趣没有差异;故D正确. 故选:ACD. 12.10 【分析】根据回归直线方程的特点,计算样本中心值,即可求得 ,得回归方程后进行估计可得,当 时,估计值,从而可得残差的数值. 【详解】由题意得 , ,由回归直线过 样本点的中心,所以 ,解得 ,所以 , 则当 时, ,故残差为 . 故答案为:10. 13. 【分析】先将样本数据按从小到大进行排列,再根据样本数据的中位数、平均数概念和公式进行计算即可. 【详解】将样本数据按从小到大的顺序排列,得4,6,8,8,10,16,18,24,32, 所以中位数 , 由平均数的计算公式得 , 所以 . 故答案为: . 14. 【分析】根据回归直线方程 必过样本中心点 求出 ,即可求出 ,再根据决定系数公式求 出 . 43 / 46 学科网(北京)股份有限公司【详解】因为 ,两边取对数可得 , 又 , , 依题意回归直线方程 必过样本中心点 , 所以 ,解得 ,所以 , 又 . 故答案为: ; 15.(1) (2)36.5 【分析】(1)利用回归直线的公式求 和 的值,可得回归方程. (2)建立函数关系,利用导数分析函数单调性,求出函数的最大值. 【详解】(1) ∴回归方程为: (2)2024年设该企业投入食品淀粉生产x万元,预计收益 (万元) , ,得 ∴其在 上递增, 上递减 44 / 46 学科网(北京)股份有限公司16.(1)列联表见解析;没有 (2)① ;② , . 【分析】(1)根据两个条件概率值求出 列联表中的数据,利用卡方公式计算 的值,再与对应的小 概率值比较即得结论; (2)①先利用分层抽样确定所抽取的 名女市民中了解和不了解人工智能的人数,再利用古典概率模型 概率公式计算即得; ②根据 列联表推理得到从我市高中生中任意抽取一人,恰好抽到了解人工智能学生的概率为 ,每次 抽的结果仅有“了解”与“不了解”两种,随机抽取20人,相当于完成20次伯努利试验,故利用二项分 布期望与方差公式即可求得. 【详解】(1)因为 , 所以了解人工智能的女生为 ,了解人工智能的总人数为 , 则了解人工智能的男生有 人, 结合男生和女生各有 人,填写 列联表为: 了解人工智 不了解人工智能 合计 能 男生 40 10 50 女生 30 20 50 合计 70 30 100 因 , 故没有 把握推断该校学生对人工智能的了解情况与性别有关. (2)①由题意可知,所抽取的 名女市民中,了解人工智能的有 人, 不了解人工智能的有 人, 45 / 46 学科网(北京)股份有限公司所以,选取的 人中至少有 人了解人工智能的概率为 ; ②由 列联表可知,抽到了解人工智能的学生的频率为 , 将频率视为概率,所以,从我市高中生中任意抽取一人,恰好抽到了解人工智能学生的概率为 , 由题意可知, ,所以, , . 46 / 46 学科网(北京)股份有限公司