当前位置:首页>文档>专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例

专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例

  • 2026-04-10 04:16:15 2026-04-10 04:02:33

文档预览

专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例
专题10.2统计案例(解析版)_02高考数学_新高考复习资料_2024年新高考资料_一轮复习资料_完备战2024年新高考数学一轮复习题型突破精练(新高考)_专题10.2统计案例

文档信息

文档格式
docx
文档大小
2.854 MB
文档页数
48 页
上传时间
2026-04-10 04:02:33

文档内容

专题 10.2 统计案例 题型一 相关关系与相关系数 题型二 回归直线方程与样本中心 题型三 线性回归方程 题型四 非线性回归方程 题型五 误差分析 题型六 独立性检验 题型一 相关关系与相关系数 例1.(2022春·河南省直辖县级单位·高一济源高中校考期末)下列两个变量具有相关关系的是( ) A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间 C.人的身高与视力 D.人的身高与体重 【答案】D 【分析】根据函数关系及相关关系的定义判断即可. 【详解】对于A,由正方形的面积 与边长 的公式知 ,即正方形的边长与面积具有函数关系,故A 错误; 对于B,匀速行驶车辆的行驶距离 与时间 为 ,其中 为匀速行驶的速度, 即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误; 对于C,人的身高与视力无任何关系,故C错误; 对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确. 故选:D. 例2.(2023春·河南濮阳·高二统考期末)某公司对其产品研发的年投资额 (单位:百万元)与其年销售 量 (单位:千件)的数据进行统计,整理后得到如下统计表; 1 2 3 4 5 1.5 2 3.5 8 15 (1)求变量 和 的样本相关系数 (精确到0.01),并推断变量 和 的线性相关程度;(参考;若,则线性相关性程度很强;若 ,则线性相关性程度一般,若 ,则线性相关 性程度很弱.) (2)求年销售量 关于年投资额 的经验回归方程. 参考公式:样本相关系数 ;经验回归方程 中 ;参考数据 【答案】(1) ,变量 和 线性相关性程度很强 (2) 【分析】(1)根据公式求出相关系数约等于 ,从而得到答案; (2)根据公式计算出 , ,得到答案. 【详解】(1)由题意, , 因为 , 所以 因为 ,所以变量 和 线性相关性程度很强. (2) 根据 得, 所以年销售量 关于年投资额 的经验回归方程为 .练习1.(2023春·山东·高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所 对应的成对样本数据呈现出线性相关关系的是( ) A. B. C. D. 【答案】AB 【分析】根据数据点的分布情况直观判断是否有线性相关关系即可. 【详解】A、B中各点都有线性拟合趋势,其中A样本数据正相关,B样本数据负相关; C中各点有非线性拟合趋势,D中各点分布比较分散,它们不具有线性相关. 故选:AB 练习2.(2023秋·高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:① 越接近于1,相关程度越大;② 越接近于0,相关程度越小;③ 越接近于1,相关程度越小;④ 越接近于0,相关程度越大.其中正确的是( ) A.①② B.②④ C.②③ D.①④ 【答案】A 【分析】根据相关系数的性质可得结论. 【详解】由相关系数性质: 越接近于1,成对样本数据的线性相关程度越强, 越接近于0,成对样本数据的线性相关程度越弱, 可知①②正确;故选:A. 练习3.(2023春·江苏常州·高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差 与 本校当天新增感冒人数 (人)的关系,该同学记录了5天的数据: x 5 6 8 9 12 1 2 y 20 28 35 7 5 经过拟合,发现基本符合经验回归方程 ,则下列说法正确的有( ) 参考公式:相关系数公式 A.样本中心点为 B. C.当 时,残差为 D.若去掉样本点 ,则样本的相关系数r增大 【答案】ABC 【分析】根据平均数公式计算可得A正确;由 计算可得B正确;根据残差的定义计算可得C 正确;根据相关系数 的公式分析可得D不正确. 【详解】 , ,所以样本中心点为 ,则A正确; 由 ,得 ,则B正确; 由B知, , 当 时, ,则残差为 ,则C正确; 因为 , , , , 所以 , , , 所以去掉样本点 后,相关系数 的公式中的分子、分母的大小都不变,故相关系数 的大小不变,故D不正确. 故选:ABC 练习4.(2023春·全国·高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营 养成分高,成为大家喜欢的水果之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快 速发展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况 进行调查,得到统计表如下: 201 202 年份t 2019 2020 2022 8 1 年份代码x 1 2 3 4 5 种植面积y/万亩 8 14 15 20 28 附:①样本相关系数 ;② 为经验回归方程, , , . 根据上表,下列结论正确的是( ) A.该地区这5年沃柑的种植面积的方差为212 B.种植面积y与年份代码x的样本相关系数约为0.972(精确到0.001) C.y关于x的经验回归方程为 D.预测该地区沃柑种植面积最早在2027年能突破40万亩 【答案】BC 【分析】根据样本方差、相关系数、回归方程等知识对选项进行分析,从而确定正确答案. 【详解】根据题意,得 , , ,A错误; 由题意得 ,, , 所以 ,B正确; 所以 , . 所以y关于x的经验回归方程为 ,C正确; 令 ,得 ,所以最小的整数为8, , 所以该地区沃柑种植面积最早在2025年能突破40万亩,D错误. 故选:BC 练习5.(2023春·重庆沙坪坝·高三重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生 儿数量如下: 年份编号 1 2 3 4 5 201 年份 2018 2020 2021 2022 9 新生儿数量 (单位:万 146 1523 1200 1062 956 人) 5 (1)由表中数据可以看出,可用线性回归模型拟合新生儿数量 与年份编号 的关系,请用相关系数 说明 相关关系的强弱;( ,则认为 与 线性相关性很强) (2)建立 关于 的回归方程,并预测我国2025年的新生儿数量. 参考公式及数据:n n ∑ x y −nx⋅y ∑ x y −nx⋅y i i i i 5 5 5 √ 5 5 ( )( ) r= i=1 ,b^= i=1 ,a^= y−b^x,∑ y =6206,∑ y =6206, ∑ x y −5x⋅y=−1537, ∑ x2−5x2 ∑ y2−5 y2 ≈1564 n i i i i i i √ ( ∑ n x2−nx2 )( ∑ n y2−n y2 ) ∑ x i 2−nx2 i=1 i=1 i=1 i=1 i=1 i i i=1 i=1 i=1 【答案】(1)答案见解析; (2) ,472.7万人. 【分析】(1)求出相关系数即得解; (2)利用最小二乘法求出 关于 的回归方程,再预测我国2025年的新生儿数量. 【详解】(1) , ,故 与 的线性相关性很强.. 从而可以用线性回归模型拟合 与 的关系. (2) , . 故 , 所以 , 所以 关于 的回归方程为 , 将2025年对应的年份编号 代入回归方程得 所以我国2025年的新生儿数量约为472.7万人. 题型二 回归直线方程与样本中心 例3.(2023春·上海宝山·高二上海市行知中学校考期中)已知x,y的对应值如下表所示:0 2 4 6 8 1 13 若y与x线性相关,且回归直线方程为 ,则 ______. 【答案】1 【分析】根据线性回归方程过样本中心点直接计算即可. 【详解】根据表格可知, , , 因为y与x线性相关,且回归直线方程为 , 所以 ,得 ,解得 . 故答案为:1 例4.(2023春·湖北武汉·高二武钢三中校考阶段练习)已知由样本数据点集合 ,求得 的回归直线方程为 ,且 ,现发现两个数据点 和 误差较大,去除后重新 求得的回归直线 的斜率为 ,则去除后当 时, 的估计值为__________ 【答案】 / 【分析】根据给定条件,求出去除前后的样本中心点,求出新的回归方程即可求解作答. 【详解】将 代入 得 ,即样本中心点为 ,由数据点 和 知: , , 因此去除这两个数据点后,样本中心点不变,设新的回归直线方程为 ,则 , 即新的回归直线方程为 ,当 时, 的估计值为 , 所以 的估计值为 . 故答案为: .练习6.(2023·上海奉贤·校考模拟预测)已知一组成对数据 的回归方程为 ,则该组数据的相关系数 __________(精确到0.001). 【答案】 【分析】一组成对数据的平均值 一定在回归方程上,可求得 ,再利用相关系数 的计算公式算出即 可. 【详解】由条件可得, , , 一定在回归方程 上,代入解得 , , , , , 故答案为: 练习7.(2023春·山东聊城·高三山东聊城一中校联考阶段练习)为研究变量 的相关关系,收集得到如 下数据: 5 6 7 8 9 9 8 6 4 3若由最小二乘法求得 关于 的经验回归方程为 ,则据此计算残差为0的样本点是( ) A. B. C. D. 【答案】C 【分析】先求出回归方程的样本中心点,从而可求得 ,再根据残差的定义可判断. 【详解】由题意可得: , 即样本中心点为 ,可得 ,解得 , 所以 ,可得 5 6 7 8 9 9 8 6 4 3 9.2 7.6 6 4.4 2.8 0 所以残差为0的样本点是 . 故选:C. 练习8.(2023春·江苏连云港·高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示: 第 年 1 2 3 4 5 7 利润 /亿元 2 3 4 5 已知变量 与 之间具有线性相关关系,设用最小二乘法建立的回归直线方程为 ,预测该人工 智能公司第6年的利润约为____亿元. 【答案】7.8/ 【分析】分别求得 , ,又回归直线方程必过样本中心点,可得 ,将 代入即可得出 结果.【详解】依题意 , , 因为回归直线方程为 必过样本中心点 , 即 ,解得 , 则回归直线方程为 , 当 时 ,即该人工智能公司第6年的利润约为7.8亿元. 故答案为:7.8 练习9.(2023春·山东青岛·高三青岛市即墨区第一中学统考期中)某研究性学习小组对春季昼夜温差大 小与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x(℃)与实验室种子浸泡后的发 芽数y(颗)之间的线性回归方程: ,且对应数据如下表: 温差x(℃) 1 2 3 4 5 发芽数y/颗 3 7 8 10 12 如果昼夜温差为13℃时,那么种子的发芽数大约是( ) A.20颗 B.29颗 C.30颗 D.36颗 【答案】B 【分析】根据给定的数表,求出样本的中心点,进而求出 值,再代入计算作答. 【详解】依题意, , 于是 ,解得 ,即线性回归方程为 , 当 时, , 所以昼夜温差为13℃时,那么种子的发芽数大约是29颗. 故选:B 练习10.(2023春·江苏淮安·高三淮阴中学校联考阶段练习)用模型 拟合一组数据组 ,其中 .设 ,变换后的线性回归方程为 ,则 _________.【答案】 【分析】根据回归直线方程,必过样本点中心 ,再利用换元公式,以及对数运算公式,化简求值. 【详解】因为线性回归方程为 恒过 , 因为 ,所以 , , 即 , 所以 ,即 . 故答案为: 题型三 线性回归方程 例5.(2023春·重庆北碚·高三重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中 学教育质量不断提高,某知名机构对近年来升入北京航天航空大学兼善学子人数作了如下统计 202 年份 2018 2019 2021 2022 0 时间代号 人数 (人) 附:回归方程 中, . (1)求 关于t的回归方程 ; (2)用所求回归方程预测兼善中学2023年(t=6)升入北航的人数 【答案】(1) (2)11人. 【分析】(1)求线性回归方程,先求出 ,再根据公式求出 , 即可. (2)将 代入回归方程即可. 【详解】(1)这里又 从而 1.2, . 故所求回归方程为 . (2)将 代入回归方程 (人).故升入北航11人. 例6.(2023春·陕西延安·高二陕西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中 随机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图: 根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于重 感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数 据后,对剩下的数据作处理,得到一些统计的值: , , , , ,其中 , 分别表示这50名考生的数学成绩、物理成绩, , 2,…,50,y与x的相关系数 . (1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为r.试判断r 与r 0 0 的大小关系(不必说明理由); (2)求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的 数学成绩为125分),物理成绩是多少?(精确到0.1) 附:线性回归方程中 中: , . 【答案】(1) ,理由见解析 (2) ; 分,【分析】(1)根据已知条件,结合数据的散点图,即可求解; (2)根据已知条件,结合最小二乘法求得回归直线方程,再将 代入,即可求解. 【详解】(1)解: . 理由如下: 由图可知,变量 与 正相关关系, ①异常点 会降低变量之间的线性相关程度; ②52个数据点与其回归直线的总偏差更大,回归效果更差,所以相关系数更小; ③50个数据点与其回归直线的总偏差更小,回归效果更好,所以相关系数更大; ④50个数据点更贴近其回归直线 ; ⑤52个数据点与其回归直线更离散. (2)解:由题设中的数据,可得 , 所以 , 所以 ,则 , 所以回归直线方程为 , 将 代入回归直线方程,可得 , 所以估计 考试的物理成绩为 分. 练习11.(2023·安徽亳州·蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单位:公顷) 和野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到 样本数据 ( ),部分数据如下: x … 2.7 3.6 3.2 3.9 … y … 50.6 63.7 52.1 54.3 …经计算得: , , , . (1)利用最小二乘估计建立y关于x的线性回归方程; (2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系 下, 横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分别为 , , 比较 , 的大小关系,并证明. 附:y关于x的回归方程 中,斜率和截距的最小二乘估计公式分别为: , , 【答案】(1) (2) ,证明见解析 【分析】(1)根据最小二乘法计算公式求解; (2)根据相关系数 证明. 【详解】(1) , , , , 故回归方程为 ; (2)x关于y的线性回归方程为 ,, , 则 ,r为y与x的相关系数, 又 , , ,故 ,即 , 下证: , 若 ,则 ,即 恒成立, 代入表格中的一组数据得: ,矛盾, 故 . 综上,y关于x的回归方程为 . 练习12.(2023春·陕西宝鸡·高三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量 (百千克)与某种液体肥料每亩使用量 (千克)之间的对应数据的散点图,如图所示. (1)依据数据的散点图可以看出,可用线性回归模型拟合 与 的关系,请计算相关系数 并加以说明(若 ,则线性相关程度很高,可用线性回归模型拟合); (2)求 关于 的回归方程,并预测液体肥料每亩使用量为 千克时,西红柿亩产量的增加量约为多少?附: 相关系数公式 ,回归方程 中斜率和截距的最小二乘估计公式分别为: , . 【答案】(1)答案见解析; (2) ,9.9百千克. 【分析】(1)利用给定的图象,求出相关系数公式中的相关量,再代入公式计算并判断作答. (2)利用(1)中信息,结合最小二乘法公式求出回归直线方程,再估计作答. 【详解】(1)因为 , , , , , 因此相关系数 , 所以可用线性回归模型拟合 与 的关系. (2)由(1)知, , , 因此 ,当 时, , 所以预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克. 练习13.(2023春·贵州黔东南·高三校考阶段练习)随着农村电子商务体系和快递物流配送体系加快贯通, 以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国 农村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为1~6. 年份代码 1 2 3 4 5 6 农村网络零售额 12.5 13.7 17.1 18.0 20.5 23.02 (1)根据2017-2021年的数据求农村网络零售额规模关于年度代码 的线性回归方程 ( , 的值精确到0.01); (2)若由回归方程得到的估计数据与剩下的检验数据的误差不超过1千亿,则认为得到的回归方程是“理想 的”,试判断(1)中所得回归方程是否是“理想的”. 参考公式: , . 参考数据: , . 【答案】(1) (2)回归方程是“理想的”. 【分析】(1)根据题设中的公式可求线性回归方程. (2)根据(1)的结果可计算估计数据与剩下的检验数据的误差,从而可判断回归方程是否是“理想”. 【详解】(1) , , 故 , 故 , 故 . (2)当 ,由 可得对应的估计数据为 , 此时 , 故回归方程是“理想的”. 练习14.(2023春·广东广州·高三广州市真光中学校考阶段练习)某乡政府为提高当地农民收入,指导农 民种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发 展生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并 计算得到 , , , , ,, ,其中 . (1)根据折线图判断, 与 哪一个适宜作为平均收入y关于年份代码x的回归方程类型? 并说明理由; (2)根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2023年该农户种植药材的平均收入. 附:相关系数 ,回归直线的斜率和截距的最小二乘法估计公式分别为: , , . 【答案】(1) ;理由见解析 (2) ;87.39千元 【分析】(1)由相关系数的计算即可由大小作出判断, (2)根据最小二乘法即可求解方程,代入即可求值. 【详解】(1)因为 , .对于模型 ,相关系数 , 对于模型 ,相关系数 因为 , 所以 适宜作为平均收入y关于年份代码x的回归方程. (2)由(1)可知回归方程类型为 , 由已知数据及公式可得 , . 所以y关于x的回归方程为 , 又年份代码1-7分别对应年份2016-2022,所以2023年对应年份代码为8, 代入可得 千元, 所以预测2023年该农户种植药材的平均收入为87.39千元. 练习15.(2023春·安徽阜阳·高三安徽省临泉第一中学校考阶段练习)某城市的公交公司为了方便市民出 行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x与乘客 等候人数y之间的关系,经过调查得到如下数据: 1 间隔时间(x分钟) 6 8 10 14 2 1 2 等候人数(y人) 18 20 23 5 4 (1)易知可用线性回归模型拟合y与x的关系,请用相关系数加以说明; (2)建立y关于x的回归直线方程,并预测车辆发车间隔时间为20分钟时乘客的等候人数. 附:回归直线 的斜率和截距的最小二乘估计分别为 ,;相关系数 ; . 【答案】(1)答案见解析 (2) ,31人. 【分析】(1)根据相关系数的公式,分别计算数据求解即可; (2)根据回归直线方程的参数计算公式可得 关于 的回归直线方程为 ,再代入 求解即 可. 【详解】(1)由题意,知 , , , , 所以 .又 ,则 . 因为 与 的相关系数近似为0.95,说明 与 的线性相关非常高, 所以可以用线性回归模型拟合 与 的关系. (2)由(1)可得, , 则 , 所以 关于 的回归直线方程为 , 当 时, , 所以预测车辆发车间隔时间为20分钟时乘客的等候人数为31人. 题型四 非线性回归方程 例7.(2023·陕西·西北工业大学附属中学校联考模拟预测)为了反映城市的人口数量x与就业压力指数y之间的变量关系,研究人员选择使用非线性回归模型 对所测数据进行拟合,并设 ,得 到的数据如表所示,则 _________. x 4 6 8 10 z 2 c 5 6 【答案】3 【分析】由非线性回归模型 和 ,得回归直线方程 ,代入样本点中心即可求 值. 【详解】 , , 依题意, , 而回归直线方程 过点 ,故 ,解得 . 故答案为:3 例8.(2023·江苏镇江·江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数 与温度 有关,现将 收集到的温度 和产卵数 的10组观测数据作了初步处理,得到如图的散点图及一些统计 量表. 360 表中(1)根据散点图判断, 与 哪一个适宜作为 与 之间的回归方程模型并求出 关于 回归方程;(给出判断即可,不必说明理由) (2)某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中共有8个鱼卵, 其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布 列及数学期望. 附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为 . 【答案】(1) 适宜, (2)分布列见解析, . 【分析】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,所以 适宜作为 与 之 间的回归方程模型;令 ,转化线性回归方程求解,进而得 关于 回归方程; (2)由题意, 的取值为 ,由全概率公式求得对应的概率,从而可求分布列及数学期望. 【详解】(1)根据散点图判断,看出样本点分布在一条指数函数的周围, 所以 适宜作为 与 之间的回归方程模型;令 ,则 , , 关于 的回归方程为 . (2)由题意,设随机挑选一批,取出两个鱼卵,其中“死卵”个数为 ,则 的取值为 , 设 “所取两个鱼卵来自第 批” ,所以 , 设 “所取两个鱼卵有 个”“死卵” , 由全概率公式 , , , 所以取出“死卵”个数的分布列为: 0 1 2 . 所以取出“死卵”个数的数学期望 . 练习16.(2023春·辽宁·高三辽宁实验中学校考阶段练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费 和年销售量 数据作了初步处理,得到下面的散点图.根据散点图判断,下面四个回归模型中,最适合 的是( ) A.y=bx+a B. C. D. 【答案】C 【分析】根据样本点分布的分布情况和函数的图象特征判断. 【详解】解:由散点图看出,样本点分布在开口向右的抛物线(上支)附近, 整体趋势递增,单位增长率逐渐变小, 所以函数 较适宜, 故选:C 练习17.(2023·全国·高二专题练习)规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次 有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为 成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后 接着进行下一轮抽球,如此不断继续下去,直至成功. (1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数 为随机变量 ,求 的分布列和数学期望; (2)为验证抽球试验成功的概率不超过 ,有1000名数学爱好者独立的进行该抽球试验,记 表示成功时抽 球试验的轮次数, 表示对应的人数,部分统计数据如下: 1 2 3 4 56 232 98 40 20 0 求 关于 的回归方程 ,并预测成功的总人数(精确到1); 【答案】(1)分布列见解析, (2) ,465 【分析】(1)由条件确定 的取值,再求取各值的概率,由此可得分布列,再由期望公式求期望; (2)令 ,则 ,利用最小二乘法结论求 ,由此可得回归方程,再利用回归方程预测成功 的总人数. 【详解】(1)由题知, 的取值可能为1,2,3, 所以 ; ; 所以 的分布列为: 1 2 3 所以数学期望为 (2)令 , , , 则 , 由题知:, , ,所以 , 所以 , , 故所求的回归方程为: , 所以,估计 时, ; 估计 时, ; 估计 时, ; 预测成功的总人数为 . 练习18.(2023·河北·统考模拟预测)为了研究某种细菌随天数 变化的繁殖个数 ,设 ,收集数 据如下: 天数 1 2 3 4 5 6 2 9 繁殖个数 6 12 49 190 5 5 表(Ⅰ) 3.50 62.83 3.53 17.50 596.57 12.08 表(Ⅱ) (1)根据表(Ⅰ)在图中作出繁殖个数 关于天数 变化的散点图,并由散点图判断 ( , 为常 数)与 ( , 为常数,且 , )哪一个适宜作为繁殖个数 关于天数 变化的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)中的判断结果和表(Ⅱ)中的数据,建立 关于 的经验回归方程(结果保留2位小数). 附:对于一组数据 , ,…, ,其经验回归直线 的斜率和截距的最小二乘法 估计分别为 , . 【答案】(1)散点图见解析; 适宜. (2) 【分析】(1)由已知数据即可作出散点图,据此可判断出结论; (2)由最小二乘法计算 和 ,可得 ,即可求得答案. 【详解】(1)由题意作出散点图如图: 由散点图可知,样本点是沿指数型曲线分布,不是分布在某直线附近, 故 ( , 为常数,且 , )适宜作为繁殖个数 关于天数 变化的回归方程类型. (2)由题意知 ,故 , 则 , , 则 ,故 .练习19.(2023春·山东聊城·高三山东聊城一中校联考阶段练习)今年刚过去的4月份是“全国消费促进 月”,各地拼起了特色经济”,带动消费复苏、市场回暖.“小饼烤炉加蘸料,灵魂烧烤三件套”,最近, 淄博烧烤在社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营业额也在近 一个月内实现了成倍增长.因此某烧烤店老板考虑投入更多的人工成本,现有以往的服务人员增量x(单位: 人)与年收益增量y单位:万元)的数据如下: 服务人员增量x/人 2 3 4 6 8 10 13 年收益增量y/万元 13 22 31 42 50 56 58 据此,建立了y与x的两个回归模型: 模型①:由最小二乘公式可求得 与 的一元线性经验回归方程为 ; 模型②:由散点图(如图)的样本点分布,可以认为样本点集中在曲线 的附近. 对数据进行初步处理后,得到了一些统计的量的值: , , , , 其中 , (1)根据所给的统计量,求模型②中 关于 的经验回归方程(精确到0.1); (2)根据下列表格中的数据,比较两种模型的决定系数 ,并选择拟合精度更高的模型,预测服务人员增 加25人时的年收益增量. 回归模型 模型① 模型② 回归方程 182.4 79.2附:样本 的最小二乘估计公式为 , ,刻画样 本回归效果的决定系数 【答案】(1) =21.3 -14.4 (2)模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好,92.1万元. 【分析】(1)令 ,则 ,然后根据表中的数据和公式可求出模型②中y关于x的经验回归方 程; (2)由表中的数据和样本回归效果的决定系数可判断回归模型②刻画的拟合效果更好,再根据模型②的 回归方程可预测服务人员增加25人时的年收益增量. 【详解】(1)令 ,则 . 由参考数据得 = =38.9-21.32×2.5≈-14.4, 所以,模型②中y关于x的经验回归方程为 =21.3 -14.4. (2)由表格中的数据,有182.4>79.2,即 , 模型①的 小于模型②,说明回归模型②刻画的拟合效果更好 当x=25时,模型②的收益增量的预测值为 =21.3× -14.4=21.3×5-14.4=92.1(万元). 所以预测服务人员增加25人时的年收益增量为92.1万元. 练习20.(2023·全国·二三专题练习)党的二十大报告提出,从现在起,中国共产党的中心任务就是团结 带领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴.高质量发展是全面建设社会主义现代化国家的首要任务.加快实现高水平科技自立自强, 才能为高质量发展注入强大动能.某科技公司积极响应,加大高科技研发投入,现对近十年来高科技研发投 入情况分析调研,其研发投入y(单位:亿元)的统计图如图1所示,其中年份代码x=1,2,…,10分别 指2013年,2014年,…,2022年. 现用两种模型① ,② 分别进行拟合,由此得到相应的回归方程,并进行残差分析, 得到图2所示的残差图.结合数据,计算得到如下值: 7 2.25 82.5 4.5 120 28.67 5 表中 . (1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)根据(1)中所选模型,求出y关于x的回归方程;根据所选模型,求该公司2028年高科技研发投入y 的预报值.(回归系数精确到0.01) 附:对于一组数据 其回归直线 的斜率和截距的最小二乘估计分别为 . 【答案】(1)选择模型②,利用见解析 (2) , . 【分析】(1)根据残差点的分布可得出结论;(2)令 ,可得出 ,利用参考数据可求出 、 的值,可得出 关于 的回归方程,然后将 代入回归方程,可得出该公司 年高科投研发投入 的预报值. 【详解】(1)应该选择模型②,理由如下: 由于模型②残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型①带状宽度窄, 所以模型②的拟合精度更高,回归方程的预报精度相应就会越高,故选模型②比较合适. (2)根据模型②,令 ,研发投入 与 可用线性回归来拟合,有 . 则 ,所以 , 则 关于 的线性回归方程为 , 所以 关于 的回归方程为 , 年,即 时, (亿元), 所以该公司 年高科技研发投入 的预报值为 (亿元). 题型五 误差分析 例9.(2023春·河南濮阳·高三统考期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起, 第 天的高度为 ,测得一些数据如下表所示 第 天 1 2 3 4 5 6 7 1 高度 1 4 6 9 11 13 2 由表格数据可得到 关于 的经验回归方程为 ,则第6天的残差为( ) A. B.2.12 C. D.0.08 【答案】A 【分析】根据样本中心得回归直线方程,由残差的计算即可求解. 【详解】 根据线性经验回归方程过样本中心 ,故有 ,则有 ,此时 ,当 时, ,残差 , 故选:A. 例10.(2023春·浙江·高二统考阶段练习)(多选)某兴趣小组研究光照时长 和向日葵种子发芽数量 颗 之间的关系,采集5组数据,作如图所示的散点图.若去掉 后,下列说法正确的是( ) A.相关系数 的绝对值变小 B.决定系数 变大 C.残差平方和变大 D.解释变量 与响应变量 的相关性变强 【答案】BD 【分析】由图可知: 较其他的点偏离直线最大,所以去掉 后,回归效果更好.结合相关系 数、决定系数、残差平方和以及相关性逐项分析判断. 【详解】由图可知: 较其他的点偏离直线最大,所以去掉 后,回归效果更好. 对于选项A:相关系数 越接近于1,线性相关性越强,所以去掉 后,相关系数 的绝对值变大, 故A错误; 对于选项B:决定系数 越接近于1,拟合效果越好,所以去掉 后,决定系数 变大,故B正确; 对于选项C:残差平方和变大,拟合效果越差,所以去掉 后,残差平方和变小,故C错误 对于选项D:由选项A可知:去掉 后,相关系数 的绝对值变大,所以解释变量 与响应变量 的 相关性变强,故D正确; 故选:BD.练习21.(2023春·河南新乡·高三统考阶段练习)两个变量 与 的回归模型中,分别选择了4个不同的 模型,其中拟合效果最好的模型是( ) A.模型1的决定系数 B.模型2的决定系数 C.模型3的决定系数 D.模型4的决定系数 【答案】D 【分析】根据决定系数 的意义即可解答. 【详解】决定系数 越大(接近1),模型的拟合效果越好;决定系数 越小,模型的拟合效果越差.模 型4的决定系数最大、最接近1,其拟合效果最好. 故选:D. 练习22.(2023·河南南阳·南阳中学校考模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售 土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数 (其中 10场为一个周期)与产品销售额 (千元)的数据统计如下: 直播周期数 1 2 3 4 5 产品销售额 (千 3 7 15 30 40 元) 根据数据特点,甲认为样本点分布在指数型曲线 的周围,据此他对数据进行了一些初步处理.如 下表: 55 382 65 978 101 其中 , (1)请根据表中数据,建立 关于 的回归方程(系数精确到 ); (2)①乙认为样本点分布在直线 的周围,并计算得回归方程为 ,以及该回归模型的相关指数 ,试比较甲、乙两人所建立的模型,谁的拟合效果更好? (3)由①所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案 精确到1) 附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为 , ,相关指数: . 【答案】(1) (2)乙建立的回归模型拟合效果更好 (3)10 【分析】(1)取对数,把非线性方程转化为线性方程,利用公式求解系数可得答案; (2)根据公式求解相关指数,比较两个方程的相关指数的大小可得结论; (3)利用乙的方程进行预测,求解不等式可得结果. 【详解】(1)将 两边取对数得 ,令 ,则 ; ∵ ,∴根据最小二乘估计可知, ; ∴ , ∴回归方程为 , 即 . (2)①甲建立的回归模型的 . ∴乙建立的回归模型拟合效果更好. (3)由①知,乙建立的回归模型拟合效果更好.设 ,解得 ,∴直播周期数至少为10. 练习23.(2023·高二课时练习)已知x、y的取值如下表: x 1 2 3 4 7 y 32 48 88 2 根据表中的数据求得y关于x的回归直线方程为 ,则这组数据相对于所求的回归直线方程的 4个残差的方差为______. 【答案】 【分析】先求出估计值,然后求出残差,求出残差的平均数, 最后利用方差的计算公式求解即可 【详解】将 代入回归直线方程可得 的值分别为: , 所以残差分别为: 残差的平均数为: , 所以该组数据相对于所求的回归直线方程的4个残差的方差为: , 故答案为:3.2. 练习24.(2023·四川成都·四川省成都市玉林中学校考模拟预测)如图是某企业2016年至2022年的污水 净化量(单位:吨)的折线图. 注:年份代码1~7分别对应年份2016~2022.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请建立y关于t的回归方程,并预测2025年该企 业的污水净化量; (2)请用相关指数说明回归方程预报的效果. 参考数据: ; 参考公式:线性回归方程 ; 相关指数: 【答案】(1) ,58.5吨 (2)答案见解析 【分析】(1)结合题目数据利用最小二乘法求出线性回归直线方程,代入计算即可; (2)利用已知数据求出相关指数,利用统计知识说明即可. 【详解】(1)由折线图中的数据得 , , , 所以 , 所以y关于t的线性回归方程为 , 将2025年对应的t=10代入得 , 所以预测2025年该企业污水净化量约为58.5吨. (2)因为 , 所以“污水净化量的差异”有87.5%是由年份引起的,说明回归方程预报的效果是良好的.练习25.(2023·全国·高三专题练习)某种产品的广告支出费用 (单位:万元)与销售量 (单位:万 件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程 , ,以下说法 正确的是( ) 广告支出费用 2.2 2.6 4.0 5.3 5.9 销售量 3.8 5.4 7.0 11.6 122 A.销售量 的多少有96%是由广告支出费用引起的 B.销售量 的多少有4%是由广告支出费用引起的 C.第三个样本点对应的残差 ,回归模型的拟合效果一般 D.第三个样本点对应的残差 ,回归模型的拟合效果较好 【答案】A 【分析】根据已知条件结合残差和相关系数的定义可得答案. 【详解】因为 表示解释变量对于预报变量的贡献率, ,所以销售量 的多少有96%由广告支 出费用引起的,故A正确,B错误; 当 时,第三个样本点对应的残差为 ,又 , 故拟合效果较好,故CD错误. 故选:A. 题型六 独立性检验 例11.(2023·全国·模拟预测)2023上海蒸蒸日上迎新跑于2023年2月19日举办,该赛事设有21.6公里 竞速跑、5.4公里欢乐跑两个项目.某马拉松兴趣小组为庆祝该赛事,举行一场小组内有关于马拉松知识 的有奖比赛,一共有25人报名(包括20位新成员和5位老成员),其中20位新成员的得分情况如下表所 示(满分30分): 得分 人数 2 3 4 6 4 1 得分在20分以上(含20分)的成员获得奖品一份.(1)请根据上述表格中的统计数据,将下面的 列联表补充完全,并通过计算判断在20位新成员中,是 否有 的把握认为“获奖”与性别有关? 没获奖 获奖 合计 男 4 女 7 8 合计 (2)若5名老成员的性别相同并全部获奖,且进行计算发现在所有参赛人员中,有 的把握认为“获奖” 与性别有关.请判断这5名老成员的性别? 附:参考公式: . 临界值表: 0.100 0.050 0.010 0.001 2.706 3.841 6.635 10.828 【答案】(1)列联表见解析,没有 的把握认为“获奖”与性别有关 (2)这5名老成员全是男成员 【分析】(1)完善列联表,计算出卡方即可判断; (2)分别假设 名老成员的性别为女性或男性,求出相应的卡方值,即可判断. 【详解】(1)依题意可得列联表如下: 没获奖 获奖 合计 男 8 4 12 女 7 1 8 合计 15 5 20 由 列联表中数据,计算得到 ,所以没有 的把握认为“获奖”与性 别有关. (2)当这 名老成员中都为女成员时,计算得 ,不合题意; 当 名老成员都为男成员时, 计算得 ,符合题意. 故这 名老成员全是男成员. 例12.(2023·全国·高三专题练习)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别 为对照组(不加药物)和实验组(加药物). (1)设其中两只小鼠中对照组小鼠数目为 ,求 的分布列和数学期望; (2)测得40只小鼠体重如下(单位:g):(已按从小到大排好) 对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3 实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0 (i)求40只小鼠体重的中位数m,并完成下面2×2列联表: 对照组 实验组 (ii)根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用. 参考数据: 0.10 0.05 0.010 2.706 3.841 6.635 【答案】(1)分布列见解析, (2)(i) ,列联表见解析;(ii)能 【分析】(1)由题意可得 的可能取值为 ,然后求出各自对应的概率,从而可求出 的分布列和数 学期望; (2)(i)先对这40个数按从小到大的顺序排列,找出第20个和第21个数,这两个数的平均数就是中位 数,然后根据已知数据填2×2列联表;(ii)由列联表中的数据,根据卡方公式求出卡方,再根据临界值可得结论. 【详解】(1)依题意, 的可能取值为 , 则 , , , 所以 的分布列为: 故 . (2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21 位数据的平均数, 由于原数据已经排好,所以我们只需要观察对照组第一排数据与实验组第二排数据即可, 可得第11位数据为 ,后续依次为 , 故第20位为 ,第21位数据为 , 所以 , 故列联表为: 合计 对照 6 14 20 组 实验 14 6 20 组 合计 20 20 40 (ii)由(i)可得, , 所以能有 的把握认为药物对小鼠生长有抑制作用.练习26.(2023春·重庆沙坪坝·高三重庆一中校考期中)有两个分类变量 和 ,其中一组观测值为如下 的 列联表: 总计 10 30 总计 10 30 40 其中 均为大于 的整数,则 ________时,在犯错误的概率不超过0.01的前提下为“ 和 之间 有关系”.附: 【答案】 【分析】由题意,计算 ,列出不等式求出 的取值范围,再根据题意求得 的值. 【详解】由题意知: , 则 , 解得: 或 (舍去), 因为: 且 , , 综上得: , , 所以: . 故答案为:6. 练习27.(2023春·福建三明·高三三明市第二中学校考阶段练习)两个分类变量 和 ;其 列联表如 表,对同一样本, 的可能取值集合为 .能说明 与 有关联的可能性最大的 的值为 _________.合计 3 6 9 8 合 14 计 【答案】 【分析】给m赋值,依次计算 的预测值并比较大小即可. 【详解】由 列联表可知, 的预测值 , 当 时, , 当 时, , 当 时, , 当 时, . 又因为 , 所以当 时, 的预测值最大,说明X与Y有关联的可能性最大. 故答案为:6. 练习28.(2023·上海徐汇·上海市南洋模范中学校考模拟预测)根据北京冬奥组委会与特许生产商的特许 经营协议,从7月1日开始,包括冰墩墩公仔等在内的2022北京冬奥会各种特许商品将停止生产.现给出 某零售店在某日(7月1日前)上午的两种颜色冰墩墩的销售数据统计表(假定每人限购一个冰墩墩): 蓝 粉色 色 男顾客女顾客 (1)若有99%的把握认为顾客购买的冰墩墩颜色与其性别有关,求a的最小值; (2)在(1)中a取得最小值的条件下,现从所有顾客中选出9人,记选到的人中女顾客人数为X,求X的 分布及数学期望. 附: 0.05 0.010 0.001 3.841 6.635 10.828 【答案】(1)12 (2)分布列见解析, 【分析】(1)根据独立性检验,计算卡方值,与临界值比较即可求解, (2)根据超几何分布即可求解分布列,以及用超几何的期望公式即可求解. 【详解】(1)因为有 的把握认为顾客购买的冰墩墩颜色与其性别有关, 不妨给出零假设 :顾客购买的冰墩墩颜色与其性别无关, 且该假设成立概率小于等于 ,且由表知 , 则 ,即 , 又 , 所以 的最小值为12; (2)由(1)知, 的最小值为12, 此时女顾客一共有 人,男顾客一共有 人, 又从所有顾客中选出9人,所以 的所有可能取值是 ,所以 的分布列为 , 且 ,其中 , 所以 . 练习29.(2023春·云南昆明·高三昆明一中校考期中)对某校900名学生每周的运动时间进行调查,其中 有男生540名,女生360名,根据性别利用分层抽样的方法,从这900名学生中选取60名学生进行分析, 统计数据如下表(运动时间单位:小时) 男生运动时间统计: 运动时间(小 时) 人数 9 8 12 4 女生运动时间统计: 运动时间(小 时) 人数 10 5 2 1 (1)计算 , 的值;若每周运动时间不低于6小时的同学称为“运动爱好者”,每周运动时间低于6小时 的同学称为“非运动爱好者”,根据以上统计数据填写下面的 列联表,则是否可以认为在犯错误的概 率不超过 的前提下认为“运动爱好者与性别有关”? 女 男生 合计 生 运动爱好者 非运动爱好 者 合计 附: , 0.10 0.05 0.025 0.010 0.005 2.706 3.841 5.024 6.635 7.879(2)在抽取的60名学生样本中,从每周运动时间在 的同学中任取3人,记抽到的男生人数为随机变量 ,求 的分布列和数学期望. 【答案】(1) , ,列联表见解析,能在犯错误的概率不超过 的前提下认为“运动爱好者与性 别有关” (2)分布列见解析, 【分析】(1)按照分层抽样求出男生、女生应该选取的人数,从而 , ,求出 列联表,计算 出卡方,即可判断. (2)每周运动时间在 的同学中,男生有 人,女生有 人,从而得到随机变量 可取 , , , , 分别求出相应的概率,由此能求出 的分布列和 . 【详解】(1)依题意,男生应该选取 名,女生应该选取 名, 所以 , , 可得 列联表: 男 女生 合计 生 运动爱好者 24 8 32 非运动爱好者 12 16 28 合计 36 24 60 , 能在犯错误的概率不超过 的前提下认为“运动爱好者与性别有关”. (2)每周运动时间在 的同学中,男生有 人,女生有 人, 则随机变量 可取 , , , , 所以 , ,, , 的分布列为: 0 1 2 3 所以 . 练习30.(2023春·江苏淮安·高三淮阴中学校联考阶段练习)某中学对50名学生的“学习兴趣”和“主 动预习”情况进行长期调查,得到统计数据如下表所示: 主动预 不太主动预习 合计 习 学习兴趣高 18 7 25 学习兴趣一般 6 19 25 合计 24 26 50 (1)现从“学习兴趣一般”的25个学生中,任取2人,若 表示其中“会主动预习”的学生的人数,求 的分布列与数学期望; (2)依据小概率值 的独立性检验,分析“学习兴趣”是否与“主动预习”有关. 参考数据、附表及公式: , . 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)分布列见解析, (2)“学习兴趣”与“主动预习”有关 【分析】(1)根据超几何分布的概率公式可求出分布列,根据期望公式可得期望; (2)根据公式求出 ,结合临界值表可得结果. 【详解】(1) ,, , , 随机变量X的分布列为: 0 1 2 所以,X的数学期望是 . (2)提出零假设 :假设“学习兴趣”与“主动预习”无关. , 因此在犯错率小于 的条件下,认为“学习兴趣”与“主动预习”有关.