当前位置:首页>文档>第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)

第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)

  • 2026-03-24 06:13:05 2026-03-24 05:14:08

文档预览

第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)
第03讲成对数据的统计分析(精练)(教师版)_2.2025数学总复习_2023年新高考资料_一轮复习_2023新高考数学一轮复习(新教材新高考)

文档信息

文档格式
docx
文档大小
0.907 MB
文档页数
17 页
上传时间
2026-03-24 05:14:08

文档内容

第 03 讲 成对数据的统计分析 (精练) A 夯实基础 B 能力提升 C 综合素养 A 夯实基础 一、单选题 1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( ) A.回归分析和独立性检验没有什么区别 B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系 C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验 D.独立性检验可以100%确定两个变量之间是否具有某种关系 【答案】C 【详解】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分 析预测和估计两个变量之间具有的相关关系; 独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种 关系,但不能100%肯定这种关系. 故ABD错误,C正确. 故选:C. 2.(2022·陕西西安·高一期末)如图是根据 的观测数据 得到的散点图,可以判断 变量 具有线性相关关系的有( ) A.①② B.①③ C.②④ D.③④ 【答案】D 【详解】由图可知,③,④中各点比较均匀的分布在一条直线附近,具有线性相关关系. 故选:D. 3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数 据后将所得结果填入相应的 列联表中.由列联表中的数据计算得 .参照附表,下列结论正确的 是( ) 0.025 0.010 0.005 0.0015.02 6.635 7.879 10.828 A.在犯错误的概率不超过0.1%的前提下,认为“药物有效” B.在犯错误的概率不超过0.1%的前提下,认为“药物无效” C.有99.99%以上的把握认为“药物有效” D.有99.99%以上的把握认为“药物无效” 【答案】A 【详解】因为 ,即 , 所以在犯错误的概率不超过0.1%的前提下,认为“药物有效”或有99.9%以上的把握认为“药物有效”. 故选:A. 4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X 的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线 性回归模型 , , ,则( ) A. , B. , C. , D. , 【答案】C 【详解】记三条回归直线分别为 , , , 画出这三条回归直线的大致图象,如图所示, 由图可知这三条回归直线的斜率大小关系为 , 截距大小关系为 .故选:C. 5.(2022·安徽·歙县教研室高二期末)已知变量 的成对样本数据的四个样本点 ,用最小二乘法得到回归方程 过点 的直线方程为 ,给出下列4个命题: ① ; ② ; ③ ; ④点 一定在直线 上. 其中正确的命题的个数是( ) 参考公式: , . A.1个 B.2个 C.3个 D.4个 【答案】C 【详解】作出散点图,直观判断可知 , ,故①正确,②错误; 又 , 所以 , 所以 因为 ,所以 所以 所以 的残差平方和较小,所以③正确; 由回归方程一定过样本点中心 ,所以④正确. 故选:C6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关 联进行了一次调查,其中被调查的男生、女生人数均为 人,男生中喜欢短视频的人数占男生人 数的 ,女生中喜欢短视频的人数占女生人数的 .零假设为 :喜欢短视频和性别相互独立.若依据 的独立性检验认为喜欢短视频和性别不独立,则 的最小值为( ) 附: ,附表: 0.05 0.01 3.841 6.635 A.7 B.8 C.9 D.10 【答案】C 【详解】根据题意,不妨设 ,于是 ,由于依据 的独立性检验认为喜欢短视频 和性别不独立,根据表格可知 ,解得 ,于是 最小值为 . 故选:C 7.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行 试销,得到如下数据: 单价x元 9 9.2 9.4 9.6 9.8 10 销量y件 100 94 93 90 85 78 (附:对于一组数据(x,y),(x,y)…(xn,yn),其回归直线 的斜率的最小二乘估计值 1 1 2 2 为 参考数值: , );预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元 【答案】B 【详解】由题意 由 所以 ,则 设该产品的售价为 元,工厂的利润为 ,则 由 当且仅当 ,即 时等号成立. 所以 时,工厂的利润的最大为405元 故选:B 8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利 用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱 排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查 研究发现选择函数模型 来拟合y与x的关系,根据以下数据: 茶叶量x/克 1 2 3 4 5 4.34 4.36 4.44 4.45 4.51 可求得y关于x的回归方程为( ) (附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为 , ) A. B. C. D. 【答案】B【详解】对等式 两边同时取对数,可得: 易知: , 则 综上,可得: 又有: 可得: 故选:B 二、多选题 9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天 大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生, 发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没 有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( ) A.120 B.130 C.240 D.250 【答案】AB 【详解】依题意,设男、女学生的人数均为 ,则被调查的男、女学生的总人数为 .建立如 下 列联表: 喜欢跑 不喜欢跑步 总计 步 男 女 总计 则 ,又 ,所以 . 故选:AB. 10.(2022·山东聊城·高二期末)对具有相关关系的两个变量 和 进行回归分析时,经过随机抽样获得 成对的样本数据 ,则下列说法正确的是( ) A.若两变量 、 具有线性相关关系,则回归直线至少经过一个样本点 B.变量 、 的线性相关系数 的绝对值越接近 ,则两个变量 与 的线性相关程度越强 C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好 D.用 来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上, 则 的值为 【答案】BCD 【详解】对于A选项,若两变量 、 具有线性相关关系,则回归直线过样本中心点,但不一定过样本点, A错; 对于B选项,若变量 、 的线性相关系数 的绝对值越接近 ,则两个变量 与 的线性相关程度越强, B对; 对于C选项,用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好,C对; 对于D选项,用 来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零 的直线上,则 的值为 ,D对. 故选:BCD. 三、填空题 11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表: 年份 2015 2016 2017 2018 2019 年份编号x 1 2 3 4 5 年人均收入y(万元) 0.5 0.6 1 1.4 m 根据表中所数据,求得y与x的线性回归方程为: ,则2019年该地区实际年人均收入为 ___________万元. 【答案】 ## 【详解】解:依题意 , ,因为回归直线方程必过样本中心点 , 所以 ,解得 ,即2019年该地区实际年人均收入为 万元; 故答案为: 12.(2022·全国·高三专题练习) 和 的散点图如图所示,则下列说法中所有正确命题的序号为______. ① , 是负相关关系; ② , 之间不能建立线性回归方程; ③在该相关关系中,若用 拟合时的相关指数为 ,用 拟合时的相关指数为 ,则 . 【答案】①③ 【详解】在散点图中,点散布在从左上角到右下角的区域,因此 , 是负相关关系,故①正确; x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误; 由散点图知用 拟合比用 拟合效果要好,则 ,故③正确. 故答案为:①③. 四、解答题 13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7 天每天的游客人数 (百人)的数据,得到下面的表格: 第 天 3 4 5 6 7 游客人数 (百人) 1.5 2 3 3.5 5 (1)若 与 具有线性相关关系,求 关于 的线性回归方程; (2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最 大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需 要采取限流措施? 附:线性回归方程 的斜率和截距的最小二乘估计分别为 , .【答案】(1) (2)从第14天开始.该水上乐园需要采取限流措施 (1)由表中数据得: , ,计算得 , ∴ ,∴ ,∴ ,∴ 关于 的 线性回归方程为 (2)令 得 ,解得 ,∴从第14天开始.该水上乐园需要采取限流措施. 14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车 抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交 通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人 闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到 如下 列联表: 30岁及以下 30岁以上 总计 闯红灯 60 未闯红灯 80 总计 200 近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济 处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表: 处罚金额(单位: 5 10 15 20 元) 闯红灯的人数 50 40 20 0 将统计数据所得频率作为概率,完成下列问题. (1)将 列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚 前,是否有99.9%的把握认为闯红灯与年龄有关? (2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少? (3)结合调查结果,谈谈如何治理行人闯红灯现象. 【答案】(1)表格见解析,有99.9%的把握认为闯红灯与年龄有关 (2)0.2 (3)答案见解析 (1) 30岁及以下 30岁以上 总计闯红灯 20 60 80 未闯红灯 80 40 120 总计 100 100 200 由表中数据,得 .∵ ,∴有99.9%的把握认为闯红灯 与年龄有关. (2)未进行处罚前,行人闯红灯的概率约为0.4,当处罚金额为10元时,行人闯红灯的概率约为 ,故当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2. (3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣 传教育;②由于试行经济处罚可以明显降低行人闯红灯的概率,则可以进行适当经济处罚来降低行人闯红 灯的概率. B 能力提升 1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖 种类中的抽奖系统的概率和相关保底机制如下: 物品类别 5星 4星 3星 基础概率 0.600% 5.100% 94.300% 基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率. 保底机制:现假定玩家 从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4 星)的次数增加而改变,相关机制如下表所示: 连续未抽中4星的次数i 下一次抽中4星的概率 5.100% 连续未抽中5星的次数i 下一次抽中5星的概率 0.600% 注:① 表示 中的最小值: ②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除; ③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于 表中的值(记为p),而抽中4星的概率为 . 现记玩家 获得1个5星物品所需要的最大抽奖次数为N; (1)统计10名玩家 抽到第一个五星的总次数和中途抽到四星的次数如下表所示:玩家序号 1 2 3 4 5 6 7 8 9 10 总次数y 30 78 64 80 85 79 55 83 66 81 四星个数x 4 8 7 9 9 8 6 9 8 9 计算得: ,已知y与x之间存在很强的线性相关关系,求出其线 性回归方程,并求出使得 最小的x(回归方程中的 和 取两位小数) 参考公式:回归直线方程 斜率和截距的最小二乘估计公式分别为: . 【答案】(1) , (1)因为 ,代入数据得: ,所以 ,所以y与x的线性回归方程为 .当连续未抽中5星的次 数 ,下一次抽中5星的概率为0.600%,所以下一次可能抽不中5星;当连续未抽中5星的次数 ,下一次抽中5星的概率 0.600%,由 有: ,所以玩家 获得1个5星物品所需要的最大抽奖次数为73. 所以 ,由 有: ,所以使得 最小 的x为8. 2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题 王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩 (满分为100分)为6组: , , , , , ,得到如图所示的频 率分布直方图. (1)求a的值;(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80 分”,估计A的概率; (3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请 将下面的 列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”? 优秀 非优秀 合计 男生 40 女生 50 合计 100 参考公式及数据: , . 0.10 0.05 0.025 0.01 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1) ; (2)0.35; (3)列联表答案见解析,没有99.9%的把握认为比赛成绩优秀与性别有关. (1)由频率分布直方图知, ,解得: ,所以a的 值是0.025. (2)由(1)知 ,则比赛成绩不低于80分的频率为 ,所以从参加冬奥知 识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35. (3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有 人,由此可得完整的2×2列联 表: 优秀 非优秀 合计 男生 10 40 50 女生 25 25 50 合计 35 65 100 零假设 :比赛成绩优秀与性别无关,根据表中的数据,计算得到 ,依据小概率值 的独立性检验,没有充 分证据推断 不成立,因此可以认为 成立,即没有99.9%的把握认为比赛成绩优秀与性别有关.C 综合素养 1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三 针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格: A区 B区 C区 D区 疫苗接种人数x/万 6 8 10 12 第三针接种人数y/万 2 3 5 6 (1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程 (若 ,则线性相关程度很高,可用直线拟合). 参考公式和数据:相关系数 ,回归方程 中斜率和截距的最小二乘估 计公式分别为 , , . 【答案】(1)说明答案见解析, 由题: , , , , , 所以相关系数 , 说明y与x之间的性相关程度很高,所以可用线性回归模型拟合y与x之间的关系. , 故y关于x的线性回归方程为 . 2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特 长生中随机选取8名,其身高和体重的数据如表所示: 编号 1 2 3 4 5 6 7 8 身高x( ) 178 173 158 167 160 173 166 169体重y( ) 66 61 50 58 53 66 57 57 (1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为 .利用已经求得的线性回 归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值 (保留两位有效 数字). 编号 1 2 3 4 5 6 7 8 体重y( ) 66 61 50 58 53 66 57 57 残差 -0.5 -1.5 -0.5 0.3 0.9 (2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知 通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长 生的身高与体重的线性回归方程. 参考公式: , , , .参考数 据: , , , , . 【答案】(1)填表答案见解析, 约为0.91 (2) (1)解:对编号为6的数据: ; 对编号为7的数据: ; 对编号为8的数据: . 完成的残差表如下所示: 编号 1 2 3 4 5 6 7 8 体重y(kg) 66 61 50 58 53 66 57 57 残差 -0.5 -1.5 -0.5 0.3 0.9 3.5 0.1 -2.3 , ,所以解释变量(身高)对于预报变量(体重)变化的贡献值 约为0.91. (2)由(1)可知,第六组数据的体重应为58, 此时 ,又 , , , , , 所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为 . 3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起, 第x天的高度为ycm,测得数据如下: 1 4 9 16 25 36 49 0 4 7 9 11 12 13 数据的散点图如图所示: 为近似描述y与x的关系,除了一次函数 ,还有 和 两个函数可选. (1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程( 保留到小数点后1位); (2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由. 参考公式: , . 参考数据(其中 , ): , , , , , , , , , . 【答案】(1)选用 ; ; (2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.理由见解析.(1)由散点图可知,这些数据集中在图中曲线的附近, 而曲线的形状与函数 的图象很相似, 因此可以用类似的表达式 来描述y与x的关系, 即三个函数中 的图象是拟合y与x的关系“最好”的曲线. 令 ,则 ,根据已知数据, 得 , , 所以 , 又回归直线 经过点(4,8),所以 , 所以y关于x的回归直线方程为 ,即 ; (2)说法“高度从1000cm长到1001cm所需时间超过一年”成立. 设其幼苗从观察之日起,第m天的高度为1000cm, 有 ,解得 , 第n天的高度为1001cm, 有 ,解得 , 天, 所以说法“高度从1000cm长到1001cm所需时间超过一年”成立.