文档内容
备战2024年高考阶段性检测名校重组卷(新高考)
统计与成对数据的分析
本试卷22小题,满分150分。考试用时120分钟
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只
有一项是符合题目要求的。
1.(2023四川成都七中二诊)一个果园培养了一种少籽苹果,现随机抽样一些苹果调查苹果
的平均果籽数量,得到下列频率分布表:
则根据表格,这批样本的平均果籽数量为( )
A. B. C. D.
【答案】B
【解析】这批样本的平均果籽数 .
故选:B.
2.(2023•浙江一模)已知一组样本数据 , , , 的平均数为 ,由这组数据得
到另一组新的样本数据 , , , ,其中 ,2, , ,则
A.两组样本数据的平均数相同
B.两组样本数据的方差不相同
C.两组样本数据的极差相同
D.将两组数据合成一个样本容量为20的新的样本数据,该样本数据的平均数为
【答案】C
【分析】根据平均数、方差和极差的计算公式判断即可.
【详解】解:对于 ,因为 ,所以 ,故 错;对于 ,因为 ,所以两组样本
数据的方差相同,故 错;
对于 ,新的样本数据的极差 ,
所以两组样本数据的极差相同,故 正确;
对于 ,样本容量为20的新的样本数据的平均数为 ,故 错.
故选C.
3.(2023•四川一模)某部门调查了200名学生每周的课外活动时间(单位: ,制成了
如图所示的频率分布直方图,其中课外活动时间的范围是 , ,并分成 , ,
, , , , , , , 五组.根据直方图,判断这200名学生中每周
的课外活动时间不少于 的人数是
A.56 B.80 C.144 D.184
【答案】C
【分析】根据频率分布直方图确定每周的课外活动时间不少于 的频率,再根据频率、
频数、总数的关系即可求.
【详解】解:每周的课外活动时间不少于 的频率为 ,
故所求人数 ,
故选C.4.(2023·山东·统考二模)某射击运动员连续射击5次,命中的环数(环数为整数)形成
的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
【答案】B
【分析】首先分析数据的情况,再根据平均数公式计算可得.
【详解】依题意这组数据一共有 个数,中位数为 ,则从小到大排列 的前面有 个数,
后面也有 个数,
又唯一的众数为 ,则有两个 ,其余数字均只出现一次,则最大数字为 ,
又极差为 ,所以最小数字为 ,
所以这组数据为 、 、 、 、 ,
所以平均数为 .
故选:B
5.(2023河北唐山二模) 某校高三年级一共有 名同学参加数学测验,已知所有学生
成绩的第 百分位数是 分,则数学成绩不小于 分的人数至少为( )
A. B. C. D.
【答案】B
【解析】由 人,所以小于 分学生最多有 人,所以大于或等于
分的学生有 人.
故选:B.
6.(2023•河南一模)为迎接北京2022年冬奥会,小王选择以跑步的方式响应社区开展的
“喜迎冬奥爱上运动”(如图)健身活动.依据小王2021年1月至2021年11月期间每
月跑步的里程(单位:十公里)数据,整理并绘制的折线图,根据该折线图,下列结论
正确的是A.月跑步里程逐月增加
B.月跑步里程的极差小于15
C.月跑步里程的中位数为5月份对应的里程数
D.1月至5月的月跑步里程的方差相对于6月至11月的月跑步里程的方差更大
【答案】C
【分析】利用题中折线图中的数据信息以及变化趋势,对四个选项逐一分析判断即可.
【详解】解:对于 ,由折线图的变化趋势可知,月跑步里程不是逐月增加的,故选项
错误;
对于 ,由折线图可知,月跑步里程的最小值出现在 2月为5,最大值出现在10月为
25,极差为20,大于15,故选项 错误;
对于 ,月跑步里程从小到大排列为:2月,8月,3月,4月,1月,5月,7月,6月,
11月,9月,10月,则5月对应的里程为中位数,故 正确;
对于 ,由折线图的变化趋势可知,1月至5月的月跑步里程相对于6月至11月波动性
更小,所以1月至5月的月跑步里程相对于6月至11月的月跑步里程的方差更小,故选
项 错误.
故选C.
7.(2023·安徽马鞍山·统考三模)某校高三(1)班(45人)和高三(2)班(30人)进
行比赛,按照分层抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)
班答对题目的平均数为 ,方差为 ;高三(2)班答对题目的平均数为 ,方差为 ,
则这10人答对题目的方差为( )
A. B. C. D.
【答案】D
【详解】由分层抽样可得高三(1)班抽取的人数为 ,高三(2)班抽取的人
数为 ,设高三(1)班(6人)答对题目数依次为 ,高三(2)班(4人)答对题目数依
次为 ,
由题意可得:
,
可得 ,
则这10人答对题目的平均数 ,
这10人答对题目的方差 .
故选:D.
8.(2023·山东菏泽·统考二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有
关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人
数的 ,女性喜爱足球的人数占女性人数的 ,若本次调查得出“在犯错误的概率不超过
0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有( )人
a 0.10 0.05 0.01 0.005 0.001
2.706 3.841 5.635 7.879 10.828
A.10 B.11 C.12 D.13
【答案】C
【分析】根据题意,设出男生人数,从而计算出列联表,再算出 7.879比较即可.【详解】设被调查的男性为 人,则女性为 人,依据题意可得列联表如下表:
男
女性 合计
性
喜爱足球
不喜爱足球
合计
,
因为本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的
结论,所以有
,即 ,
解得 ,又因为上述列联表中的所有数字均为整数,
故 的最小值为12.
故选:C.
二、多项选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项
符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。
9.(2023·广东惠州·统考模拟预测)在某市高二举行的一次期中考试中,某学科共有2000
人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整
数,满分为100分)作为样本进行统计,样本容量为 .按照
的分组作出频率分布直方图,如图所示.其中,成绩
落在区间 内的人数为16.则下列结论正确的有( )A.样本容量
B.图中
C.估计该市全体学生成绩的平均分为 分
D.该市要对成绩由高到低前 的学生授予“优秀学生”称号,则成绩为78分的学生肯
定能得到此称号
【答案】BC
【解析】对于A:因为成绩落在区间 内的人数为 ,所以样本容量
,故A不正确;
对于B:因为 ,解得 ,故B正确;
对于C:学生成绩平均分为:
,故C正确;
对于D:因为 ,
即按照成绩由高到低前 的学生中不含 分的学生,所以成绩为 分的学生不能得到
此称号,故D不正确.
故选: .
10.(2023·广东佛山·模拟)为考查某种营养品对儿童身高增长的影响,选取部分儿童
进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法
正确的是( )
身高
营养品 合计
有明显增长 无明显增长
食用 a 10 50未食用 b 30 50
合计 60 40 100
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
α
A.a=b=30
B.χ2≈12.667
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响
【答案】 D
【解析】 由题可知a=50-10=40,b=50-30=20,所以A错误;
χ2=≈16.667 >10.828=x ,
0.001
所以根据小概率值α=0.001的独立性检验,
可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;
从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是=,所
以C错误.
11.(2023·湖南长沙模拟)自然环境中,大气压受到各种因素的影响,如温度、湿度、风
速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.
下图是根据一组观测数据得到海拔6千米~15千米的大气压强散点图,根据一元线性回归
模型得到经验回归方程为 ,决定系数为 ;根据非线性回归模型
y =−4.0x+68.5 R2=0.99
1 1
得到经验回归方程为 ,决定系数为 ,则下列说法正确的是
y =132.9e−0.163x R2=0.99
2 2
( )A.由散点图可知,大气压强与海拔高度负相关
B.由方程y =−4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0kPa
1
C.由方程y =−4.0x+68.5可知,样本点(11,22.6)的残差为−1.9
1
D.对比两个回归模型,结合实际情况,方程y =132.9e−0.163x的预报效果更好
2
【答案】ACD
【分析】根据散点图即可得出A项;根据回归方程的含义可判断B项;根据残差计算公式
求出残差,可判断C项;根据实际大气压强不能为负,可判断D项.
【详解】对于A项,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度
负相关,故A项正确;
对于B项,回归直线得到的数据为估计值,而非精确值,故B项错误;
对于C项,当x=11时,^y =−4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以
1
样本点(11,22.6)的残差为22.6−24.5=−1.9,故C项正确;
对于D项,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程
y =132.9e−0.163x 的预报效果更好,故D项正确.
2
故选:ACD.
12.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10 ℃即
为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4
组样本①,②,③,④,依次计算得到结果如下:
①平均数<4;
②平均数<4且极差小于或等于3;
③平均数<4且标准差s≤4;
④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
【答案】 B
【解析】 ①举反例:0,0,0,4,11,其平均数=3<4.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与<4矛盾,故假设错
误.则此组数据全部小于10. 符合入冬指标;
③举反例:1,1,1,1,11,平均数=3<4,且标准差s=4.但不符合入冬指标;
④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.
三、填空题:本大题共4小题,每小题5分,共20分。
13.(2023山东滨州模拟) 已知某中学老年教师的“亚健康”率为 ,中年教师的“亚
健康”率为 ,青年教师的“亚健康”率为 .若该中学共有 名老年教师, 名中
年教师, 名青年教师,则该校教师的“亚健康"率为__________.
【答案】
【解析】根据题意,该校教师的“亚健康”率为:
.
14.(2023•福建一模)以下为甲、乙两组按从小到大顺序排列的数据:
甲组:14,30,37, ,41,52,53,55,58,80;
乙组:17,22,32,43,45,49, ,56.
若甲组数据的第40百分位数和乙组数据的平均数相等,则 .
【答案】100
【分析】根据百分位数和平均数的定义即可列出式子计算求解.
【详解】解:因为 ,甲组数据的第40百分位数为第四个数和第五个数的平
均数,
乙组数据的平均数为 ,
根据题意得 ,解得: ,
所以 .
故答案为:100.
15.(2023·沧州模拟)已知某样本数据分别为1,2,3,a,6,若样本平均数=3,则样本方差s2=
________.【答案】
【解析】 由题设,得==3,可得a=3,所以s2= (x-)2=.
i
16.(2023河北石家庄部分学校开学考)湖北省中药材研发中心整合省农业科技创新中心、
省创新联盟相关资源和力量,为全省中药材产业链延链、补链、强链提供科技支撑,某科研机
构研究发现,某品种中医药的药物成分甲的含量 (单位: )与药物功效 (单位:药物单位)之
间满足 ,检测这种药品一个批次的 个样本,得到成分甲的含量 的平均值为
,标准差为 ,则估计这批中医药的药物功效 的平均值为__________药物单位.
【答案】
【解析】设 个样本中药物成分甲的含量分别为 ,
因为成分甲的含量的平均值为 ,所以 ,
标准差为 ,所以 ,可得
又由 ,所以 ,
所以这批中医药的药物功效的平均值为
故答案为: .
四、解答题:本大题共6小题,共70分,请在答题卡指定区域内作答,解答时应写出文字
说明、证明过程或演算步骤。
17.(2023·广东惠州·统考模拟预测)某地经过多年的环境治理,已将荒山改造成了绿水
青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部
横截面积(单位: )和材积量(单位: ),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总
和为 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区
这种树木的总材积量的估计值.
附:相关系数 .
【解析】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为 ,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为 ,
又已知树木的材积量与其根部横截面积近似成正比,
可得 ,解之得 .
则该林区这种树木的总材积量估计为
18.(2023·山东临沂二模)某农科所统计了单位面积某种化肥实施量x(kg)和玉米相应
产量Y(kg)的相关数据,制作了数据对照表:
x(kg) 16 20 24 29 36
Y(kg) 340 350 362 404 454
若在合理施肥范围内x与Y具有线性相关关系,(1)求Y关于x的线性回归方程 ;
(2)请利用线性回归方程预测 时的玉米产量.
附:回归直线的斜率和截距的最小二乘法估计公式分别为: ,
.
【解析】(1)解:由表中数据计算得, . ,
, ,
,
.
所以回归方程为 .
(2)将 代入回归方程得 .
故预测 时,玉米产量约为 .
19.(2023·广东汕头·统考一模)2023年1月14日,翘首以盼的汕头镇邦美食街开街啦!
近年来,汕头多措并举,提升汕头美食品牌,推动潮汕菜产业做大做强,镇邦美食街的建
成开街,是汕头美食产业的又一里程碑,同时“舌尖汕头”——汕头美食地图同步上线,
以微信小程序的形式面向游客,并通过意见反馈功能收集游客满意度调查问卷.
(1)现将游客按年龄段分为老中青三个群体,通过问卷数据分析显示,老年群体中有 的
游客给予好评,中年群体有 的游客给予好评,青年群体中有 的游客给予好评,且
老中青三个群体游客人数之比为 ,从这三个群体中随机抽取1名游客,求该游客给予
好评的概率.(2)镇邦美食街共有 多家餐饮单位进驻,为维护市场价格秩序,营造公平竞争良好环境,
汕头市监管部门到镇邦美食街举办餐饮明码标价现场指导会,现针对明码标价指导会前、
会后游客满意度进行问卷回访调查,统计了 名游客的数据,列出如下 列联表:
对镇邦美食街餐饮价格是否满意 明码标价指导会前 明码标价指导会后 合计
满意 28 57 85
不满意 12 3 15
合计 40 60 100
请根据小概率值 的独立性检验判断游客对汕头镇邦美食街餐饮价格满意度与监管
部门举办明码标价现场指导会是否有关联.
▲参考公式: ,
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解析】(1)设游客总人数为 ,则老年人有 (人),
中年人有 (人),青年人有 (人),
所以给予好评的人数为 ,
所以从这三个群体中随机抽取1名游客,该游客给予好评的概率 .
(2)零假设为 :游客对汕头镇邦美食街餐饮价格满意度与监管部门举办明码标价现场
指导会之间无关联,
根据列联表中的数据,经计算得到 ,
根据小概率值 的独立性检验,我们推断 不成立,
即认为游客对汕头镇邦美食街餐饮价格满意度与监管部门举办明码标价现场指导会之间有
关联,此推断犯错误的概率不大于 .
20.(2023·黑龙江哈尔滨·哈尔滨三中校考二模)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到
114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响
应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:
年份 2012 2013 2014 2015 2016
年份编号 1 2 3 4 5
地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6
(1)求出回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持
续增长,现对这11年的数据有三种经验回归模型 、 、
,它们的 分别为0.976、0.880和0.985,请根据 的数值选择最好的
回归模型预测一下2023年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为 ,结
合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式: , ;
【解析】(1)由数据, , ,
而 , ,
所以 ,则 ,
综上,回归方程为 ,
当 时, ,故2016年地区生产总值残差为 .
(2)根据相关指数越大拟合越好,由于 ,故 模型
较好,因2023年对应 ,则 亿元.
(3)由(2)及题设知:该市人均地区生产总值
,
令 ,且 ,若 ,
所以 ,
而 且,则 ,故 ,
所以 在 上递增,则 在 上递增,
所以该市人均地区生产总值逐年递增.
21.(2023·山西运城·统考三模)数据显示中国车载音乐已步入快速发展期,随着车载音
乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022年中国车载音乐市场规
模(单位:十亿元),其中年份2018—2022对应的代码分别为1—5.
年份代码x 1 2 3 4 5
车载音乐市场规模y 2.8 3.9 7.3 12.0 17.0
(1)由上表数据知,可用指数函数模型 拟合y与x的关系,请建立y关于x的回归方
程(a,b的值精确到0.1);
(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y
关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,
请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音
乐市场规模.
参考数据:
1.94 33.82 1.7 1.6
其中 , .参考公式:对于一组数据 ,其回归直线 的斜率和截距的
最小二乘法估计公式分别为 .
【答案】(1)
(2) 十亿元
【详解】(1)解:因为 ,
所以两边同时取常用对数,得 ,
设 ,
所以 ,设 ,
因为 ,
所以
,
所以
所以
所以
(2)由(1)知2023年与2024年这两年的年平均增长率 ,
2022年中国车载音乐市场规模为17,
故预测2024年的中国车载音乐市场规模 (十亿元).
22.(2023·湖南永州·统考三模)为了精准地找到目标人群,更好地销售新能源汽车,某
4S店对近期购车的男性与女性各100位进行问卷调查,并作为样本进行统计分析,得到如下列联表 :
购买新能源汽车(人数) 购买传统燃油车(人数)
男性
女性
(1)当 时,将样本中购买传统燃油车的购车者按性别采用分层抽样的方法抽取6人,
再从这6人中随机抽取3人调查购买传统燃油车的原因,记这3人中女性的人数为X,求X
的分布列与数学期望;
(2)定义 ,其中 为列联表中第i行第j列的实际
数据, 为列联表中第i行与第j列的总频率之积再乘以列联表的总频数得到的理论频数.
基于小概率值 的检验规则:首先提出零假设 (变量X,Y相互独立〉,然后计算 的
值,当 时,我们推断 不成立,即认为X和Y不独立,该推断犯错误的概率不超
过 ;否则,我们没有充分证据推断 不成立,可以认为X和Y独立.根据 的计算公式,
求解下面问题:
(i)当 时,依据小概率值 的独立性检验,请分析性别与是否喜爱购买新能
源汽车有关;
(ⅱ)当 时,依据小概率值 的独立性检验,若认为性别与是否喜爱购买新能
源汽车有关,则至少有多少名男性喜爱购买新能源汽车?
附:
0.1 0.025 0.005
2.706 5.024 7.879
【答案】(1)分布列见解析,
(2)(i)性别与是否购买新能源汽车有关联;(ⅱ)76名
【详解】(1)当m=0时,
用分层抽样的方法抽取购买传统燃油车的6人中,男性有2人,女性有4人.由题意可知,X的可能取值为1,2,3.
X的分布列如下表
X 1 2 3
.
(2)(i)零假设为 :
性别与是否购买新能源汽车独立,即性别与是否购买新能源汽车无关联.
当m=0时,
,
,
∴根据小概率值 的独立性检验,我们推断 不成立,即认为性别与是否购
买新能源汽车有关联,此推断犯错误的概率不超过0.005.
(ⅱ)由题意可知 ,
整理得 ,
,
所以 的最大值为4,
又 ,
至少有76名男性购买新能源汽车.