文档内容
备战2024年高考阶段性检测名校重组卷(新高考)
统计与成对数据的分析
本试卷22小题,满分150分。考试用时120分钟
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只
有一项是符合题目要求的。
1.(2023四川成都七中二诊)一个果园培养了一种少籽苹果,现随机抽样一些苹果调查苹果
的平均果籽数量,得到下列频率分布表:
则根据表格,这批样本的平均果籽数量为( )
A. B. C. D.
2.(2023•浙江一模)已知一组样本数据 , , , 的平均数为 ,由这组数据得
到另一组新的样本数据 , , , ,其中 ,2, , ,则
A.两组样本数据的平均数相同
B.两组样本数据的方差不相同
C.两组样本数据的极差相同
D.将两组数据合成一个样本容量为20的新的样本数据,该样本数据的平均数为
3.(2023•四川一模)某部门调查了200名学生每周的课外活动时间(单位: ,制成了
如图所示的频率分布直方图,其中课外活动时间的范围是 , ,并分成 , ,
, , , , , , , 五组.根据直方图,判断这200名学生中每周
的课外活动时间不少于 的人数是A.56 B.80 C.144 D.184
4.(2023·山东·统考二模)某射击运动员连续射击5次,命中的环数(环数为整数)形成
的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
5.(2023河北唐山二模) 某校高三年级一共有 名同学参加数学测验,已知所有学生
成绩的第 百分位数是 分,则数学成绩不小于 分的人数至少为( )
A. B. C. D.
6.(2023•河南一模)为迎接北京2022年冬奥会,小王选择以跑步的方式响应社区开展的
“喜迎冬奥爱上运动”(如图)健身活动.依据小王2021年1月至2021年11月期间每
月跑步的里程(单位:十公里)数据,整理并绘制的折线图,根据该折线图,下列结论
正确的是
A.月跑步里程逐月增加
B.月跑步里程的极差小于15
C.月跑步里程的中位数为5月份对应的里程数
D.1月至5月的月跑步里程的方差相对于6月至11月的月跑步里程的方差更大
7.(2023·安徽马鞍山·统考三模)某校高三(1)班(45人)和高三(2)班(30人)进
行比赛,按照分层抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)
班答对题目的平均数为 ,方差为 ;高三(2)班答对题目的平均数为 ,方差为 ,则这10人答对题目的方差为( )
A. B. C. D.
8.(2023·山东菏泽·统考二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有
关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人
数的 ,女性喜爱足球的人数占女性人数的 ,若本次调查得出“在犯错误的概率不超过
0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有( )人
a 0.10 0.05 0.01 0.005 0.001
2.706 3.841 5.635 7.879 10.828
A.10 B.11 C.12 D.13
二、多项选择题:本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项
符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。
9.(2023·广东惠州·统考模拟预测)在某市高二举行的一次期中考试中,某学科共有2000
人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整
数,满分为100分)作为样本进行统计,样本容量为 .按照
的分组作出频率分布直方图,如图所示.其中,成绩
落在区间 内的人数为16.则下列结论正确的有( )A.样本容量
B.图中
C.估计该市全体学生成绩的平均分为 分
D.该市要对成绩由高到低前 的学生授予“优秀学生”称号,则成绩为78分的学生肯
定能得到此称号
10.(2023·广东佛山·模拟)为考查某种营养品对儿童身高增长的影响,选取部分儿童
进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法
正确的是( )
身高
营养品 合计
有明显增长 无明显增长
食用 a 10 50
未食用 b 30 50
合计 60 40 100
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
α
A.a=b=30
B.χ2≈12.667
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响
11.(2023·湖南长沙模拟)自然环境中,大气压受到各种因素的影响,如温度、湿度、风
速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.
下图是根据一组观测数据得到海拔6千米~15千米的大气压强散点图,根据一元线性回归
模型得到经验回归方程为 ,决定系数为 ;根据非线性回归模型
y =−4.0x+68.5 R2=0.99
1 1
得到经验回归方程为 ,决定系数为 ,则下列说法正确的是
y =132.9e−0.163x R2=0.99
2 2
( )A.由散点图可知,大气压强与海拔高度负相关
B.由方程y =−4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0kPa
1
C.由方程y =−4.0x+68.5可知,样本点(11,22.6)的残差为−1.9
1
D.对比两个回归模型,结合实际情况,方程 的预报效果更好
y =132.9e−0.163x
2
12.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10 ℃即
为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4
组样本①,②,③,④,依次计算得到结果如下:
①平均数<4;
②平均数<4且极差小于或等于3;
③平均数<4且标准差s≤4;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
三、填空题:本大题共4小题,每小题5分,共20分。
13.(2023山东滨州模拟) 已知某中学老年教师的“亚健康”率为 ,中年教师的“亚
健康”率为 ,青年教师的“亚健康”率为 .若该中学共有 名老年教师, 名中
年教师, 名青年教师,则该校教师的“亚健康"率为__________.
14.(2023•福建一模)以下为甲、乙两组按从小到大顺序排列的数据:
甲组:14,30,37, ,41,52,53,55,58,80;
乙组:17,22,32,43,45,49, ,56.
若甲组数据的第40百分位数和乙组数据的平均数相等,则 .
15.(2023·沧州模拟)已知某样本数据分别为1,2,3,a,6,若样本平均数=3,则样本方差s2=
________.
16.(2023河北石家庄部分学校开学考)湖北省中药材研发中心整合省农业科技创新中心、省创新联盟相关资源和力量,为全省中药材产业链延链、补链、强链提供科技支撑,某科研机
构研究发现,某品种中医药的药物成分甲的含量 (单位: )与药物功效 (单位:药物单位)之
间满足 ,检测这种药品一个批次的 个样本,得到成分甲的含量 的平均值为
,标准差为 ,则估计这批中医药的药物功效 的平均值为__________药物单位.
四、解答题:本大题共6小题,共70分,请在答题卡指定区域内作答,解答时应写出文字
说明、证明过程或演算步骤。
17.(2023·广东惠州·统考模拟预测)某地经过多年的环境治理,已将荒山改造成了绿水
青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部
横截面积(单位: )和材积量(单位: ),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总
和为 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区
这种树木的总材积量的估计值.
附:相关系数 .
18.(2023·山东临沂二模)某农科所统计了单位面积某种化肥实施量x(kg)和玉米相应
产量Y(kg)的相关数据,制作了数据对照表:
x(kg) 16 20 24 29 36
Y(kg) 340 350 362 404 454
若在合理施肥范围内x与Y具有线性相关关系,(1)求Y关于x的线性回归方程 ;
(2)请利用线性回归方程预测 时的玉米产量.
附:回归直线的斜率和截距的最小二乘法估计公式分别为: ,
.
19.(2023·广东汕头·统考一模)2023年1月14日,翘首以盼的汕头镇邦美食街开街啦!
近年来,汕头多措并举,提升汕头美食品牌,推动潮汕菜产业做大做强,镇邦美食街的建
成开街,是汕头美食产业的又一里程碑,同时“舌尖汕头”——汕头美食地图同步上线,
以微信小程序的形式面向游客,并通过意见反馈功能收集游客满意度调查问卷.
(1)现将游客按年龄段分为老中青三个群体,通过问卷数据分析显示,老年群体中有 的
游客给予好评,中年群体有 的游客给予好评,青年群体中有 的游客给予好评,且
老中青三个群体游客人数之比为 ,从这三个群体中随机抽取1名游客,求该游客给予
好评的概率.
(2)镇邦美食街共有 多家餐饮单位进驻,为维护市场价格秩序,营造公平竞争良好环境,
汕头市监管部门到镇邦美食街举办餐饮明码标价现场指导会,现针对明码标价指导会前、
会后游客满意度进行问卷回访调查,统计了 名游客的数据,列出如下 列联表:
对镇邦美食街餐饮价格是否满意 明码标价指导会前 明码标价指导会后 合计
满意 28 57 85
不满意 12 3 15
合计 40 60 100
请根据小概率值 的独立性检验判断游客对汕头镇邦美食街餐饮价格满意度与监管
部门举办明码标价现场指导会是否有关联.
▲参考公式: ,
0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828
20.(2023·黑龙江哈尔滨·哈尔滨三中校考二模)中国共产党第二十次全国代表大会上的
报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到
114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响
应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:
年份 2012 2013 2014 2015 2016
年份编号 1 2 3 4 5
地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6
(1)求出回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持
续增长,现对这11年的数据有三种经验回归模型 、 、
,它们的 分别为0.976、0.880和0.985,请根据 的数值选择最好的
回归模型预测一下2023年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为 ,结
合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式: , ;
21.(2023·山西运城·统考三模)数据显示中国车载音乐已步入快速发展期,随着车载音
乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022年中国车载音乐市场规
模(单位:十亿元),其中年份2018—2022对应的代码分别为1—5.
年份代码x 1 2 3 4 5
车载音乐市场规模y 2.8 3.9 7.3 12.0 17.0
(1)由上表数据知,可用指数函数模型 拟合y与x的关系,请建立y关于x的回归方
程(a,b的值精确到0.1);
(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,
请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音
乐市场规模.
参考数据:
1.94 33.82 1.7 1.6
其中 , .
参考公式:对于一组数据 ,其回归直线 的斜率和截距的
最小二乘法估计公式分别为 .
22.(2023·湖南永州·统考三模)为了精准地找到目标人群,更好地销售新能源汽车,某
4S店对近期购车的男性与女性各100位进行问卷调查,并作为样本进行统计分析,得到如
下列联表 :
购买新能源汽车(人数) 购买传统燃油车(人数)
男性
女性
(1)当 时,将样本中购买传统燃油车的购车者按性别采用分层抽样的方法抽取6人,
再从这6人中随机抽取3人调查购买传统燃油车的原因,记这3人中女性的人数为X,求X
的分布列与数学期望;
(2)定义 ,其中 为列联表中第i行第j列的实际
数据, 为列联表中第i行与第j列的总频率之积再乘以列联表的总频数得到的理论频数.基于小概率值 的检验规则:首先提出零假设 (变量X,Y相互独立〉,然后计算 的
值,当 时,我们推断 不成立,即认为X和Y不独立,该推断犯错误的概率不超
过 ;否则,我们没有充分证据推断 不成立,可以认为X和Y独立.根据 的计算公式,
求解下面问题:
(i)当 时,依据小概率值 的独立性检验,请分析性别与是否喜爱购买新能
源汽车有关;
(ⅱ)当 时,依据小概率值 的独立性检验,若认为性别与是否喜爱购买新能
源汽车有关,则至少有多少名男性喜爱购买新能源汽车?
附:
0.1 0.025 0.005
2.706 5.024 7.879