文档内容
第一篇 热点、难点突破篇
专题21 统计与统计案例(练)
【对点演练】
一、单选题
1.(2022秋·山西·高三校联考阶段练习)一种高产新品种水稻单株穗粒数 和土壤锌含量 有关,现整理并
收集了6组试验数据, (单位:粒)与土壤锌含量 (单位: )得到样本数据 ,
令 ,并将 绘制成如图所示的散点图.若用方程 对 与 的关系进行拟合,则( )
A. B.
C. D.
2.(2023春·河南新乡·高三校联考开学考试)在2022年某地销售的汽车中随机选取1000台,对销售价格与
销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:
(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000
台汽车中,销售价格在 内的车辆台数为( )A.800 B.600 C.700 D.750
3.(2023·浙江·永嘉中学校联考模拟预测)已知一组样本数据 , ,…, 的平均数为 ,由这组数据得
到另一组新的样本数据 , ,…, ,其中 ( ,2,…,10),则( )
A.两组样本数据的平均数相同
B.两组样本数据的方差不相同
C.两组样本数据的极差相同
D.将两组数据合成一个样本容量为20的新的样本数据,该样本数据的平均数为
4.(2023春·江苏常州·高三校联考开学考试)下表提供了某厂进行技术改造后生产产品过程中记录的产量
(单位: )与相应的生产能耗 (单位: 标准煤)的几组对应数据:
3 4 5 6
标准
3 4
煤
已知该厂技术改造前 产品的生产能耗为 标准煤,试根据以上数据求出的线性回归方程,预测该厂技术
改造后 产品的生产能耗比技术改造前降低了( )
附:在线性回归方程 中, ,其中 为样本平均值.
A. 标准煤 B. 标准煤
C. 标准煤 D. 标准煤
5.(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调
查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意
度评分的中位数、众数、平均数分别为a,b,c,则( )A. B. C. D.
6.(2023秋·浙江杭州·高三期末)冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超
过5人体温高于 ,则称没有发生群体性发热.根据下列连续7天体温高于 人数的统计量,能判定
该公司没有发生群体性发热的为( )
①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为 .
A.①③ B.③④ C.②③ D.②④
二、多选题
7.(2023·全国·高三专题练习)某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从
全校学生中抽取1000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全
体学生年度阅读书籍的情况,下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)( )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3600
8.(2023春·全国·高三竞赛)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若 是这组数据的上四分位数,则 可能为( )
A.126 B.127 C.128 D.129
9.(2023春·广东·高三统考开学考试)给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据 的平均数为2,方差为3,那么数据 , , 的平均数和方差分别为5,13
C.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定D.样本相关系数
10.(2022秋·山西运城·高三校考阶段练习)第一组样本数据: ,由这组数据得到第二组样本数据:
,其中 ,其中 为正数,则下列命题正确的是( )
A.当 时,两组样本数据的样本平均数不相同
B.第二组样本数据的样本极差是第一组的 倍
C.第二组样本数据的样本标准差是第一组的 倍
D.第二组样本数据的样本方差是第一组的 倍
【冲刺提升】
一、多选题
1.(2023春·江苏南京·高三校考开学考试)在某市高三年级举行的一次模拟考试中,某学科共有20000人参
加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作
为样本进行统计,样本容量为n.按照 的分组作出频率分布直方图如图
所示.其中,成绩落在区间 内的人数为16.则下列结论正确的是( )
A.样本容量
B.图中
C.估计该市全体学生成绩的平均分为70.6分
D.该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号
二、填空题
2.(2023春·湖南长沙·高三长郡中学校考阶段练习)已知甲、乙两组按从小到大顺序排列的数据:
甲组: 、 、 、 、 、 ;乙组: 、 、 、 、 、 .
若这两组数据的第 百分位数,第 百分位数分别对应相等,则 ___________.
3.(2023春·河北石家庄·高三校联考开学考试)湖北省中药材研发中心整合省农业科技创新中心、省创新联
盟相关资源和力量,为全省中药材产业链延链、补链、强链提供科技支撑,某科研机构研究发现,某品种中医
药的药物成分甲的含量x(单位:g与药物功效y(单位:药物单位)之间满足 ,检测这种药品一
个批次的6个样本,得到成分甲的含量x的平均值为5g,标准差为 g,则估计这批中医药的药物功效y的平
均值为___________药物单位.
三、解答题
4.(2023·全国·高三专题练习)为了让人民享受到更优质的教育服务,我国逐年加大对教育的投入.为了预
测2022年全国普通本科招生数,建立了招生数y(单位:万人)与时间变量t的三个回归模型.其中根据2001年
至2019年的数据(时间变量t的值依次取1,2,3,…,19)建立模型①: (决定系数 )和
模型②: =152.4+16.3t(相关系数 0.97,决定系数 ).根据2014年至2019年的数据(时间变量t
的值依次取1,2,3,…,6)建立模型③: =372.8+9.8t(相关系数 0.99,决定系数 ).
(1)可以根据模型①得到2022年全国普通本科招生数的预测值为597.88万人,请你分别利用模型②③,求2022
年全国普通本科招生数的预测值;
(2)你认为用哪个模型得到的预测值更可靠?说明理由(写出一个即可).
5.(2021·上海闵行·上海市七宝中学校考模拟预测)今年5月11日,国新办举行新闻发布会,介绍第七次全
国人口普查主要数据结果,会上通报,全国人口共141178万人,与2010年的133972万人相比,增加了7206
万人,增长5.38%,年平均增长率为0.53%.如图是我国历次人口普查全国人口(单位:亿人)及年均增长率.(1)由图中数据,计算从2000年到2010年十年间全国人口的年平均增长率 (精确到0.01%);并根据历次人
口普查数据指出全国人口数量的变化趋势;
(2)假设从2020年起,每十年的年平均增长率是一个等差数列,公差为 ,试根据图中数据计算从2040
年到2050年这十年间全国人口的增加量.(精确到万人)
6.(2023春·河北石家庄·高三石家庄二中校考开学考试)某中药企业计划种植 两种药材,通过大量考察
研究得到如下统计数据.药材A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:
年份 2018 2019 2010 2021 2022
年份编号 1 2 3 4 5
单价 (元/公斤) 18 20 23 25 29
药材 的收购价格始终为20元/公斤,其亩产量的频率分布直方图如下:
(1)若药材A的单价 (单位:元/公斤)与年份编号 间具有线性相关关系;请求出 关于 的回归直线方程,
并估计2024年药材A的单价;
(2)利用上述频率分布直方图估计药材B的平均亩产量(同一组数据用中点值为代表);(3)若不考虑其他因素影响,为使收益最大,试判断2024年该药企应当种植药材A还是药材B?并说明理由.
参考公式:回归直线方程 ,其中 .
7.(2023春·河南开封·高三统考开学考试)青少年近视问题备受社会各界广泛关注,某研究机构为了解学生
对预防近视知识的掌握情况,对某校学生进行问卷调查,并随机抽取200份问卷,发现其得分(满分:100
分)都在区间 中,并将数据分组,制成如下频率分布表:
分数
频率 0.15 0.25 m 0.30 0.10
(1)估计这200份问卷得分的平均值(同一组中的数据用该组区间的中点值代表);
(2)用分层抽样的方法从这200份问卷得分在 , , 内的学生中抽取6人,再从这6人中
随机抽取3人进行调查,求这3人来自不同组(3人中没有2人在同一组)的概率.
8.(2023秋·江苏苏州·高三统考期末)新能源汽车作为战略性新兴产业,代表汽车产业的发展方向,发展新
能源汽车,对改善能源消费结构、减少空气污染、推动汽车产业和交通运输行业转型升级具有积极意义,经过
十多年的精心培育,我国新能源汽车产业取得了显著成绩,产销量连续四年全球第一,保有量居全球首位.
(1)已知某公司生产的新能源汽车电池的使用寿命 (单位:万公里)服从正态分布 ,问:该公司每
月生产的2万块电池中,大约有多少块电池的使用寿命可以超过68万公里?
参考数据:若随机变量 ,则 , ,
.
(2)下表给出了我国2017~2021年新能源汽车保有量y(单位:万辆)的数据.
年份 2017 2018 2019 2020 2021
年份代码x 1 2 3 4 5
新能源汽车保有量y 153 260 381 492 784经计算,变量 的样本相关系数 ,变量 与 的样本相关系数 .
①试判断 与 哪一个更适合作为 与 之间的回归方程模型?
②根据①的判断结果,求出 关于 的回归方程(精确到0.1),并预测2023年我国新能源汽车保有量.
参考数据:令 ( ),计算得 , , , .
参考公式:在回归方程 中, , .
9.(2023·重庆沙坪坝·重庆南开中学校考模拟预测)党的二十大报告提出:“必须坚持科技是第一生产力、人
才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域
新赛道,不断塑造发展新动能新优势.”某数字化公司为加快推进企业数字化进程,决定对其核心系统DAP,采
取逐年增加研发人员的办法以提升企业整体研发和创新能力.现对2018~2022年的研发人数作了相关统计(年
份代码1~5分别对应2018~2022年)如下折线图:
10.(2023秋·广东深圳·高三统考期末)某学校有学生1000人,其
中男生600人,女生400人.为了解学生的体质健康状况,按照性别采用分层抽样的方法抽取100人进行体质测
试.其中男生有50人测试成绩为优良,其余非优良;女生有10人测试成绩为非优良,其余优良.
(1)请完成下表,并依据小概率值 的 独立性检验,分析抽样数据,能否据此推断全校学生体质测试的
优良率与性别有关.
体质测试
性别 合计
优良 非优良
男生
女生合计
(2)100米短跑为体质测试的项目之一,已知男生该项成绩(单位:秒)的均值为14,方差为1.6;女生该项成
绩的均值为16,方差为4.2,求样本中所有学生100米短跑成绩的均值和方差.
附: ,其中 .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
参考公式:
11.(2023·安徽·校联考模拟预测)举办亲子活动,不仅能促进家庭与幼儿园之间的合作,还能增进亲子之间
的感情,对促进幼儿园教育也具有重要作用.某幼儿园为了提高家长对该幼儿园举办亲子活动的满意度,随机
调查了80名家长,每名家长对该幼儿园举办的亲子活动给出满意和不满意的评价,得到的数据如下表:
不满
满意 合计
意
男家
40
长
女家
26
长
合计 42 80
(1)补充完整上面的列联表,并分别估计男、女家长对该幼儿园举办的亲子活动满意的概率;
(2)能否有99.5%的把握认为男、女家长对该幼儿园举办的亲子活动的评价有差异?
参考公式: ,其中 .
参考数据:
0.10 0.05 0.010 0.005
2.706 3.841 6.635 7.87912.(2023春·河南·高三商丘市回民中学校联考开学考试)某校近期举行了“2022年新闻时事知识竞赛”,现
在随机抽查参赛的200名学生的得分(满分100分),按照 , , , , ,
, 制作成如图所示的频率分布直方图,已知 成等差数列.
(1)求出 的值,并计算参赛得分在 的学生人数;
(2)学校为进一步了解学生对新闻时事获取的途径,准备从得分在 与 的学生中按分层抽样的方
法抽出6名学生,然后从中再选出2名学生交流新闻时事获取的途径,求这2人中恰有1人的得分在 内
的概率.