文档内容
【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)
第 48 讲 用样本估计总体(精讲)
题型目录一览
①样本数字特征的计算及其应用
②频率分布直方图及其应用
③百分位数
一、知识点梳理
一、样本的数字特征
1.众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平
均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数: 个样本数据 的平均数为 ,反应一组数据的平均水平,公式
变形: .
2.标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用 表示.假设样本数据是 ,
表示这组数据的平均数,则标准差 .
(2)方差:方差就是标准差的平方,即 .显然,在刻画样本数据
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;
标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.二、频率分布直方图
1.频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为 ,利用 左(右)侧矩形面积之和等
于 ,即可求出 .
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和,即有 ,其中 为每个小长方形底边的中点, 为每个小长
方形的面积.
三、百分位数
1.定义
一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少
有 的数据大于或等于这个值.
2.计算一组 个数据的的第 百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算 .
(3)若 不是整数而大于 的比邻整数 ,则第 百分位数为第 项数据;若 是整数,则第 百分位数为
第 项与第 项数据的平均数.
3.四分位数
我们之前学过的中位数,相当于是第 百分位数.在实际应用中,除了中位数外,常用的分位数还有第
百分位数,第 百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位
数.
【常用结论】
均数、方差的性质:如果数据 的平均数为 ,方差为 ,那么
①一组新数据 的平均数为 ,方差是 .
②一组新数据 的平均数为 ,方差是 .③一组新数据 的平均数为 ,方差是 .
题型 一 样本数字特征的计算及其应用
二、题型分类精讲
策略方法 利用样本的数字特征解决决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大
小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散
程度越小,越稳定.
(2)方差的简化计算公式:s2=[(x+x+…+x)-nx2],或写成s2=(x+x+…+x)-x2,即方差等
于原数据平方的平均数减去平均数的平方.
【典例1】某稻谷试验田试种了 , 两个品种的水稻各10亩,并在稻谷成熟后统计了这20亩地的稻谷
产量如下表,记 , 两个品种各10亩产量的平均数分别为 和 ,方差分别为 和 .
(单位: 7
60 63 50 76 71 85 63 63 64
) 5
7
(单位: ) 56 62 60 68 78 75 62 63 70
6
(1)分别求这两个品种产量的极差和中位数;
(2)求 , , , ;
(3)依据以上计算结果进行分析,推广种植 品种还是 品种水稻更合适.
【题型训练】
一、单选题
1.某校举行演讲比赛,9位评委分别给出一名选手的原始评分,评定该选手的成绩时,从9个原始评分中
去掉一个最低分和一个最高分,得到7个有效评分,则这7个有效评分与9个原始评分相比,不变的数字
特征是( )
A.平均数 B.众数 C.中位数 D.方差
2.每年的4月23日是世界读书日,某中学为了了解八年级学生的读书情况,随机调查了50名学生读书的
册数,统计数据如表所示:
册
0 1 2 3 4
数人 1
3 13 16 1
数 7
则这50名学生读书册数的众数、中位数是( )
A.3,3 B.2,2 C.2,3 D.3,2
3.有一组样本数据 ,则( )
A.这组样本数据的极差不小于4 B.这组样本数据的平均数不小于4
C.这组样本数据的中位数不小于3 D.这组样本数据的众数等于3
4.PM2.5是衡量空气质量的重要指标,下图是某地6月1日至10日的PM2.5日均值(单位: )的
折线图,则下列关于这10天中PM2.5日均值的说法错误的是( )
A.众数为30 B.中位数为31.5 C.平均数小于中位数D.极差为109
5.为了解某班学生数学学习的情况,连续进行了六次考试,甲同学与乙同学的考试成绩情况如下表,则
以下叙述正确的是( )
次数 1 2 3 4 5 6
10
甲同学成绩/分 135 108 136 136 116
4
12
乙同学成绩/分 116 123 120 121 132
4
A.甲同学成绩的极差低于乙同学成绩的极差
B.甲同学的平均成绩高于乙同学的平均成绩
C.甲同学成绩的众数为136,乙同学成绩的中位数为122
D.甲同学成绩的波动幅度低于乙同学成绩的波动幅度
6.四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可以判断出一定没有出现点数6的是( )
A.平均数为2,方差为2.4 B.中位数为3,方差为1.6
C.中位数为3,众数为2 D.平均数为3,中位数为2
7.“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文
精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每
天宣传的次数绘制成如下频数分布折线图,则以下说法不正确的为( )
A.甲的众数小于乙的众数 B.乙的极差小于甲的极差
C.甲的方差大于乙的方差 D.乙的平均数大于甲的平均数
8.新能源汽车近年在我国发展迅猛,无论是外观还是性能都有了较大进步,下表显示的是 两款新能
源汽车连续五次的实际续航里程(二者测量条件相同),则下列结论错误的是( )
360 350 310 350 380
320 360 330 350 390
A.A款车型续航里程的众数为350
B. 款车型续航里程的极差为70
C.两款车型续航里程的平均数相等
D.A款车型比 款车型续航里程的方差较大
二、多选题
9.下列说法正确的是( )
A.抽样调查具有花费少、效率高的特点
B.数据 , , , , , 的中位数为 ,众数为 和
C.极差和标准差都能描述一组数据的离散程度D.数据 , , , 的方差为 ,则数据 , , , 的方差为
10.据中国汽车工业协会统计分析,2022年10月份,我国国产品牌乘用车销售了118.7万辆,市场占有率
延续良好势头,份额超过50%.下图是2021年1月份至2022年10月份这22个月我国国产品牌乘用车月度
销量及增速变化情况的统计图,则(同比:和去年同期相比)( )
A.2021年国产品牌乘用车月度平均销量超过60万辆
B.2022年前10个月国产品牌乘用车月度销量的同比增长率均为正数
C.2022年前9个月国产品牌乘用车月度销量的中位数为5月份的销量数据
D.2022年前10个月我国国产品牌乘用车月度销量的极差超过58.7万辆
11.举世瞩目的第19届亚运会于9月23日至10月8日在杭州举行,亚运会点燃了国人激情,也将一股运
动风吹到了大学校园.为提升学生身体素质,倡导健康生活方式,某大学社团联合学生会倡议全校学生参与
“每日万步行”健走活动.下图为该校甲、乙两名同学在同一星期内每日步数的拆线统计图,则( )
A.这一星期内甲、乙的日步数的中位数都为12600
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的方差大于甲的日步数的方差
D.这一星期内乙的日步数的下四分位数是1220012.袋子中有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取5次,每次取一个球.
记录每次取到的数字,统计后发现这5个数字的平均数为2,方差小于1,则( )
A.可能取到数字4 B.中位数可能是2
C.极差可能是4 D.众数可能是2
三、填空题
13.已知一组数据丢失了其中一个,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与
众数的和是中位数的2倍,则丢失的数据可能是 .(答案不唯一,写出一个即可)
14.幸福指数是衡量人们对自身生存和发展状况的感受和体验,即人们的幸福感的一种指数.某机构从某
社区随机调查了10人,得到他们的幸福指数(满分:10分)分别是7.6,8.5,7.8,9.2,8.1,9,7.9,
9.5,8.3,8.8,则这组数据的中位数是
15.国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,某市在2020年间经济高
质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个季度GDP的中位数与
平均数相等,则2020年GDP总额为 ;
16.我国关于人工智能领域的研究十分密集,发文量激增,在视觉、语音、自然语言处理等基础智能任务
实现全球领先,并且拥有一批追求算法技术极致优化的人工智能企业,如图是过去十年人工智能领域高水
平论文发表量前十国家及发表的论文数.现有如下说法:
①这十个国家的论文发表数量平均值为0.87;
②这十个国家的论文发表数量的中位数为0.4;
③这十个国家的论文发表数量的众数为0.4;
④德国发表论文数量约占美国的32%.
其中正确的是 .(填序号)
17.如图是甲、乙两人在射击测试中6次命中环数的折线图,下列说法正确的是 .①若甲、乙射击成绩的平均数分别为 ,则
②若甲、乙射击成绩的方差分别为 ,则
③乙射击成绩的中位数小于甲射击成绩的中位数
④乙比甲的射击成绩稳定
题型 二 频率分布直方图及其应用
策略方法 频率、频数、样本容量的计算方法
(1)×组距=频率.
(2)=频率,=样本容量,样本容量×频率=频数.
【典例1】(单选题)南京大学开展数学建模选拔赛,对参赛的100名学生的得分情况进行统计,并绘制
了如图所示的频率分布直方图(每组为左闭右开的区间),根据图中信息,下列说法错误的是( )
A.图中的 值为0.020
B.得分在70分及以上的人数为75
C.这组数据的平均数的估计值为76(同一组中的数据用该组区间的中点值代表)
D.这组数据的中位数的估计值为78
【题型训练】一、单选题
1.某地发起“寻找绿色合伙人——低碳生活知识竞赛”活动,选取了 人参与问卷调查,将他们的成绩进
行适当分组后(每组为左闭右开的区间),得到如图所示的频率分布直方图,且成绩落在 的人数
为10,则 ( )
A.60 B.80 C.100 D.120
2.某机构对 名网络购物者 年度的消费情况进行统计,发现消费金额(单位:万元)都在
内,其频率分布直方图如图所示,则这 名购物者消费金额的平均数约为(同一组中的数据用
该组区间的中点值作代表)( )
A. (万元) B. (万元)
C. (万元) D. (万元)
3.要调查某地区高中学生身体素质,从高中生中抽取 人进行跳远测试,根据测试成绩制作频率分布直
方图如图,现从成绩在 之间的学生中用分层抽样的方法抽取 人,应从 间抽取人数为 ,
则( ).A. , B. ,
C. , D. ,
4.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图
如图所示,由于不慎将部分数据丢失,但知道后5组的频数和为64,最大频率为 ,设视力在 到
之间的学生人数为a,则a的值为( )
A.27 B.48 C.54 D.64
5.2023年考研成绩公布不久,对某校“软件工程”专业参考的200名考生的成绩进行统计,可以得到如
图所示的频率分布直方图,其中分组的区间为 , , , ,同一组中的
数据用该组区间的中间值作代表值,则下列说法中不正确的是( )A.这200名学生成绩的众数为370分
B.这200名学生成绩的平均分为377分
C.这200名学生成绩的70%分位数为386分
D.这200名学生成绩在 中的学生有30人
6.工厂为了了解某车间的生产效率,对该车间200名工人上月生产的产品数量(单位:件)进行抽样调查,
整理得到如图的频率分布直方图,则下列估计正确的为( )
①该车间工人上月产量的极差恰好为50件;
②车间约有120名工人上月产量低于65件;
③该车间工人上月产量的平均数低于64件;
④该车间工人上月产量的中位数低于63件.
A.①③ B.①④ C.②③ D.②④
7.某校为了解学生体能素质,随机抽取了100名学生进行体能测试,并将这100名学生成绩整理得如下频
率分布直方图.根据此频率分布直方图,下列结论中正确的是( )
A.图中
B.这100名学生中成绩在 内的人数为50
C.这100名学生成绩的中位数为70
D.这100名学生的平均成绩为68.2(同一组中的数据用该组区间的中点值做代表)
8.某科技学校组织全体学生参加了主题为“创意致匠心,技能动天下”的文创大赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组的取值区间均为
左闭右开),画出频率分布直方图(如图),下列说法错误的是( )
A.在被抽取的学生中,成绩在区间 内的学生有160人
B.图中x的值为0.020
C.估计全校学生成绩的中位数约为86.7
D.这400名学生中成绩在80分及以上的人数占
二、多选题
9.实践育人是落实立德树人根本任务的重要环节,是培养担当民族复兴大任时代新人的有效途径.某研
究性学习小组为了解某校2000名学生参加2023年暑期社会实践的情况,通过分层抽样的方法抽取一个容
量为N的样本,对学生某一天社会实践的时间(单位:分钟)进行统计,得到样本的频率分布直方图如图
所示.己知样本中 的人数为20人,则以下说法正确的是( )
A.
B.
C.估计该样本数据的平均数为74
D.估计全校社会实践时间在60分钟以上的学生约为180人
10.从树人小学二年级学生中随机抽取100名学生,将他们的身商(单位:cm)数据绘制成频率分布直方图如图,则( )
A.
B.估计树人小学这100名二年级学生的平均身高为124.5cm
C.估计树人小学这100名二年级学生的平均身高的中位数为122.5cm
D.估计树人小学这100名二年级学生的平均身高的众数为120cm
11.在一次考试中,某地抽取一组样本,将学生的考分按 , ,…, 分成10组,得到
如下频率分布直方图:
根据频率分布直方图,则下列结论正确的是( )
A.规定分数不低于60分为及格,则及格率为0.6
B.样本的中位数为60
C.以频率作为概率,每组数据区间中点作代表,估计该地此次考试的平均分为60分
D.规定此次考试80%的考生定为合格等级,则合格等级的学生最低分为40分
三、填空题
12.某大学有男生 名.为了解该校男生的身体体重情况,随机抽查了该校 名男生的体重,并将这
名男生的体重(单位: )分成以下六组: 、 、 、 、 、 ,
绘制成如下的频率分布直方图:该校体重(单位: )在区间 上的男生大约有 人.
13.在某地区进行流行病学调查,随机调查了200位某种疾病患者的年龄,得到了如图的样本数据的频率
分布直方图,根据图中信息估计该地区这种疾病患者的年龄位于 的概率为 .
14.如图是某班一次数学测试成绩的茎叶图(图中仅列出 , 的数据)和频率分布直方图,
则 .
15.设某组数据均落在区间 内,共分为 , , , , 五组,对应
频率分别为p,p,p,p,p.已知依据该组数据所绘制的频率分布直方图为轴对称图形,且
1 2 3 4 5,则该组数据的平均数为 .
题型 三 百分位数
策略方法 百分位数有关问题的一般思路
计算一组 个数据的的第 百分位数的步骤
①按从小到大排列原始数据.
②计算 .
③若 不是整数而大于 的比邻整数 ,则第 百分位数为第 项数据;若 是整数,则第 百
分位数为第 项与第 项数据的平均数.
【典例1】(单选题)某校高一年级 个班参加朗诵比赛的得分如下: , , , , , , ,
, , , , , , , ,则这组数据的 分位数、 分位数分别为( )
A. , B. , C. , D. ,
【题型训练】
一、单选题
1.树人中学举办以“喜迎二十大、永远跟党走、奋进新征程”为主题的演讲比赛,其中9人比赛的成绩为:
85,86,88,88,89,90,92,94,98(单位:分),则这9人成绩的第80百分位数是( )
A.89 B.90 C.92 D.94
2.一组数据按从小到大的顺序排列为2,4, ,13,16,17,若该组数据的中位数是极差的 ,则该组
数据的40百分位数是( )
A.4 B.4.5 C.5 D.9
3.一组数据按从小到大的顺序排列如下: ,经计算,该组数据中位数是16,若
分位数是20,则 ( )
A.33 B.34 C.35 D.36
4.从2,3,4,5,6,7,8,9中随机取一个数,这个数比m大的概率为 ,若m为上述数据中的第x百
分位数,则x的取值可能为( )
A.50 B.60 C.70 D.80
5.为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了该地区1000名学生每天进行体育运动的时间,按照时长(单位:分钟)分成6组:第一组[30,40 ,第二组[40,50 ,第三组[50,60 ,
第四组[60,70 ,第五组[70,80 ,第六组[80,90],经整理得到如图的频率分布直方图,则可以估计该地区学
生每天体育活动时间的第70百分位数位于的区间为( )
A.[50,60 B.[60,70
C.[70,80 D.[80,90]
6.按从小到大顺序排列的两组数据:甲组:27,31,37,m,42,49;乙组:24,n,33,44,48,52,
若这两组数据的第30百分位数、第50百分位数都分别对应相等,则 ( )
A.60 B.65 C.70 D.71
7.某校举办歌唱比赛,将200名参赛选手的成绩整理后画出频率分布直方图如图,根据频率分布直方图,
第40百分位数估计为( )
A.64 B.65 C.66 D.67
二、多选题
8.已知10个数据的第75百分位数是31,则下列说法正确的是( )
A.这10个数据中至少有8个数小于或等于31
B.把这10个数据从小到大排列后,第8个数据是31
C.把这10个数据从小到大排列后,第7个与第8个数据的平均数是31
D.把这10个数据从小到大排列后,第6个与第7个数据的平均数是319.某校组织了 名学生参与测试,随机抽取了 名学生的考试成绩 单位:分 ,成绩的频率分布直方
图如图所示,则下列说法正确的是( )
A.图中 的值为
B.估计这 名学生考试成绩的众数为
C.估计这 名学生考试成绩的中位数为
D.估计这 名学生考试成绩的上四分位数约为
10.小明在今年“十一”假期随家人到杭州游玩,恰逢亚运盛会,在10月2日下午女子跳水1米板决赛开
赛前,小明随机调查了若干名前来观看本场比赛观众的年龄,并将调查所得数据制作成了如图所示的饼图,
则关于这组数据的说法正确的是( )
A.平均数约为38.6 B.中位数约为38.75
C.第40百分位数约为35.6 D.上四分位数约为42.6
三、填空题
11.某党支部理论学习小组抽取了10位党员在该学习平台的学习成绩如下:83,85,88,90,91,91,
92,93,96,97,则这10名党员学习成绩的 分位数为 .
12.某校为了普及“一带一路”知识,举行了一次知识竞赛,满分10分,有10名同学代表班级参加比赛,
已知学生得分均为整数,比赛结束后统计这10名同学得分情况如折线图所示,则这10名同学成绩的
分位数是 .13.商场为改进服务质量,提升顾客购物体验,从2023年第三季度消费过的顾客中随机抽取部分人进行满
意度问卷调查.并将这部分人满意度的得分分成以下6组: ,统计结果如图所
示.那么该商场顾客满意度得分的第60百分位数为 .
14.如图,是某一数据的频率分布直方图,则由图形中的数据,可知其75%分位数(上四分位数)的估计
值为 (保留2位小数)
15.军训中某人对目标靶进行8次射击,已知前7次射击分别命中7环、9环、7环、10环、8环、9环、6
环.若第8次射击结果不低于这8次射击环数的平均数且不高于这8次射击环数的75%分位数,则此人第8
次射击的结果可能是 环.(写出有一个符合题意的值即可)