文档内容
【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)
第 48 讲 用样本估计总体(精讲)
题型目录一览
①样本数字特征的计算及其应用
②频率分布直方图及其应用
③百分位数
一、知识点梳理
一、样本的数字特征
1.众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平
均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数: 个样本数据 的平均数为 ,反应一组数据的平均水平,公式
变形: .
2.标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用 表示.假设样本数据是 ,
表示这组数据的平均数,则标准差 .
(2)方差:方差就是标准差的平方,即 .显然,在刻画样本数据
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;
标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.二、频率分布直方图
1.频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为 ,利用 左(右)侧矩形面积之和等
于 ,即可求出 .
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和,即有 ,其中 为每个小长方形底边的中点, 为每个小长
方形的面积.
三、百分位数
1.定义
一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少
有 的数据大于或等于这个值.
2.计算一组 个数据的的第 百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算 .
(3)若 不是整数而大于 的比邻整数 ,则第 百分位数为第 项数据;若 是整数,则第 百分位数为
第 项与第 项数据的平均数.
3.四分位数
我们之前学过的中位数,相当于是第 百分位数.在实际应用中,除了中位数外,常用的分位数还有第
百分位数,第 百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位
数.
【常用结论】
均数、方差的性质:如果数据 的平均数为 ,方差为 ,那么
①一组新数据 的平均数为 ,方差是 .
②一组新数据 的平均数为 ,方差是 .③一组新数据 的平均数为 ,方差是 .
题型 一 样本数字特征的计算及其应用
二、题型分类精讲
策略方法 利用样本的数字特征解决决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大
小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散
程度越小,越稳定.
(2)方差的简化计算公式:s2=[(x+x+…+x)-nx2],或写成s2=(x+x+…+x)-x2,即方差等
于原数据平方的平均数减去平均数的平方.
【典例1】某稻谷试验田试种了 , 两个品种的水稻各10亩,并在稻谷成熟后统计了这20亩地的稻谷
产量如下表,记 , 两个品种各10亩产量的平均数分别为 和 ,方差分别为 和 .
(单位: 7
60 63 50 76 71 85 63 63 64
) 5
7
(单位: ) 56 62 60 68 78 75 62 63 70
6
(1)分别求这两个品种产量的极差和中位数;
(2)求 , , , ;
(3)依据以上计算结果进行分析,推广种植 品种还是 品种水稻更合适.
【答案】(1)极差: 产品为35, 产品为22,中位数: 产品为63.5, 产品为65.5;
(2) ; , ;
(3)推广 品种水稻更合适.
【分析】(1)根据中位数以及极差的计算公式即可求解,
(2)根据平均数和方差的计算公式即可求解,
(3)由平均数相同,方差越小越稳定即可求解.
【详解】(1)由表中数据可知, 产品的产量从小到大排列为 ,故 产品
的极差为 ,中位数为产品的产量从小到大排列为 , 产品极差为 ,中位数位
;
(2)由题意: ,
,
,
;
(3)结合第(2)问可知 , 两个品种水稻的产量平均数一样,但是 的方差较小,较稳定,所以推广
品种水稻更合适.
【题型训练】
一、单选题
1.某校举行演讲比赛,9位评委分别给出一名选手的原始评分,评定该选手的成绩时,从9个原始评分中
去掉一个最低分和一个最高分,得到7个有效评分,则这7个有效评分与9个原始评分相比,不变的数字
特征是( )
A.平均数 B.众数 C.中位数 D.方差
【答案】C
【分析】根据平均数、中位数、众数和方差的意义判断
【详解】根据平均数、中位数、众数和方差的意义,从9个原始评分中去掉一个最低分和一个最高分,得
到7个有效评分,不论是7个有效评分,还是9个原始评分,中间位置的评分不变,
所以不变的数字特征为中位数,
故选:C
2.每年的4月23日是世界读书日,某中学为了了解八年级学生的读书情况,随机调查了50名学生读书的
册数,统计数据如表所示:
册
0 1 2 3 4
数
人 1
3 13 16 1
数 7则这50名学生读书册数的众数、中位数是( )
A.3,3 B.2,2 C.2,3 D.3,2
【答案】D
【分析】利用众数,中位数的定义,即可得出答案.
【详解】 这组样本数据中,3出现了17次,出现的次数最多,
这组数据的众数是3;
将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是2,
这组数据的中位数为2;
故选:D.
3.有一组样本数据 ,则( )
A.这组样本数据的极差不小于4 B.这组样本数据的平均数不小于4
C.这组样本数据的中位数不小于3 D.这组样本数据的众数等于3
【答案】A
【分析】根据极差、平均数、中位数和众数的概念判断即可.
【详解】样本数据 中,
对于A,显然这组样本数据的极差大于等于 ,故A正确;
对于B,若 ,则平均数为 ,故B错误;
对于C,若 ,则 中位数为 ,故C错误;
对于D,若 ,则 众数为 ,故D错误.
故选:A
4.PM2.5是衡量空气质量的重要指标,下图是某地6月1日至10日的PM2.5日均值(单位: )的
折线图,则下列关于这10天中PM2.5日均值的说法错误的是( )A.众数为30 B.中位数为31.5 C.平均数小于中位数D.极差为109
【答案】C
【分析】根据折线图,由众数,中位数,平均数,极差等概念及公式,逐项判断,即可得出结果.
【详解】众数即是出现次数最多的数字,由折线图可得,众数为30,即A正确;
将折线图中数字由小到大依次排序,得到:17,25,30,30,31,32,34,38,42,126;
处在中间位置的数字是:31,32,因此中位数为 ,即B正确;
由折线图可得,平均数为: ,故C错;
根据极差概念, 故D正确.
故选:C.
5.为了解某班学生数学学习的情况,连续进行了六次考试,甲同学与乙同学的考试成绩情况如下表,则
以下叙述正确的是( )
次数 1 2 3 4 5 6
10
甲同学成绩/分 135 108 136 136 116
4
12
乙同学成绩/分 116 123 120 121 132
4
A.甲同学成绩的极差低于乙同学成绩的极差
B.甲同学的平均成绩高于乙同学的平均成绩
C.甲同学成绩的众数为136,乙同学成绩的中位数为122
D.甲同学成绩的波动幅度低于乙同学成绩的波动幅度
【答案】C
【分析】根据表格中的数据,结合极差、平均数的计算公式,众数与中位的概念,以及数据的波动性,逐项判定,即可求解.
【详解】对于选项A,甲同学成绩的极差为 ,乙同学成绩的极差为 ,所以甲同
学成绩的极差高于乙同学成绩的极差,所以A错误;
对于选项B,甲同学的平均成绩为 ,
乙同学的平均成绩为 ,
所以甲同学的平均成绩低于乙同学的平均成绩,所以B错误;
对于选项C,甲同学成绩的众数为 ,乙同学成绩的中位数为 ,所以C正确;
对于选项D,可以观察出甲同学成绩的波动幅度高于乙同学成绩的波动幅度,所以D错误.
故选:C.
6.四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可以判断出一定没
有出现点数6的是( )
A.平均数为2,方差为2.4 B.中位数为3,方差为1.6
C.中位数为3,众数为2 D.平均数为3,中位数为2
【答案】A
【分析】A选项,有平均数与方差间关系,可判断选项正误;BCD选项,通过举反例可判断选项正误.
【详解】A选项,若5次结果中有6,因平均数为2,
则方差 ,因 ,
则当平均数为2,方差为2.4时一定不会出现点数6,故A正确;
B选项,取5个点数为3,3,3,5,6,则此时满足中位数为3,平均数为4,
则方差 ,故B错误;
C选项,取5个点数为2,2,3,5,6,满足中位数为3,众数为2,故C错误;
D选项,取5个点数为1,1,2,5,6,满足中位数为2,平均数为3,故D错误.
故选:A
7.“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文
精神,华强实验中学高一(2)班组织了甲乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每
天宣传的次数绘制成如下频数分布折线图,则以下说法不正确的为( )A.甲的众数小于乙的众数 B.乙的极差小于甲的极差
C.甲的方差大于乙的方差 D.乙的平均数大于甲的平均数
【答案】D
【分析】根据已知条件,结合众数、极差的定义,以及方差和平均数公式,即可求解.
【详解】由图可知,甲志愿者的宣传次数分别为:4,5,6,3,4,3,3,
乙志愿者的宣传次数分别为:5,4,4,5,4,3,3,
甲的平均数为 ,
乙的平均数为 ,故D错误,
甲的众数为3,乙的众数为4,故甲的众数小于乙的众数,故A正确;
甲的极差为3,乙的极差为2,则乙的极差小于甲的极差,故B正确;
甲的方差为 ,
乙的方差为 ,
故甲的方差大于乙的方差,故C正确.
故选:D.
8.新能源汽车近年在我国发展迅猛,无论是外观还是性能都有了较大进步,下表显示的是 两款新能
源汽车连续五次的实际续航里程(二者测量条件相同),则下列结论错误的是( )
360 350 310 350 380
320 360 330 350 390
A.A款车型续航里程的众数为350B. 款车型续航里程的极差为70
C.两款车型续航里程的平均数相等
D.A款车型比 款车型续航里程的方差较大
【答案】D
【分析】根据题意结合统计的相关知识逐项分析判断.
【详解】将 两组数据按升序排列可得: , ,
可得A款车型续航里程的众数为350,故A正确;
款车型续航里程的极差为 ,故B正确;
A款车型续航里程的平均数为 ,
B款车型续航里程的平均数为 ,
所以两款车型续航里程的平均数相等,故C正确;
A款车型续航里程的方差为 ,
B款车型续航里程的方差为 ,
所以 ,即A款车型比 款车型续航里程的方差较小,故D错误;
故选:D.
二、多选题
9.下列说法正确的是( )
A.抽样调查具有花费少、效率高的特点
B.数据 , , , , , 的中位数为 ,众数为 和
C.极差和标准差都能描述一组数据的离散程度
D.数据 , , , 的方差为 ,则数据 , , , 的方差为
【答案】AC
【分析】根据抽样调查的特点判断A,将数据从小到大排列求出中位数与众数,即可判断B,根据方差、
标准差的定义判断C,根据方差的性质判断D.
【详解】对于A:抽样调查相比全面调查具有花费少、效率高的特点,故A正确;对于B:数据从小到大排列为 、 、 、 、 、 ,所以中位数为 ,众数为 和 ,故B错误;
对于C:极差和标准差都能描述一组数据的离散程度,故C正确;
对于D:数据 的方差为 ,则数据 的方差为 ,故D错误;
故选:AC
10.据中国汽车工业协会统计分析,2022年10月份,我国国产品牌乘用车销售了118.7万辆,市场占有率
延续良好势头,份额超过50%.下图是2021年1月份至2022年10月份这22个月我国国产品牌乘用车月度
销量及增速变化情况的统计图,则(同比:和去年同期相比)( )
A.2021年国产品牌乘用车月度平均销量超过60万辆
B.2022年前10个月国产品牌乘用车月度销量的同比增长率均为正数
C.2022年前9个月国产品牌乘用车月度销量的中位数为5月份的销量数据
D.2022年前10个月我国国产品牌乘用车月度销量的极差超过58.7万辆
【答案】AD
【分析】根据平均数的概念判断A,根据图中数据判断B,根据中位数的概念判断C,根据图中数据及极
差的概念判断D.
【详解】由条形统计图可知,在2021年的月度销量数据中,只有2月份的销量低于60万辆,
且有多个月的销量达到80万辆以上,故2021年国产品牌乘用车月度平均销量超过60万辆,A正确;
由折线统计图可知,2022年4月份的同比增长率为负数,B错误;
将2022年前9个月的销量数据由小到大排列,可知5月份的销量排在第3位,故该数据不可能为中位数,
C错误;
2022年前10个月销量最大的月份为10月份,销量为118.7万辆,销量最小的月份为4月份,且销量数据
低于60万辆,故极差超过 万辆,D正确.
故选:AD.11.举世瞩目的第19届亚运会于9月23日至10月8日在杭州举行,亚运会点燃了国人激情,也将一股运
动风吹到了大学校园.为提升学生身体素质,倡导健康生活方式,某大学社团联合学生会倡议全校学生参与
“每日万步行”健走活动.下图为该校甲、乙两名同学在同一星期内每日步数的拆线统计图,则( )
A.这一星期内甲、乙的日步数的中位数都为12600
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的方差大于甲的日步数的方差
D.这一星期内乙的日步数的下四分位数是12200
【答案】ABD
【分析】根据折线图得到这一星期内甲,乙的日步数,都从小到大进行排列,得到中位数后即可判断选项
;根据平均数计算公式,计算出这一星期内甲,乙的日步数的平均数,比较大小即可判断选项 ;根据
图象观察甲的波动程度较大,故方差较大,从而判断选项 ;
把乙一星期内的步数从小到大进行排列,并计算 ,故第二个数为所求,即可判断选项 .
【详解】由折线图可得甲一星期内的步数从小到大的排列为:
11000,11800,12200,12600,13500,15400,18200,所以中位数为12600;
由折线图可得乙一星期内的步数从小到大的排列为:
11800,12200,12400,12600,15000,13800,14000,所以中位数为12600,
故这一星期内甲、乙的日步数的中位数都为12600, 正确;
这一星期内甲的日步数的平均数为: ,
这一星期内乙的日步数的平均数为:
,
因为 ,故 正确;由图知,甲的波动程度较大,故方差较大,故 错误;
乙一星期内的步数从小到大的排列为:
11800,12200,12400,12600,15000,13800,14000,
,故这一星期内乙的日步数的下四分位数是12200,故 正确;
故选:
12.袋子中有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取5次,每次取一个球.
记录每次取到的数字,统计后发现这5个数字的平均数为2,方差小于1,则( )
A.可能取到数字4 B.中位数可能是2
C.极差可能是4 D.众数可能是2
【答案】BD
【分析】对于AC:根据题意结合平均数、方差和极差的定义分析判断;对于BD:举例说明即可.
【详解】设这5个数字为 ,
对于A:若取到数字4,不妨设为 ,
则 ,可得 ,
可知这4个数中至少有2个1,不妨设为 ,
则这5个数字的方差
,
不合题意,故A错误;
对于C:因为这5个数字的平均数为2,这5个数字至少有1个1,不妨设为 ,
若极差是4,这最大数为5,不妨设为 ,
则这5个数字的平均数 ,
则 ,可知这3个数有2个1,1个2,
此时这5个数字的方差 ,不合题意,故C错误;
对于BD:例如2,2,2,2,2,可知这5个数字的平均数为2,方差为0,符合题意,
且中位数是2,众数是2,故BD正确;
故选:BD.
三、填空题
13.已知一组数据丢失了其中一个,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与
众数的和是中位数的2倍,则丢失的数据可能是 .(答案不唯一,写出一个即可)
【答案】 10(或4或18)
【分析】设丢失的数据为x,众数是3,然后分x≤3,3