文档内容
第 02 讲 用样本估计总体 (精讲)
目录
第一部分:知识点精准记忆
第二部分:课前自我评估测试
第三部分:典型例题剖析
题型一:百分位数的估计
题型二:总体集中趋势的估计
角度1:样本的数字特征
角度2:频率分布直方图中的数字特征
题型三:总体离散程度的估计
第四部分:高考真题感悟
第一部分:知 识 点 精 准 记 忆
知识点一:总体百分位数的估计
(1)第 百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这
个值,且至少有 的数据大于或等于这个值.
(2)计算一组 个数据的第 百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算 .
第3步,若 不是整数,而大于 的比邻整数为 ,则第 百分位数为第 项数据;若 是整数,则第 百分位数为
第 项与第 项数据的平均数.
知识点二:样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最
中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据 , , , 的平均数为
(4)标准差与方差
如 果 有 个 数 据 , , , 那 么 平 均 数 , 标 准 差 为 :
,方差:
知识点三:在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐
标之和.
知识点四:平均数,方差的线性关系:
第二部分:课 前 自 我 评 估 测 试
数据 平均数 方差
, , ,
, , ,
, , ,
, , ,
一、单选题
1.(2022·全国·高一单元测试)在样本的频率分布直方图中,一共有 个小矩形,第4个小矩形的面积等于其余( )个小矩形面积和的 ,则第4个小矩形对应的频率为( )
A.0.3 B.0.4 C.0.5 D.0.7
【答案】A
【详解】设第4个小矩形对应的频率为 ,则其余( )个小矩形对应的频率为 ,
所以 ,解得 .
故选:A.
2.(2022·全国·高一单元测试)下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分
位数是( )
班级得分 7 8 9 10 11 13 14
频数 2 1 2 3 1 2 1
A.11 B.10.5 C.9.5 D.9
【答案】D
【详解】 ,
把12个班级的得分按照从小到大排序为
7,7,8,9,9,10,10,10,11,13,13,14,
可得30百分位数是第4个得分数,即9.
故选:D
二、填空题
3.(2022·全国·高一单元测试)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60
百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)
【答案】 ##
【详解】因为 ,
所以这组数据的第5个数:50为第60百分位数.
观察易知这组数据的众数为50,
所以a和b的大小关系是 .
故答案为:
4.(2022·全国·高一课时练习)联合国《生物多样性公约》缔约方大会第十五次会议(COP15)在中国昆
明举行,全国30个城市联动举行了“2021COP15春城之邀——一粒来自昆明的种子”活动,活动特别准
备了2万份“神秘”花种盲盒,其中有一种花的植株高度的频率分布直方图如图所示,则这种花的植株高
度的众数约为______,中位数约为______.【答案】 45 45.8
【详解】由频率分布直方图,知频率最大的区间为 ,
所以众数为 .
因为 , ,
所以中位数在 内,设中位数为x,
则 ,解得 .
故答案为: ;
5.(2022·全国·高一单元测试)某电子商务公司对10000名网络购物者2021年度的消费情况进行统计,
发现每个人的消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.直方图中的
a=___________,在这些购物者中,平均消费金额约为___________万元.
【答案】 3 0.537##
【详解】由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得 ,
因此平均消费金额约为0.35×0.15+0.45×0.25+0.55×0.3+0.65×0.2+0.75×0.08+0.85×0.02=0.537(万元).
故答案为:3,0.537
第三部分:典 型 例 题 剖 析
题型一:百分位数的估计
典型例题
例题1.(2022·云南·弥勒四中高二开学考试)某校高一年级15个班参加合唱比赛,得分从小到大排序依次为: , ,则这组数据的 分位数是( )
A.90 B. C.86 D.93
【答案】B
【详解】因为 ,所以这组数据的 分位数是第12个数和第13个数的平均数,
即 ,
故选:B
例题2.(2022·全国·高一课时练习)某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他
们一周的课外锻炼时间进行了统计,统计数据如下表所示:
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时间的第40百分位数是( )
A.8.5 B.8 C.7 D.9
【答案】A
【详解】抽取的学生人数为 .由 ,
故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,
即 .
故选: A.
例题3.(2022·福建莆田·高一期末)按从小到大顺序排列的9个数据:10,16,25,33,39,43, ,
65,70,若这组数据的第一四分位数与第三四分位数的和是73,则 等于( )
A.40 B.48 C.50 D.57
【答案】B
【详解】对于已知 个数据: ,
, 第一四分位数为 ,
, 第三四分位数为 ,
,解得 .
故选:B.
例题4.(2022·山西长治·高一期末)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天
的浓度(单位: ),数据依次为53,56,69,70,72,79,65,80,45,41, .
已知这组数据的极差为40,则这组数据的第 百分位数为( )
A.71 B.75.5 C.79 D.72
【答案】C
【详解】由题意得,数据的极差为40,因为数据中最小值为41,
故m应为最大值,为81,则 ,
将数据53,56,69,70,72,79,65,80,45,41,81,
从小大大排列为:41,45, 53,56,65,69,70,72,79, 80, 81,
故这组数据的第m百分位数为79,
故选:C
同类题型归类练
1.(2022·湖北武汉·高三开学考试)某校高三数学备课组老师的年龄(单位:岁)分别为:28,29,42,
32,41,56,45.48,55,59,则这组数据的第80百分位数为( )
A.54.5 B.55 C.55.5 D.56
【答案】C
【详解】这10个数按从小到大顺序排列为:28,29,32,41,42,45,48,55,56,59,
,第8个数是55,第9个数是56,
因此第80百分位数为 .
故选:C.
2.(2022·福建省福州第一中学高一期末)某单位为了解该单位党员开展学习党史知识活动情况,随机抽
取了40名党员,对他们一周的党史学习时间进行了统计,统计数据如表所示:
党史学习时间(小时) 7 8 9 10 11
党员人数 6 10 9 8 7
则该单位党员一周学习党史时间的众数及第75百分位数分别是( )
A.8,10 B.8,10.5 C.9,10 D.8,9.5
【答案】A
【详解】该单位党员一周学习党史时间中,8出现的次数最多,众数是8,
学习时间小于10小时的比例是 ,小于11小时的比例是 ,
因此第75百分数是10.
故选:A.
3.(2022·四川眉山·高二期末(理))某班最近一次化学考试成绩的频率分布直方图如下图所示,若化学
老师欲将大家的成绩由高到低排列,并奖励排名在前39%的同学,试估计化学老师选取的学生分数应不低
于( )A.73 B.75 C.77 D.79
【答案】C
【详解】由题意可知, ,解得 ,
化学考试成绩在 内的频率为 ,
所以第39百分位数的一定位于 内,设第39百分位数为 ,则
,解得 .
所以估计化学老师选取的学生分数应不低于 分.
故选:C.
4.(2022·湖南衡阳·高一期末)有10种不同的零食,每100克可食部分包含的能量(单位:J)如下:100,
120,125,165,430,186,175,234,425,310.这10种零食每100克可食部分的能量的第60百分位数
为__________.
【答案】210
【详解】10个数据从小到大顺序排列为: ,
,而第6个数据为186,第7个数据为234, .
所以第60百分位数为210.
故答案为:210.
题型二:总体集中趋势的估计
角度1:样本的数字特征
典型例题
例题1.(2022·全国·高一课时练习)已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入
三个新数据4,5,6,若新样本的平均数为 ,方差为 ,则( )
A. , B. ,
C. , D. ,
【答案】B
【详解】解:设新样本的10个数据分别为 , ,…, , , , ,由题意得 ,又 ,所以 ,
所以 ,
.
故选:B
例题2.(2022·全国·高一课时练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情
况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的
数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
【答案】B
【详解】对于A,甲同学:若平均数为2,众数为1,则有1次名次应为4,不符合题意;
对于B,乙同学:平均数为2,设乙同学3次考试的名次分别为 , , ,
则方差 ,
则 ,所以 , , 均不大于3,符合题意;
对于C,丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;
对于D,丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.
故选:B
例题3.(2022·河北保定·高一阶段练习)在某市举行的唱歌比赛中,5名专业人士和5名观众代表组成一
个评委小组,给参赛选手打分.这10个分数的平均分为8分,方差为12,若去掉一个最高分10分和一个最
低分6分,则剩下的8个分数的方差为_____________.
附:已知样本数据 的平均数 与方差 满足关系式 .
【答案】14
【详解】设这10个分数分别为 ,6,10,平均数为 ,方差为 , 的平均数为 ,
方差为 ,所以
,则 ,
则 ,即 ,则 ,
所以 .
故答案为:14.
例题4.(2022·全国·高一单元测试)在①55%分位数,②众数这两个条件中任选一个,补充在下面问题
中的横线上,并解答问题.维生素 又叫 -抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少
数生物的必需营养素.现从猕猴桃、柚子两种食物中测得每100克维生素 的含量(单位:mg)各10个数
据如下,其中猕猴桃的一个数据 被污损.
猕猴桃:104,119,106,102,132,107,113,134,116,x;
柚子:121,113,109,122,114,116,132,121,131,117.
已知 等于柚子的10个数据中的___________.
(1)求 的值与猕猴桃的数据的中位数;
(2)分别计算上述猕猴桃、柚子两种食物中测得每100克维生素 含量的平均数.
【答案】(1)121,中位数为
(2) mg, mg
(1)柚子的10个数据按照从小到大的顺序排列为:109,113,114,116,117,121,121,122,131,
132.选①,因为 ,所以柚子10个数据的55%分位数为第6个数,即121,所以x=121.猕猴桃
的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则中位
数为 .选②,因为柚子的10个数据的众数为121,所以x=121.猕猴桃的10个数据按照从
小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则中位数为
.
(2)由(1)得每100克猕猴桃维生素C含量的平均数为
mg每100克柚子维生素C含量的平均数
为 mg
同类题型归类练
1.(多选)(2022·全国·高一单元测试)某公司为了解用户对其产品的满意度,随机调查了10个用户,
得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满
意度越高,则下列说法正确的是( )
7 8 9 7 5 4 10 9 4 7
A.这组数据的平均数为6 B.这组数据的众数为7C.这组数据的极差为6 D.这组数据的75%分位数为9
【答案】BCD
【详解】这组数从小到大排列为:4,4,5,7,7,7,8,9,9,10,
计算这组数据的平均数为 ,选项A错误;
这组数据的众数是7,选项B正确;
这组数据的极差是 ,选项C正确;
因为10×75%=7.5,且第8个数是9,所以这组数据的75%分位数为9,选项D正确.
故选:BCD.
2.(2022·山东滨州·高一期末)已知数据 ,…, 的众数、平均数、方差、第80百分位数分别是 ,
, , ,数据 , , ,…, 的众数、平均数、方差、第80百分位数分别是 , , , ,且
满足 ,则下列结论正确的是( )
A. B. C. D.
【答案】BCD
【详解】由题意可知,两组数据满足 ,则它们的众数也满足该关系,则有
,故A错误;
由平均数计算公式得:
,即 ,故B正确;
由方差的性质可得 ,故C正确;
对于数据 ,…, ,假设其第80百分位数为 ,
当 是整数时, ,当 不是整数时,设其整数部分为k,则 ,
故对于数据 ,…, ,假设其第80百分位数为 ,
当 是整数时, ,当 不是整数时,设其整数部分为k,则
,
故 ,故D正确,
故选:BCD
3.(2022·湖北·襄阳五中高三阶段练习)若已知30个数 的平均数为6,方差为9;现从原30
个数中剔除 这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数
的方差为___________.【答案】
【详解】由题意得 , ,
, ,
所以剩余的20个数的平均数为 ,
,
所以剩余的20个数的方差为 ,
故答案为:8
4.(2022·全国·高一单元测试)鲤鱼是中华五千年文化传承的载体之一,它既是拼搏进取、敢于突破自我、
敢于冒险奋进精神的载体,又是富裕、吉庆、幸运的美好象征.某水产养殖研究所准备进行“中国红鲤”
和“中华彩鲤”杂交育种实验.研究所对200尾中国红鲤和160尾中华彩鲤幼苗进行2个月培育后,将根
据体长分别选择生长快的10尾中国红鲤和8尾中华彩鲤作为种鱼进一步培育.为了解培育2个月后全体幼
鱼的体长情况,将其按照品种进行分层随机抽样,其中抽取的40尾中国红鲤的体长数据(单位:cm)如
下:
5.0 6.0 7.0 7.5 8.0 8.4 4.0 3.5 4.5 4.3
5.0 4.0 3.0 2.5 4.0 1.6 6.0 6.5 5.5 5.7
3.1 5.2 4.4 5.0 6.4 3.5 7.0 4.0 3.0 3.4
6.9 4.8 5.6 5.0 5.6 6.5 3.0 6.0 7.0 6.6
(1)根据以上数据,估计某尾体长为8.3 cm的中国红鲤能否被选为种鱼,并说明理由.
(2)通过计算得到样本中中国红鲤体长的平均值为5.1 cm,中华彩鲤体长的平均值为4.875 cm,求所有样本
数据的平均值.
【答案】(1)不能,理由见解析
(2) cm
(1)能被选为种鱼,理由如下:因为200尾中国红鲤中有10尾能被选为种鱼,所以估计40尾中国红鲤中
有2尾能被选为种鱼,样本数据中体长为8.4 cm和8cm的中国红鲤能被选为种鱼,其余的中国红鲤不能被
选为种鱼,由于8.3>8,所以估计该尾中国红鲤能被选为种鱼.
(2)根据分层随机抽样的原则,抽取中华彩鲤的尾数为 ,所以所有样本数据的平均值为
(cm).
角度2:频率分布直方图中的数字特征
典型例题
例题1.(多选)(2022·江苏·如皋市第一中学高一期末)某中学举行安全知识竞赛,对全校参赛的1000
名学生的得分情况进行了统计,把得分数据按照 分成了5组,绘制
了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )A.这组数据的极差为50 B.这组数据的众数为76
C.这组数据的中位数为 D.这组数据的第75百分位数为85
【答案】CD
【详解】解:对于A:由频率分布图无法得到这组数据的最大值和最小值,
故这组数据的极差无法准确判断,故A错误;
数据的众数为 ,故B错误;
, ,
所以中位数位于 之间,设中位数为 ,则 ,解得 ,
即这组数据的中位数为 ,故C正确;
, ,故估计第 分位数是
,故D正确;
故选:CD
例题2.(2022·吉林·长春市第二实验中学高一期末)某大学艺术专业400名学生参加某次测评,根据男女
学生人数比例、使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数、将数据分成7组:
, ,…, ,并整理得到如图的频率分布直方图.
(1)估计总体400名学生中分数小于60的人数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间 内的人数;
(3)根据该大学规定、把25%的学生划定为不及格、确定本次测试的及格分数线、低于及格分数线的学生需
要补考.
【答案】(1)80(2)20(3)65分
(1)解:据频率分布直方图可知,样本中分数不小于60的频率为 ,所以样本
中分数小于60的频率为 ,
所以估计总体400名学生中分数小于60的人数为 .
(2)解:根据题意,样本中分数不小于50的频率为 ,
分数在区间 内的人数为 ,
所以总体中分数在区间 内的人数估计为 .
(3)解:设分数的第25百分位数为 ,
分数小于70的频率为 ,
分数小于60的频率为 ,
所以 ,即 ,解得 ,
则本次考试的及格分数线为65分.
例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出
1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购
进了160箱该特产,以 (单位:箱, )表示市场需求量, (单位:元)表示经销该特产
的利润.
(1)根据频率分布直方图估计市场需求量的众数和平均数;
(2)将 表示为 的函数;
(3)根据频率分布直方图求利润不少于4800元的频率.
【答案】(1)150,153(2)
(3)0.9
(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为
0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,
需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需
求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.
(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当 时,
,当 时, ,所以
.
(3)当 时,由 ,得 ;当 时, ,所
以当 时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为 .
同类题型归类练
1.(多选)(2022·黑龙江·哈九中高一期末)某校为了解学生对食堂的满意程度,设计了一份调查问卷,
从该校高中生中随机抽取部分学生参加测试,记录了他们的分数,将收集到的学生测试分数按照 ,
, , , , , 分组,画出频率分布直方图,已知随机抽取的
学生测试分数不低于80分的学生有27人,则以下结论中正确的是( )
A.此次测试众数的估计值为85
B.此次测试分数在 的学生人数为6人
C.随机抽取的学生测试分数的第55百分位数约为80
D.平均数m在中位数n右侧
【答案】ABC
【详解】由直方图可知此次测试众数的估计值为85,故A正确;
因为不低于80分的学生的频率为 ,∴该校高中生中随机抽取学生的人数为 人,
所以此次测试分数在 的学生人数为 人,故B正确;
因为 ,
所以随机抽取的学生测试分数的第55百分位数约为80,故C正确;
由直方图在左边“拖尾”,可知平均数小于中位数,即平均数m在中位数n左侧,故D错误.
故选:ABC.
2.(2022·全国·高一单元测试)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一
个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随
机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组
区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
【答案】(1) (2) 吨, 吨(3)
(1)由频率分布直方图中所有矩形的面积之和为1,可得
,解得 .
(2)由频率分布直方图可知,该市居民月均用水量的众数约为 (吨),由频率分布直方图可
知,平均数约为
(吨).
(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为
,月均用水量低于3吨的居民人数所占的百分比为
,所以 ,由题意可得 ,解得 .所以
如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.
3.(2022·河北保定·高一阶段练习)某学校组织“数学文化”知识竞赛,分为初赛和决赛,有400名学生
参加知识竞赛的初赛(满分150分),根据初赛成绩依次分为 , , , ,
, 这六组,得到如图所示的频率分布直方图.(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)
(2)若计划决赛人数为80,估计参加决赛的最低分数线.
【答案】(1) (2)127.5
(1)由题意有 ,解得m=0.030.本次初赛成绩的平均数为
.
(2)因为 ,所以决赛成绩的最低分为80%分位数.前四个矩形的面积之和为
,前五个矩形的面积之和为 .设80%分位数为
,则 ,解得m=127.5.因此,若计划决赛人数为80,估计参加
决赛的最低分数线为127.5.
4.(2022·贵州黔东南·高一期末)统计某校n名学生期中考试化学成绩(单位:分),由统计结果得如下
频数分布表和频率分布直方图:
化学成绩组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 m 26 38 p 8
(1)求出表中m,p的值;
(2)估计该校学生化学成绩的平均数(同一组中的数据用该组区间的中点值作代表)及中位数(保留一位小数);
(3)根据以上抽样调查数据,能否认为该校学生化学成绩达到“化学成绩不低于70分的学生所占比例不低
于该校全体学生的80%”的考核标准?
【答案】(1) ; (2)平均数约为75;中位数的为74.7(3)不能
(1)由频率分布直方图将进行数据分析可得: ; ;
.
(2)化学成绩的样本平均数为 ∴该校学生化学成绩
的平均数约为75.第一组频率为:0.06,第二组频率为:0.26,第三组频率为:0.38. ∵
∴中位数落在第三组[70,80)内,设中位数为x则
解得 因此,中位数的为74.7
(3)学成绩不低于70分的学生所占比例约为 ,由于该估计值小于0.8,故不能认为
该校学生化学成绩达到“化学成绩不低于70分的学生所占比例不低于该校全体学生的80%的规定.
题型三:总体离散程度的估计
典型例题
例题1.(2022·海南·琼海市嘉积第二中学高二期中)已知 、 、…、 的平均值为6,方差为3,则
、 、…、 的平均值为______,方差为______.
【答案】 11 12
【详解】新数据平均值为 ,新数据方差为
故答案为:11;12.
例题2.(2022·湖南·湘阴县教育科学研究室高一期末)为了了解某设备生产产品质量的稳定性,现随机抽
取了10件产品,其质量(单位:克)如下:495,500,503,508,498,500,493,500,503,500,质量落
在区间 ( 表示质量的平均值, 为标准差)内的产品件数为____.
【答案】7
【详解】根据题意
所以
所以质量落在区间 内的产品件数为7个.
故答案为:7
例题3.(2022·全国·高一单元测试)为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源
分时租赁汽车”,并计划在甲、乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲、乙两厂各随机选取10
个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;
(2)轮胎的宽度在 内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准
轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会
被选择.
【答案】(1)甲厂平均数195,乙厂平均数194
(2)乙厂的轮胎会被选择
(1)甲厂提供的10个轮胎宽度的平均数 .乙
厂提供的10个轮胎宽度的平均数 .
(2)甲厂提供的10个轮胎的宽度在[194,196]内的数据为195,194,196,194,196,195,共6个,标准
轮胎宽度的平均数为 ,方差为 乙厂提供的10
个轮胎的宽度在[194,196]内的数据为195,196,195,194,195,195,共6个,标准轮胎宽度的平均数
为 .方差为 由于甲、乙两厂标准轮胎宽度的平
均数相等,但乙的方差更小,所以乙厂的轮胎会被选择.
例题4.(2022·黑龙江·哈尔滨三中高一期末)2022年北京冬奥会的成功举办,带动中国3亿多人参与冰
雪运动,这是对国际奥林匹克运动发展的巨大贡献.2020《中国滑雪产业白皮书》显示,2020-2021排名前
十的省份的滑雪人次(单位:万人次)数据如下表:
排名 省份 2020-2021 2019-2020 2018-2019
1 河北 221 136 235
2 吉林 202 123 207
3 北京 188 112 186
4 黑龙江 149 101 195
5 新疆 133 76 116
6 四川 99 52 697 河南 98 58 95
8 浙江 94 62 108
9 陕西 79 47 76
10 山西 78 39 100
(1)由表中数据可知,2018-2019年这十个省份滑雪总人次为1387万,而受疫情影响,2019-2020年下降至
806万,计算2018-2019年和2019-2020年这10个省份滑雪人次的平均数 , ,并据此计算这两年的平
均数 ;
(2)已知2018-2019年滑雪人次的方差 ,2019-2020年滑雪人次的方差 ,据此计算这两年
滑雪人次的方差 ;(结果保留整数)
(3)据统计近年滑雪人均每次消费为6000元,若以2020-2021年数据为基础,每个省份滑雪人次都按(2)
中标准差 的 人数增长(过程中数据均保留整数),估计2021-2022年滑雪消费超过100亿元的省份有几
个?
【答案】(1) ;(2)3035;(3)4.
(1)由题意, , , .
(2)由 , ,
.
(3)由题设,消费超过100亿元,则人数为 万人,
由(2)各省人数增长为 万人,
显然 ,
所以估计2021-2022年滑雪消费超过100亿元的省份有河北、吉林、北京、黑龙江,共4个.
同类题型归类练
1.(2022·全国·高一单元测试)从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命
(单位:年)进行追踪调查,结果如下:甲:5,5,6,6,8,8,8,10;
乙:4,5,6,7,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出___________(从“甲、乙、丙”三厂家中选择
一个)厂家在广告中依据了统计数据中的哪个特征数?
(2)计算甲厂家抽取的8件产品的方差.
【答案】(1)答案见解析(2)
(1)选择甲厂家,因为甲厂家抽取的8件产品的众数是8,所以甲厂家的广告依据了统计数据中的众数;
选择乙厂家,因为乙厂家抽取的8件产品的平均数是8,所以乙厂家的广告依据了统计数据中的平均数;
选择丙厂家,因为丙厂家抽取的8件产品的中位数是8,所以丙厂家的广告依据了统计数据中的中位数.
(2)甲厂家抽取的8件产品的使用寿命为5,5,6,6,8,8,8,10,其平均数为
,方差为 .
2.(2022·全国·高一单元测试)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某
地区用户对其提供的服务的满意度,随机调查了40个用户,得到用户的满意度评分如下:
(1)请你估计该地区所有用户评分的25%,95%分位数;
(2)若从这40个用户中抽取一个容量为10的样本,且抽到的10个用户的评分分别为92,84,86,78,
89,74,83,78,77,89,试计算这10个数据的平均数 和方差 ;
(3)在(2)的条件下,若用户的满意度评分在 内,则满意度等级为“A级”,试用样本估计总
体的思想,根据所抽到的10个数据,估计该地区满意度等级为“A级”的用户所占的百分比.
(参考数据: , , )
【答案】(1)76.5,95(2) , (3)
(1)这40个用户评分按从小到大排列如下:63,66,72,73,74,74,75,76,76,76,77,78,78,78,79,79,80,81,81,81,82,82,83,83,84,84,85,85,86,86,88,88,89,89,91,92,
93,95,95,97,得到 , ,可知这40个用户评分的25%,95%分位数分别为第
10项和第11项数据的平均数,第38项和第39项数据的平均数,分别为76.5,95,据此估计该地区所有用
户评分的25%,95%分位数分别约为76.5,95.
(2) ,
.
(3)由题意知评分在 ,即(77.26,88.74)内的满意度等级为“A级”,样本中评分在
(77.26,88.74)内的有5人,则可估计该地区满意度等级为“A级”的用户所占的百分比约为
.
3.(2022·山东济南·高一期末)为了调查某中学高一年级学生的身高情况,在高一年级随机抽取100名学
生作为样本,把他们的身高(单位:cm)按照区间 , , , ,
分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;
(2)在统计过程中,小明与小张两位同学因事缺席,测得其余98名同学的平均身高为172cm,方差为29.
之后补测得到小明与小张的身高分别为171cm与173cm.试根据上述数据求样本的方差.
【答案】(1) ;30人
(2)
(1)由频率分布直方图知, ,所以 .
又样本中身高不低于175cm的学生的频率为
所以,样本中身高不低于175cm的学生人数为 人.
(2)设除小张与小明外其他98名同学的身高为 , , ,…, ,小张与小明的身高分别为 , ,
样本的平均数为 ,样本的方差为 .由题意 .
又 ,
所以样本的方差 .
4.(2022·山西吕梁·高一期末)随着高校强基计划招生的持续开展,我市高中生抓起了参与数学兴趣小组
的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了 名学生,记录他们
在一周内平均每天学习数学的时间,并将其分成了 个区间: 、 、 、 、
、 ,整理得到如下频率分布直方图:
(1)求图1中 的值,并估计甲高中学生一周内平均每天学习数学时间的众数;
(2)估计乙高中学生一周内平均每天学习数学时间的均值 及方差 (同一组中的数据用该组区间的中点
值作代表);
(3)若从甲、乙两所高中分别抽取样本量为 、 的两个样本,经计算得它们的平均数和方差分别为: 、
与 、 ,记总的样本平均数为 ,样本方差为 ,证明:
① ;
② .
【答案】(1) ,众数是
(2) ,
(3)①证明见解析 ;②证明见解析
(1)解:由频率分布直方图可得 ,解得 ,
甲高中学生一周内平均每天学习数学时间的众数是 .(2)解: ,
.
(3)证明:① ,即得证;
②
,
, ,
同理可得 ,
,
所以, ,即得证.
第四部分:高考真题感悟
1.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取 部,统计其评分数据,将所得 个
评分数据分为 组: 、 、 、 ,并整理得到如下的频率分布直方图,则评分在区间
内的影视作品数量是( )A. B. C. D.
【答案】D
【详解】由频率分布直方图可知,评分在区间 内的影视作品数量为 .
故选:D.
2.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农
户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可
作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为 ,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为 ,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为 ,
故D正确;
该地农户家庭年收入的平均值的估计值为
(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本 的离散程度的是( )
A.样本 的标准差 B.样本 的中位数
C.样本 的极差 D.样本 的平均数
【答案】AC
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
4.(2021·全国·高考真题)有一组样本数据 , ,…, ,由这组数据得到新样本数据 , ,…,
,其中 ( 为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【详解】A: 且 ,故平均数不相同,错误;
B:若第一组中位数为 ,则第二组的中位数为 ,显然不相同,错误;
C: ,故方差相同,正确;
D:由极差的定义知:若第一组的极差为 ,则第二组的极差为
,故极差相同,正确;
故选:CD
5.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指
标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为 和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 ,则认为新
设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1) ;(2)新设备生产产品的该项指标的均值较旧设备有显
著提高.
【详解】(1) ,
,
,
.
(2)依题意, , ,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.