文档内容
第26讲 统计
【知识点总结】
一、抽样方法
三种抽样方式的对比
类型 共同点 各自特点 相互关系 使用范围
简单随机抽样 从总体中随机逐个抽取 总体容量较小
抽样过程都是不 总体均分几段,每段 T 第一段简 总体中的个体个
放回抽样,每个 个, 单随机抽 数较多
个体被抽到的机 第一段取a, 样
系统抽样 会均等,总体容 1
第二段取a+T,
1
量N,样本容量
第三段取a+2T,
1
n,每个个体被
……
抽 到 的 概 率
将总体分成n层,每层 每层按简 总体由差异明显
按比例抽取 单随机抽 的几部分组成
分层抽样
样或系统
抽样
二、样本分析
(1)样本平均值: 。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差: 。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数n;
i
②求出每组频率 (n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小
长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式: ,s2(aX+b)=a2s2(X)。
【典型例题】
例1.(2021·云南师大附中高三阶段练习(文))某公司利用随机数表对生产的900支乙肝疫苗进行抽样
测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向
右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是( )1676622766 5650267107 3290797853 1355385859 8897541410
1256859926 9696682731 0503729315 5712101421 8826498176
5559563564 3854824622 3162430990 0618443253 2383013030
A.827 B.310 C.503 D.729
【答案】C
【详解】
从表中第4行第4列开始向右读取分别为
685,992(舍),696,966(舍),827,310,503,第5个数为503,
故选:C.
例2.(2022·全国·高三专题练习)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280
人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分
别抽取人数为( )
A.33,34,33 B.25,56,19
C.20,40,30 D.30,50,20
【答案】B
【详解】
因为125∶280∶95=25∶56∶19,
所以抽取人数分别为25,56,19.
故选:B
例3.(2021·四川省内江市第六中学高三阶段练习(文))某市场新购进某品牌电视机 台,为检测这批
品牌电视机的安全系数,现采用系统抽样的方法从中抽取 台进行检测,若第一组抽出的号码是 ,则第
组抽出的号码是________.
【答案】20
【详解】
因为某品牌电视机 台,抽取 台进行检测,所以分5组,每组6台,因为第一组抽出的号码是 ,则第
组抽出的号码是 ,
故答案为:20
例4.(2022·全国·高三专题练习(理))机床生产一批参考尺寸为的零件,从中随机抽取 个,量得其
尺寸如下表(单位: ):序号 1 2 3 4 5 6 7 8 9 10
尺寸 6.3 5.8 6.2 5.9 6.2 6.0 5.8 5.8 5.9 6.1
参考数据:取 .
(1)求样本零件尺寸的平均值 与标准差 ;
(2)估计这批零件尺寸位于 的百分比.
【解析】
(1)由表格数据得: ,
,则 ,
所以样本零件尺寸的平均值 ,标准差 .
(2)由(1)知: , ,
这 件样本中,尺寸在 内的共有 件,
以样本估计总体,则这批零件尺寸位于 的百分比约为 .
例5.(2019·河北·衡水第一中学高考模拟(理))在一次高三年级统一考试中,数学试卷有一道满分10
分的选做题,学生可以从 , 两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了
解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,
为此将900名考生选做题的成绩按照随机顺序依次编号为001一900.
(1)若采用随机数表法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读取数据,
每次读取三位随机数,一行读数用完之后接下一行左端.写出样本编号的中位数;
(2)若采用系统抽样法抽样,且样本中最小编号为08,求样本中所有编号之和:
(3)若采用分层轴样,按照学生选择 题目或 题目,将成绩分为两层,且样本中 题目的成绩有8个,
平均数为7,方差为4:样本中 题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.【详解】
解:(1)根据题意,读出的编号依次是:
512,916(超界),935(超界),805,770,951(超界),512(重复),687,858,554,876,647,
547,332.
将有效的编号从小到大排列,得
332,512,547,554,647,687,770,805,858,876,
故中位数为 .
(2)由题易知,按照系统抽样法,抽出的编号可组成以8为首项,以90为公差的等差数列,故样本编号
之和即为该数列的前10项之和 .
(3)记样本中8个 题目成绩分别为 , ,… ,2个 题目成绩分别为 , ,
由题意可知 , ,
, ,
故样本平均数为 .
样本方差为
.
故估计该校900名考生该选做题得分的平均数为7.2,方差为3.56.
【点睛】
采用随机数表法抽样时需先将样本编号,且要注意号码位数相同,然后由随机数表读数,在样本号码范围
内的取出,不在的舍掉.
系统抽样法需先将样本编号,然后分组,抽取的号码数构成等差数列.例6.(2020·河北·模拟预测(文))为抗击新型冠状病毒肺炎疫情,某口罩生产企业职工在做好自身安全
防护的同时,加班加点生产口罩发往疫区.该企业为保证口罩的质量,从某种型号的口罩中随机抽取100个,测量这些口罩的某项质量指标值,其频率分布直方图如图所示,其中该项质量指标值在区间
内的口罩恰有8个.
(1)求图中 , 的值;
(2)用样本估计总体的思想,估计这种型号的口罩该项质量指标值的平均数及方差(同一组中的数据用该
组区间的中点值作代表);
(3)根据质量指标标准,该项质量指标值不低于85,则为合格产品,试估计该企业生产这种型号口罩的
质量合格率为多少?
【详解】
解:(1)因为该项质量指标值在区间 内的口罩恰有8个,
所以 ,
又 ,
所以 ;
(2)这种型号的口罩该项质量指标值的样本平均数为
,
该项质量指标值的样本方差为
,
利用样本估计总体的思想,可以认为这种型号的口罩项质量指标值的样本平均数为 ,方差为 ;
(3)从样本可知质量指标值不低于 的产品所占比例的估计值为 ,故样本的合格率为 ,所以可以认为该企业生产这种型号口罩的质量合格率为 .
【技能提升训练】
一、单选题
1.(2022·全国·高三专题练习)下列说法正确的是( )
A.投掷一枚硬币1000次,一定有500次“正面朝上”
B.若甲组数据的方差是 ,乙组数据的方差是 ,则甲组数据比乙组数据稳定
C.为了解我国中学生的视力情况,应采取全面调查的方式
D.一组数据1、2、5、5、5、3、3的中位数和众数都是5
【答案】B
【分析】
根据统计量,对各项分析判断即可得解.
【详解】
对于A,因为每次抛掷硬币都是随机事件,所以不一定有500次“正面朝上”,故A错误;
对于B,因为方差越小越稳定,故B正确;
对于C,为了解我国中学生的视力情况,应采取抽样调查的方式,故C错误;
对于D,数据1、2、5、5、5、3、3按从小到大排列后为1、2、3、3、5、5、5,
则其中位数为3,故D错误,
故选:B.
2.(2022·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题;“开仓受纳,有
甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒内有谷二十八颗,
凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来米1534石,验得米内夹
谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.153石 B.154石 C.169石 D.170石
【答案】C
【分析】
这批米内夹谷约为 石,则 ,由此能求出这批米内夹谷数量.
【详解】
这批米内夹谷约为 石,根据题意可得解得
故选:C
3.(2022·全国·高三专题练习)现要完成下列3项抽样调查:
①从15种疫苗中抽取5种检测是否合格.
②某科研院所共有480名科研人员,其中具有高级职称的有48名,具有中级职称的有360名,具有初级职
称的有72名.为了解该科研院所科研人员的创新能力,拟抽取一个样本容量为20的样本.
③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.
较为合理的抽样方法是( )
A.①③简单随机抽样,②分层抽样 B.①②简单随机抽样,③分层抽样
C.②③简单随机抽样,①分层抽样 D.①简单随机抽样,②③分层抽样
【答案】A
【分析】
根据简单随机抽样和分层抽样的概念判断.
【详解】
①③中总体容量较少,且个体没有明显差别,适合用简单随机抽样;②中总体是由有明显差异的几部分组
成的,适合用分层抽样.
故选:A.
4.(2022·全国·高三专题练习)下面抽样中是简单随机抽样的个数是( )
①从无数个个体中抽取30个个体作为样本
②从100部手机中一次抽取5部进行检测
③某班有45名同学,指定个子最高的5名同学参加学校组织的篮球比赛
④一彩民买彩票选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽取6个号签
A.1 B.2 C.3 D.4
【答案】A
【分析】
根据简单随机抽样的概念和特点分别判断即可.
【详解】
①总体个数无限,不是简单的随机抽样;②不是逐个抽取,不是简单的随机抽样;③指定了5名同学参赛,
不满足每个个体被抽到的可能性相同,不是简单的随机抽样;④满足简单的随机抽样的定义.故选:A.
5.(2022·全国·高三专题练习)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、
95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名
调查学习负担情况.宜采用的抽样方法依次是( )
A.①简单随机抽样,②系统抽样
B.①分层抽样,②简单随机抽样
C.①系统抽样,②分层抽样
D.①②都用分层抽样
【答案】B
【分析】
可以从总体的个体有无差异和总数是否比较多入手选择抽样方法,①中某社区420户家庭的收入差异较大;
②中总体数量较少,且个体之间无明显差异.
【详解】
①中某社区420户家庭的收入有了明显了差异,所以选择样本时宜选用分层抽样法;②个体没有差异且总数
不多可用简单随机抽样法.故选:B
【点睛】
本题主要考查抽样方法的特点及适用范围,属于容易题.
6.(2022·全国·高三专题练习)从编号依次为01,02,…,20的20人中选取5人,现从随机数表的第一
行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为( )
5308 3395 5502 6215 2702 4369 3218 1826 0994 7846
5887 3522 2468 3748 1685 9527 1413 8727 1495 5656
A.09 B.02 C.15 D.18
【答案】A
【分析】
从随机数表的第一行第3列和第4列数字开始,依次读取,舍去不在范围内的和重复的数字,可得答案.
【详解】
从随机数表的第一行第3列和第4列数字开始,依次读取 , (舍), (舍), (舍), ,(舍), , (舍), (舍), (舍), (舍), (舍), , (舍), (舍),
则第五个编号为
故选:A
7.(2022·全国·高三专题练习)为了弘扬文化自信,某中学随机抽取了320个学生,调查其是否阅读过四
大名著《三国演义》《西游记/水浒传》及《红楼梦》经统计,其中阅读过《三国演义》或《西游记》的有
220人,阅读过《三国演义》的有180人,同时阅读过《三国演义》和《西游记》两本书的有120人.用样
本估计总体,则该中学阅读过《西游记》的学生人数与该中学学生总人数之比的估计值为( )
A.0.5 B.0.6 C.0.7 D.0.8
【答案】A
【分析】
求出阅读过《西游记》的人数为160人,即得解.
【详解】
由题意知:该学校仅阅读过《三国演义》的有180-120=60人,
所以阅读过《西游记》的人数为220-60=160人,
则该学校阅读过《西游记》的学生人数与该小区学生总人数之比的估计值为 .
故选:A
8.(2022·全国·高三专题练习)某学校决定从该校的2000名高一学生中采用系统抽样(等距)的方法抽
取50名学生进行体质分析,现将2000名学生从1至2000编号,已知样本中第一个编号为7,则抽取的第
26个学生的编号为( )
A.997 B.1007 C.1047 D.1087
【答案】B
【分析】
按照等距系统抽样的定义进行分组抽样即可求得第26个学生的编号.
【详解】
按照等距系统抽样的定义,2000名学生分50组,即40人一组,第1组1~40,第2组41~80,…,第50组
1961~2000;
若第一个编号为7,则后面每组的编号都比前一组多40,可以求得第26个学生的编号为:
,
故选:B9.(2022·全国·高三专题练习)第十四届全国运动会开幕式,于 年 月 日 点在西安奥体中心隆
重开幕.本次盛会的观众席中有 名是“西安铁一中”师生,这些师生中还有 名学生参加了文艺演出.
开幕式之后,在这 名师生中,按照“参加了演出”和“未参加演出”分层抽样共抽取了 名师生,
参加“陕西电视台”举办的“弘扬十四运精神”座谈会,则抽到的 名师生中“参加了演出”和“未参加
演出”的人数分别是( )
A. , B. , C. , D. ,
【答案】B
【分析】
分别由 和 乘以抽样比即可求解.
【详解】
由题意可得:抽样比为 ,
抽到的 名师生中“参加了演出”人数有 ,
“未参加演出”的人数有 ,
所以抽到的 名师生中“参加了演出”和“未参加演出”的人数分别是 , ,
故选:B.
10.(2022·全国·高三专题练习)某企业有职工150人,中高级职称15人,中级职称45人,一般职员90
人,现抽取30人进行分层抽样,则各职称人数分别为( )
A.5,10,15 B.5,9,16 C.3,10,17 D.3,9,18
【答案】D
【分析】
由分层抽样的定义结合抽样比即求.
【详解】
由分层抽样的定义结合抽样比可知:
中高级职称应抽取: 人;
中级职称应抽取: 人;
一般职员应抽取: 人;
即各职称人数分别为3,9,18.故选:D.11.(2022·全国·高三专题练习)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为
了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 的学生进行调查,则在抽取的高中生中,
近视人数约为( )
A.1000 B.40 C.27 D.20
【答案】D
【分析】
根据高中生的总人数乘以抽样比 可得所抽的高中生人数,再由近视率为 即可求解.
【详解】
由图(1)知高中生的总人数为 人,
所以应抽取的高中生为 人,
抽取的高中生中,近视人数约为 人,
故选:D
12.(2022·全国·高三专题练习)某学校高二年级选择“史政地”、“史政生”和“史地生”这三种组合
的学生人数分别为210、90和 若采用分层抽样的方法从中随机抽取12名学生,则从“史政生”组合中
抽取的学生人数为( )
A.7 B.6 C.3 D.2
【答案】C
【分析】
先求出“史政生”所占的比例,然后按比例抽取人数,即可得到答案.
【详解】由题意可知,“史政地”、“史政生”和“史地生”这三种组合的学生人数分别为210,90和60,
故“史政生”所占的比例为 ,
由分层抽样是按比例抽取可得,“史政生”组合中抽取的学生人数为 .
故选:C
13.(2022·全国·高三专题练习)某班级有 名学生,其中有 名男生和 名女生,随机询问了该班五
名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为 , , , , ,五名女
生的成绩分别为 , , , , ,下列说法一定正确的是
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班级男生成绩的平均数小于该班女生成绩的平均数
【答案】C
【详解】
试题分析:根据抽样方法的特点,可知既不是分层抽样,也不是系统抽样,故A,B是错的,从这五名学生
的成绩得不出该班的男生成绩和女生成绩的平均分,故D是错的,根据公式,求得五名男生成绩的方差为
,五名女生成绩的方差为 ,故选C.
考点:1抽样方法;2方差.
14.(2022·全国·高三专题练习(理))如图为2015~2020年中国常温乳酸菌饮品市场规模柱形图及增速
折线图(2015-2020年为真实数据,2021年及2022年为预测数据),给出下列判断:①2015-2020年中国常温乳酸菌饮品市场规模逐年增加;
②2015-2020年中国常温乳酸菌饮品市场规模增速逐年增加;
③由预测可知,2021年中国常温乳酸菌饮品市场规模与2019年相比将增加7.3%,
其中正确判断的个数为( )
A.0 B.1 C.2 D.3
【答案】B
【分析】
利用市场规模柱形图及増速折线图的意义逐一分析三个判断即可作答.
【详解】
由市场规模柱形图知,2015~2020年中国常温乳酸菌饮品市场规模逐年増加,①正确;
由増速折线图知,2015~2020年中国常温乳酸菌饮品市场规模増速逐年下降,②错误;
由预测可知,2021年中国常温乳酸菌饮品市场规模与2019年相比,增速为 ,③错
误,
所以正确判断的个数为1.
故选:B
15.(2022·全国·高三专题练习(理))今年暑假期间,某地从近两年毕业的大学生中招聘了一批高中教
师、初中教师、小学教师、小学特岗教师和幼儿教师共五个系列的教师,按分层抽样方法抽取了 名参
加面试的教师的数量统计信息如下:①样本中男生占 ;
②样本中参加高中教师面试的女生人数比参加初中教师面试的男生人数多;
③样本中参加幼儿教师面试的男生与女生的人数多少无法比较.
则以上信息正确的个数为( )
A. B. C. D.
【答案】C
【分析】
根据条形图和扇形图所给数据对①②③逐一分析,由此确定正确选项.
【详解】
对于①,由男生面试人数条形图可知男生人数为 人,所以占样本总人数的比例为 ,所以①正确;
对于②,样本中女生总人数为 (人),所以参加高中教师面试的女生人数为
(人),而参加初中教师面试的男生人数为 人,所以②正确;
对于③,由条形图可确定参加幼儿教师面试的男生人数为 人,而从扇形图中可知参加幼儿教师面试的女
生人数为 (人),所以参加幼儿教师面试的男生与女生的人数可以比较,故③错误;
综合可知,正确的信息有 个.
故选:C
16.(2022·全国·高三专题练习(文))如图1为某省 年 月快递业务量统计图,图2是该省
年 月快递业务收入统计图,下列对统计图理解错误的是( )A. 年 月的业务量, 月最高, 月最低,差值接近 万件
B. 年 月的业务量同比增长率超过 ,在 月最高
C.从两图来看, 年 月中的同一个月快递业务量与收入的同比增长率并不完全一致
D.从 月来看,该省在 年快递业务收入同比增长率逐月增长
【答案】D
【分析】
根据图1和图2逐项分析各选项,可得合适的选项.
【详解】
对于A选项,由图1可知, 年 月的业务量, 月最高, 月最低,差值为 (万
件),A对;
对于B选项,由图1可知, 年 月的业务量同比增长率超过 ,在 月最高,B对;
对于C选项,从两图来看, 年 月中的同一个月快递业务量与收入的同比增长率并不完全一致,C
对;
对于D选项,该省在 年快递业务收入同比增长率在 月下降,D错.
故选:D.
17.(2022·全国·高三专题练习(文))新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融
合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2017年至2021年我国新闻出版业
和数字出版业营收情况,则下列说法错误的是( )A.2017年至2021年我国新闻出版业和数字出版业营收均逐年增加
B.2021年我国数字出版业营收超过2017年我国数字出版业营收的2倍
C.2021年我国新闻出版业营收超过2017年我国新闻出版业营收的1.5倍
D.2021年我国数字出版业营收占新闻出版业营收的比例未超过三分之一
【答案】C
【分析】
通过条形图中的数据信息,对四个选项进行逐一分析判断,即可得到答案.
【详解】
对于A中,由条形图可以看出,条形的高一次在增高,所以2017年至2021年我国新闻出版业和数字出版
业营收逐年增加,所以A正确;
对于B中,2021年我国数字出版业营收为5720.9亿元,2017年我国新闻出版业营收为1935.3亿元,因为
,所以B正确;
对于C中,2021年我国新闻出版业营收为23595.8亿元,2017年我国新闻出版业营收为16635.5亿元,因
为 ,所以C错误;
对于D中,因为 ,所以2021年我国数字出版业营收占新闻出版业营收为超过三
分之一,所以D正确.
故选:C.
18.(2022·全国·高三专题练习(文))某人一周的总开支如图 所示,这周的食品开支如图 所示,则他
这周的肉类开支占总开支的百分比为( )A. B. C. D.
【答案】B
【分析】
计算出食品开支占总开支的比例,以及肉类开支占食品开支的比例,相乘可得结果.
【详解】
由图 知食品开支占总开支的 ,
由图 知肉类开支占食品开支的 ,
所以肉类开支占总开支的百分比为
故选:B.
19.(2022·天津南开·高三期末)对某种电子元件使用寿命跟踪调查,抽取容量为1000的样本,其频率分
布直方图如图所示.根据此图可知这批样本中寿命不低于300h的电子元件的个数为( ).
A.800 B.750 C.700 D.650
【答案】A
【分析】根据小矩形的面积等于这一组的频率,先求出电子元件的寿命不低于 小时的频率,再乘以样本容量即
可求出符合条件的数量.
【详解】
解:根据频率分布直方图可知这批样本中电子元件的寿命不低于 小时的频率为 ,
抽取容量为1000的样本, ,
故选:A
20.(2022·全国·高三专题练习(文))在某次射击比赛中,甲、乙两人各射击5次,射中的环数如图,
则下列说法正确的是( )
A. , B. ,
C. , D. ,
【答案】C
【分析】
由图表进行数据分析,得到甲射击5次所得环数分别为:9,8,10,9,10;乙射击5次所得环数分别为:
6,9, 9,8,10;利用平均数公式及方差公式计算即可.
【详解】
由图可知,甲射击5次所得环数分别为:9,8,10,9,10;
乙射击5次所得环数分别为:6,9, 9,8,10;故 ,,
,
,
故选:C.
21.(2022·全国·高三专题练习(文))某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发
展理念,对境内企业产生的废水进行实施监测,如图所示茎叶图是对 , 两家企业10天内产生废水的某
项指标值的检测结果,下列说法正确的是( )
A. , 两家企业指标值的极差相等
B. 企业的指标值的中位数较大
C. 企业的指标值众数与中位数相等
D. , 企业的指标值的平均数相等
【答案】C
【分析】
根据茎叶图计算极差、中位数、众数、平均数然后判断.
【详解】
企业的极差是 , 企业的极差是 ,两者不相等,故A选项错误;
企业的中位数是 , 企业的中位数是68,故 企业的中位数较大,故B选项错误;
企业的众数为68,与中位数相同,故C选项正确;
企业的平均数是 , 企业的平均数是
,不相等,故D选项错误,
故选:C.
22.(2022·全国·高三专题练习(理))甲、乙两班在我校举行的“勿忘国耻,振兴中华”合唱比赛中,7位评委的评分情况如茎叶图所示,其中甲班成绩的中位数是81,乙班成绩的平均数是86,则
( )
A.4 B.3 C.2 D.1
【答案】A
【分析】
利用中位数的定义求出 的值,利用平均数的定义求出 的值,即可得到答案.
【详解】
由于甲班成绩的中位数是81,乙班成绩的平均数是86,知, ,
,解得 , .
故选:A.
23.(2022·全国·高三专题练习(文))在五场篮球比赛中,甲、乙两名运动员得分的茎叶图如图所示.下
列说法正确的是( )
A.甲得分的中位数和极差都比乙大
B.甲得分的中位数比乙小,但极差比乙大
C.甲得分的中位数和极差都比乙小
D.甲得分的中位数比乙大,但极差比乙小
【答案】B
【分析】
本题可通过求出甲得分的中位数与极差以及乙得分的中位数与极差得出结果.
【详解】
甲得分依次为 、 、 、 、 ,中位数是 ,极差为 ,乙得分依次为 、 、 、 、 ,
中位数是 ,极差为 ,
则甲得分的中位数比乙小,极差比乙大,
故选:B.
24.(2022·全国·高三专题练习)气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于
22℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位为℃):
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,总体均值为27;
③丙地:5个数据中有一个数据是32,总体均值为26总体方差为10.8.
则肯定进入夏季的地区有( )
A.3个 B.2个 C.1个 D.0个
【答案】B
【分析】
①根据中位数和众数得出甲地连续5天的日平均温度的记录数据值即可判断;②根据中位数和总体均值找
到一组不满足进入夏季的数据即可判断;③结合假设有一个数据没超过22,通过方差即可得出矛盾,进而
假设不成立,从而得出结论.
【详解】
①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能
为22,22,24,25,26,其连续5天的日平均温度均不低于22℃.
②乙地:5个数据的中位数为27,总体均值为27,比如这5个数据从小到大排列为20,21,27,33,34满
足条件,但是有低于22的数,故不确定.
③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,则取21,此时方差就超出了10.8,
可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地,
故选:B.
25.(2022·全国·高三专题练习)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随
机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正
确的是( )A.该公司职工的测试成绩不低于60分的人数约占总人数的80%
B.该公司职工测试成绩的中位数约为75分
C.该公司职工测试成绩的平均值约为68分
D.该公司职工测试成绩的众数约为60分
【答案】C
【分析】
由频率分布直方图,分别求出该公司职工的测试成绩不低于60分的频率、中位数、平均值、众数,能判断正
确选项.
【详解】
解:由频率分布直方图,得:
对于A,该公司职工的测试成绩不低于60分的频率为:(0.02+0.015)×20=0.70,
∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;
对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,
测试成绩在[60,80)的频率为0.02×20=0.4,
∴该公司职工测试成绩的中位数约为: 分,故B错误;
对于C,该公司职工测试成绩的平均值约为:
分,故C正确;
对于D,该公司职工测试成绩的众数约为: 分,故D错误.
故选:C.
【点睛】
本题考查命题真假的判断,考查频率、中位数、平均值、众数、频率分布直方图的性质等基础知识,考查运算
求解能力、数据分析能力等,是基础题.解题的关键在于熟练掌握频率分布直方图估计中位数,众数,平均
数的基本方法.26.(2022·全国·高三专题练习)下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件)若这两组数据的中位数相等,且平均值也相等,则 和 的值分别为
A.5,5 B.3,5 C.3,7 D.5,7
【答案】B
【分析】
利用茎叶图、中位数、平均数的性质直接求解.
【详解】
由茎叶图得:
∵甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,
∴65=60+y,解得y=5,
∵平均值也相等,
∴ ,
解得x=3.
故选B.
【点睛】
本题考查实数值的求法,考查茎叶图、中位数、平均数的性质等基础知识,考查运算求解能力,是基础题.
27.(2022·全国·高三专题练习(文))设一组样本数据 , ,…, 的方差为1,则 ,
,…, 的方差为( )
A.10.1 B.1 C.0.1 D.0.01
【答案】D
【分析】根据题意,结合数据的平均数和方差的计算公式,准确运算,即可求解.
【详解】
由题意,设 , ,…, 的平均数为 ,
可得 ,
则 , ,…, 的平均数为 ,
所以 , ,…, 的方差为
.
故选:D.
28.(2022·全国·高三专题练习)某校为了解学生体能素质,随机抽取了 名学生,进行体能测试.并将这
名学生成绩整理得如下频率分布直方图.根据此频率分布直方图.下列结论中不正确的是( )
A.这 名学生中成绩在 内的人数占比为
B.这 名学生中成绩在 内的人数有 人
C.这 名学生成绩的中位数为
D.这 名学生的平均成绩 (同一组中的数据用该组区间的中点值做代表)
【答案】C【分析】
利用频率分布直方图求解判断.【详解】
根据此频率分布直方图,成绩在 内的频率为 ,所以A正确;
这 名学生中成绩在 内的人数为 所以B正确;
根据此频率分布直方图, , ,
可得这 名学生成绩的中位数 ,所以C错误﹔
根据频率分布直方图的平均数的计算公式,可得:
所以D正确.
故选:C.
29.(2022·全国·高三专题练习(理))为了让学生了解更多的“一带一路”倡议的信息,某中学举行了
一次“丝绸之路知识竞赛”,全校学生的参赛成绩的频率分布直方图如图所示,若 的学生不能参加复
赛,则可以参加复赛的成绩约为( )
A.72 B.73 C.74 D.75
【答案】D
【分析】
由题设,根据频率直方图,若可参加复赛的成绩为 ,则 区间内的柱状条的面积和为 ,列方程
求 即可.
【详解】
由题设及频率直方图知: 分位数在 之间,
∴要使 的学生不能参加复赛,若可参加复赛的成绩为 ,
则 ,解得 .
故选:D30.(2022·全国·高三专题练习(文))某公司计划招收500名新员工,共报名了2000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取
200名报名者的笔试成绩,绘制频率分布直方图如下:
则录取分数线可估计为( )
A.70.5 B.72.5 C.75.5 D.77.5
【答案】D
【分析】
由频率分布直方图求出75百分位对应的分数即可得.
【详解】
.因此 的人不能录取.
由频率分布直方图得70分以下的频率为 ,80分以下的频率为
,
设录取分数线为 ,则 ,解得 .
故选:D.
二、多选题
31.(2022·江苏·高三专题练习)某公司生产三种型号的轿车,产量分别为15 00辆,6000辆和2000辆为
检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆,36辆,12辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
【答案】ACD
【分析】根据简单随机抽样的特点知应选分层抽样,按照抽样比即可得三种型号的轿车分别应抽取的数量.
【详解】
因为是三种型号的轿车,个体差异明显,所以选择分层抽样,选项 正确.
因为个体数目多,用抽取法制签难,搅拌不均匀,抽出的样本不具有好的代表性,故选项 正确.
抽样比为 ,三种型号的轿车依次应抽取9辆,36辆,12辆,选项 正确.
分层抽样种,每一个个体被抽到的可能性相同. 故选项 正确.
故答案为:ACD
【点睛】
本题主要考查了简单随机抽样与系统抽样的特点,属于基础题.
32.(2022·全国·高三专题练习)空气质量指数AQI是反映空气状况的指数,AQI指数值越小,表明空气
质量越好,其对应关系如下表:
AQI指数 0~50 51~100 101~150 151~200 201~300 >300
空气质量 优 良 轻度污染 中度污染 重度污染 严重污染
下图是某市10月1日~20日AQI指数变化趋势,则下列叙述正确的是( )
A.这20天中AQI指数值的中位数略高于100
B.这20天中的中度污染及以上的天数占
C.该市10月的前半个月的空气质量越来越好
D.总体来说,该市10月上旬的空气质量比中旬的好
【答案】ABD
【分析】
A:从小到大排列这20天的数据,中位数为第10个暑假和第11个暑假的平均数;B:数出中度污染及以上的天数再除以总数20即可;
C:由图分析即可;
D:根据图像分析即可.
【详解】
A项,由题图知排序后第10个数据为9日的、第11个数据为16日的,这两个数据平均数大于100,即中
位数略高于100,故A正确;
B项,中度污染及以上的天数为5天,占 ,故B正确;
由题图知C错误;
D项,总体来说,该市10月上旬的AQI较中旬的底,故空气质量比中旬的空气质量好,故D正确.
故选:ABD.
33.(2022·河北张家口·高三期末) 年 月 日,中国和美国在联合国气候变化格拉斯哥大会期间发
布《中美关于在 世纪 年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同
努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“ 世纪 年代强化气候行动工作组”,
推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了 年该地区一次能源消费结构
比例,并规划了 年一次能源消费结构比例,如下图所示:
经测算,预估该地区 年一次能源消费量将增长为 年的 倍,预计该地区( )
A. 年煤的消费量相对 年减少了
B. 年天然气的消费量是 年的 倍
C. 年石油的消费量相对 年不变
D. 年水、核、风能的消费量是 年的 倍
【答案】BD【分析】
设 年该地区一次能源消费总量为 ,计算出 年该地区煤、石油、天然气以及水、核、风能的消
费量,逐项判断可得出合适的选项.
【详解】
设 年该地区一次能源消费总量为 ,
年煤的消费量为 ,规划 年煤的消费量为 ,故A错误;
年天然气的消费量为 ,规划 年天然气的消费量为 ,故B正确;
年石油的消费量为 ,规划 年石油的消费量为 ,故C错误;
年水、核、风能的消费量为 ,规划 年水、核、风能的消费量为
,故D正确.
故选:BD.
34.(2022·全国·高三专题练习)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农
户家庭年收入调查数据整理得到如下频率分布直方图(如图):
根据此频率分布直方图,下面结论中正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入的中位数约为7.5万元
C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
D.估计该地农户家庭年收入的平均值不超过6.5万元
【答案】ABC
【分析】
根据频率分布直方图求出该地农户家庭年收入低于4.5万元的农户得频率即可判断A;
根据频率分布直方图求出中位数即可判断B;根据频率分布直方图求出家庭年收入介于4.5万元至8.5万元之间频率解判断C;
根据频率分布直方图求出平均数即可判断D.
【详解】
解:对于A,该地农户家庭年收入低于4.5万元的农户得频率为 ,所以比率估计为
6%,故A正确;
对于B,因为 ,所以该地农户家庭年收入的中位数约为7.5万元,故B正
确;
对于C,家庭年收入介于4.5万元至8.5万元之间频率为 ,所以估计该地
有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故C正确;
对于D,该地农户家庭年收入的平均值为
,
所以估计该地农户家庭年收入的平均值超过6.5万元,故D错误.
故选:ABC.
35.(2022·全国·高三专题练习)冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响
到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于
37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有
发生群体性发热的为( )
A.中位数为3,众数为2 B.均值小于1,中位数为1
C.均值为2,标准差为 D.均值为3,众数为4
【答案】BC
【分析】
根据题意,设连续7天,每天体温高于37.3℃的人数分别为 ,可得
,然后根据选项,结合反例依次判定,即可求解.
【详解】
由题意,连续7天,每天体温高于37.3℃的人数分别为 ,
可得 ,
对于A中,取 ,则满足中位数为3,众数为2,但第7天的人数 ,所以A不正确;
对于B中,若 ,由中位数为1,可知均值为 ,与均值小于1矛盾,所以B正确;
对于C中,当均值为2,标准差为 时, ,且 ,
若 ,则 ,例如: ,符合题意,
所以C正确;
对于D中,取 ,则满足均值为3,众数为4,但第7天人数 ,
所以D不正确.
故选:BC.
36.(2022·全国·高三专题练习)下列统计量中,能度量样本 的离散程度的是( )
A.样本 的标准差 B.样本 的中位数
C.样本 的极差 D.样本 的平均数
【答案】AC
【分析】
考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
【详解】
由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
37.(2022·全国·高三专题练习)已知一组数据的平均数、中位数、众数依次成等差数列,若这组数据丢失
了其中的一个,剩下的六个数据分别是2,2,4,2,5,10,则丢失的这个数据可能是( )
A.-11 B.3 C.9 D.17
【答案】ABD
【分析】
设未知数据为a,先求得众数和平均值,分别求得 , 和 情况下的中位数,根据等差中项
的性质,列出等式,即可求得答案.
【详解】设这个数据为a,由题意得,众数为2,平均数为 ,
若 时,这列数为a,2,2,2,4,5,10,则中位数为2,
则 ,2,2成等差数列,所以 ,
解得 ,满足题意,故A正确;
若 时,这列数为2,2,2,a,4,5,10,则中位数为a,
则 ,a,2成等差数列,所以 ,
解得 ,满足题意,故B正确;
若 时,这列数为2,2,2, 4, a,5,10,则中位数为4,
则 ,4,2成等差数列,所以 ,
解得 ,满足题意,故D正确
故选:ABD
38.(2022·上海·高三专题练习)为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做
上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为
40尾,根据上述数据估计该鱼塘中鱼的尾数为________.
【答案】30000.
【分析】
根据题意,利用抽样方法中样本与总体的比例是一致的,列出方程,求出该鱼塘中鱼的尾数即可.
【详解】
根据题意,设该鱼塘中鱼的尾数为x,则;
,
解得 ;
估计该鱼塘中鱼的尾数为30000.
故答案为:30000.
【点睛】
本题考查了抽样方法的应用问题,考查学生对抽样方法的理解和应用,是基础题目.
39.(2022·全国·高三专题练习)总体由编号为01,02,03,…,29,30的30个个体组成,利用随机数
表(以下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第4列开始由左向右读取,读取完毕后转下一行继续读取,则读出来的第4个个体的编号为________.
78 16 65 72 08 02 63 14 07 02 43 69 69 38 74
32 04 94 23 49 55 80 20 36 35 48 69 97 28 01
【答案】02
【分析】
根据规则,依次读取5个数,即得答案.
【详解】
第1行的第4列开始,读取的数是20,26,24,02,03,
所以读出来的第4个个体的编号是02.
故答案为:02
40.(2022·全国·高三专题练习)某创新企业为了解新研发的一种产品的销售情况,从编号为001,
002,…480的480个专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为
005,021,…则样本中的最后一个个体编号是______.
【答案】469
【分析】
先求得编号间隔为16以及样本容量,再由样本中所有数据编号为 求解.
【详解】
间隔为021-005=16,
则样本容量为 ,
样本中所有数据编号为 ,
所以样本中的最后一个个体的编号为 ,
故答案为:469
41.(2022·上海·高三专题练习)打算从500名学生中抽取50名进行问卷调查,拟采纳系统抽样方式,为
此将他们一一编号为1~500,并对编号进行分段,假设从第一个号码段中随机抽出的号码是2,那么从第五
个号码段中抽出的号码应是______.
【答案】42【分析】
由题设,根据等距抽样的特点确定第五个号码段中抽出的号码即可.
【详解】
从500名学生中抽取50名,那么每两相邻号码之间的距离是10,
第一个号码是2,那么第五个号码段中抽取的号码应是 .
故答案为:42
42.(2022·全国·高三专题练习)已知某市A社区35岁至45岁的居民有450人,46岁至55岁的居民有
750人,56岁至65岁的居民有900人,为了解该社区35岁至65岁居民的身体健康状兄,社区负责人采用
分层抽样技术抽取若干人进行体检调查,若这次抽样调查抽取的人数是70人,则从46岁至55岁的居民中
随机抽取了_______人.
【答案】25
【分析】
根据已知条件求出抽样比即可求解.
【详解】
由题意,可知A社区总人数为450+750+900=2100,样本容量为70,
所以抽样比为 ,
故从46岁至55岁的居民中随机抽取的人数为 .
故答案为:25.
43.(2022·全国·高三专题练习)为调动我市学生参与课外阅读的积极性,我市制定了《进一步加强中小
学课外阅读指导的实施方案》,有序组织学生开展课外阅读活动,某校语文老师在班里开展了一次诗词默
写比赛,班里40名学生得分数据的茎叶图如下图.若规定得分不低于85分的学生得到“诗词达人”称号,
低于85分且不低于70分的学生得到“诗词能手”称号,其他学生得到“诗词爱好者”称号,根据该次比
赛的成绩,按照称号的不同,进行分层抽样抽选15名学生,则抽选的学生中获得“诗词能手”称号的人数
为______________.【答案】
【分析】
根据题中条件,先分别得到各称号的总人数,根据分层抽样的方法即可得出结果.
【详解】
由茎叶图可得,获得“诗词爱好者”称号的学生总数为 ;获得“诗词能手”称号的学生总数为 ;获得
“诗词达人”称号的学生总数为 人;
因此,按照称号的不同,进行分层抽样抽选15名学生,抽选的学生中获得“诗词能手”称号的人数为
.
故答案为: .
44.(2022·全国·高三专题练习)某校三个兴趣小组的学生人数分布如下表(每名学生只参加一个小组,
单位:人).
篮球组 书画组 乐器组
高一 45 30
高二 15 10 20
学校要对这三个小组的活动效果进行抽样调查,用分层抽样的方法,从参加这三个兴趣小组的学生中抽取
30人,结果篮球组被抽出12人,则 =__________.
【答案】30
【分析】
先求得书画组抽出的人数,由此求得乐器组抽出的人数,再根据分层抽样的比例列方程,解方程求得 的
值.
【详解】
依题意,篮球组有 人,书画组有 人,所以书画组抽出 人,所以乐器组抽出人,所以 ,解得 .
故答案为:
【点睛】
本小题主要考查分层抽样,属于基础题.
45.(2022·上海·高三专题练习)已知某社区的家庭年收入的频率分布如下表所示,可以估计该社区内家
庭的平均年收入为__________万元.
家庭年收入
(以万元为单位)
频率 0.2 0.2 0.2 0.26 0.07 0.07
【答案】6.51
【分析】
将表格中各区间家庭收入的中间值乘以频率,然后加总即可.
【详解】
由表格数据知:家庭的平均年收入 万元.
故答案为: .
46.(2022·全国·高三专题练习)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:
[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽
取的零件中,直径落在区间[5.43,5.47]内的个数为________.
【答案】18
【分析】
首先根据题意得到 的频率为 ,再计算频数即可.【详解】
由题知: 的频率为 ,
所以直径落在区间 内的个数为 .
故答案为:18
47.(2022·河南·温县第一高级中学高三阶段练习(理))已知 , , ,…, 的中位数与方差分别
为2,1,则 , , ,…, 的中位数与方差的和为______.
【答案】7
【分析】
根据中位数的概念,方差的性质求解即可.
【详解】
解:因为 , , ,…, 的中位数与方差分别为2,1,,
所以 , , ,…, 的中位数为3,方差为 ,
所以 , , ,…, 的中位数与方差的和为7
故答案为:7.
48.(2022·河南·温县第一高级中学高三阶段练习(文))已知 , , ,…, 的中位数为 ,则
, , ,…, 的中位数为______.
【答案】
【分析】
利用两组数据的中位数存在一样的线性关系求解.
【详解】
解:∵ , , ,…, 与 , , ,…, 的中位数存在一样的线性关系,
∴ , , ,…, 的中位数为 .
故答案为: .49.(2022·全国·高三专题练习)已知数据x,x,x,x,x,x 的标准差为5,则数据3x-2,3x-2,
1 2 3 4 5 6 1 2
3x-2,3x-2,3x-2,3x-2的方差为________.
3 4 5 6【答案】225
【分析】
根据标准差和方差的概念与性质,直接根据公式求解即可.
【详解】
由题意知,数据x,x,x,x,x,x 的方差为25,
1 2 3 4 5 6
根据方差的性质可得,数据3x-2,3x-2,3x-2,3x-2,3x-2,3x-2的方差为 .
1 2 3 4 5 6
故答案为225.
50.(2022·全国·高三专题练习)已知样本 的平均数是 ,标准差是 ,则 的值为
【答案】60
【详解】
解:样本 的平均数是 ,标准差是
所以
四、解答题
51.(2022·全国·高三专题练习)某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分
析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据
表中提供的信息解决下列问题:
成绩分组 频数 频率 平均分
[0,20) 3 0.015 16
[20,40) a b 32.1
[40,60) 25 0.125 55
[60,80) c 0.5 74
[80,100] 62 0.31 88
(1)求a,b,c的值;(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率 (注:60分及60
分以上为及格);
(3)试估计这次数学测验的年级平均分.
【答案】(1) ; ; ;(2) ;(3)73分.
【分析】
(1)根据频率和为1即可得 ,根据频率与频数关系即可得 , ;
(2)根据题意,抽出的200人的数学成绩中,及格的有162人,故 ;
(3)根据平均数的计算公式计算即可.
【详解】
解:(1)由题意可得, ,
,
(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.
所以 .
(3)这次数学测验样本的平均分为 ,
所以这次数学测验的年级平均分大约为73分.
52.(2022·全国·高三专题练习)为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学生化
学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组 ,第二组
,第三组 ,第四组 ,第五组 .已知图中前三个组的频率依次构成等差数列,
第一组和第五组的频率相同.(1)求 , 的值;
(2)估算高分(大于等于80分)人数;
(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位
数精确到0.1).
【答案】(1) ;(2)90;(3)平均值为69.5,中位数为69.4
【分析】
(1)根据题意得到方程组 ,解得答案.
(2)计算高分频率为高分的频率约为 ,得到人数.
(3)直接利用平均数公式计算得到平均值,再设中位数为 ,则
,解得答案.
【详解】
(1)由题意可知: ,解得 .
(2)高分的频率约为: .
故高分人数为: .
(3)平均值为:
.
设中位数为 ,则 , .
故中位数为 .
53.(2022·全国·高三专题练习)某大学艺术专业 名学生参加某次测评,根据男女学生人数比例,使
用分层抽样的方法从中随机抽取了 名学生,记录他们的分数,将数据分成 组: , , ,
,并整理得到如下频率分布直方图:(1)从总体的 名学生中随机抽取一人,估计其分数小于 的概率;
(2)已知样本中分数小于 的学生有 人,试估计总体中分数在区间 内的人数;
(3)已知样本中有一半男生的分数不小于 ,且样本中分数不小于 的男女生人数相等.试估计总体中男
生和女生人数的比例.
【答案】(1)0.4;(2)20;(3) .
【分析】
(1)根据频率 组距 高,可得分数小于70的概率为: ;
(2)先计算样本中分数小于40的频率,进而计算分数在区间 , 内的频率,可估计总体中分数在区
间 , 内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,分别求出男生、
女生的人数,进而得到答案.
【详解】
解:(1)由频率分布直方图知:分数小于70的频率为:
故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;
(2)已知样本中分数小于40的学生有5人,
故样本中分数小于40的频率为:0.05,
则分数在区间 , 内的频率为: ,
估计总体中分数在区间 , 内的人数为 人,
(3)样本中分数不小于70的频率为:0.6,
由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,
故男生的频率为:0.6,则男生人数为 ,
即女生的频率为:0.4,则女生人数为 ,
所以总体中男生和女生人数的比例约为: .
54.(2022·全国·高三专题练习(文))共享单车是指由企业在校园、公交站点、商业区、公共服务区等
场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起
了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了50人就该城市共享单车的推行情况进
行问卷调查,并将问卷中的这50人根据其满意度评分值(百分制)按照 分成5
组,请根据下面尚未完成并有局部污损的频率分布表和频率分布直方图(如图所示)解决下列问题:
(1)求 , , , 的值;
(2)若在满意度评分值为 的人中随机抽取2人进行座谈,求所抽取的2人中至少一人来自第5组
的概率.
【答案】(1) , , , ;(2) .
【分析】
(1)根据频率分布表可得 .先求得 内的频数,即可由总数减去其余部分求得 .结合频率分布直方
图,即可求得 , 的值.
(2)根据频率分布表可知在 内有4人,在 有2人.列举出从这6人中选取2人的所有可能,由古典概型概率计算公式即可求解.
【详解】(1)由频率分布表可得
内的频数为 ,
内的频率为
内的频率为0.04
(2)由题意可知,第4组共有4人,第5组共有2人,
设第4组的4人分别为 、 、 、 ;第5组的2人分别为 、
从中任取2人的所有基本事件为:
, , , , , , , , , , ,
, , , 共15个.
至少一人来自第5组的基本事件有:
, , , , , , , , 共9个.
所以 .
所抽取2人中至少一人来自第5组的概率为 .
55.(2022·全国·高三专题练习)某市的教育主管部门对所管辖的学校进行年终督导评估,为了解某学校
师生对学校教学管理的满意度﹐分别从教师和不同年级的同学中随机抽取若干师生﹐进行评分(满分 分),
绘制如下频率分布直方图(分组区间为 , , , , , ),并将分
数从低到高分为四个等级:满意度评分
满意度等级 不满意 基本满意 满意 非常满意
已知满意度等级为基本满意的有 人.
(1)求表中 的值及不满意的人数﹔(2)记 表示事件“满意度评分不低于 分”,估计 的概率﹔
(3)若师生的满意指数不低于 ,则该校可获评“教学管理先进单位”.根据你所学的统计知识﹐判断
该校是否能获评“教学管理先进单位”?并说明理由.(注:满意指数 )
【答案】(1) ; ;(2) ;(3)可获得,理由见解析.
【分析】
(1)根据频率分布直方图可得 ,设不满意的人数为 再由比例可得
,即可得解;
(2) “满意度评分不低于 分”的频率为: ,即可得解;
(3)带入师生的满意指数为: ,即可得解.
【详解】
(1)由频率分布直方图可知:
,
设不满意的人数为
则 ,
解得
故不满意的人数为 .
(2) “满意度评分不低于 分”的频率为:
,
因此,事件 的概率估计值为 .(3)师生的满意指数为:,
因为
所以该校可获得“教学管理先进单位”的称号.
56.(2022·全国·高三专题练习)为了解高一年级学生的智力水平,某校按1:10的比例对700名高一学生
按性别分别进行“智力评分”抽样调查,测得“智力评分”的频数分布表如表1、表2所示.
表1:男生“智力评分”频数分布表
智力评分/分
频数 2 5 14 13 4 2
表2:女生“智力评分”频数分布表
智力评分/分
频数 1 7 12 6 3 1
(1)求高一年级的男生人数,并完成下面男生“智力评分”的频率分布直方图;
(2)估计该校高一年级学生“智力评分”在 内的人数.
【答案】(1)400, 频率分布直方图见解析;(2)
【分析】
根据表1和抽样比例是1:10即可求出男生人数,根据频率分布直方图的作法:利用频率分布表求出每组
频率.然后求出每组频率/组距的值即可画出频率分布直方图;
由频率分布表可知,样本中“智力评分”在 的人数,再利用抽样比例是1:10即可求出结果.
【详解】
(1)由题中表1可知,样本中男生人数是40,由抽样比例是1:10,可得高一年级男生人数是400.男生“智力评分”的频率分布直方图如图所示.
由频率分布表可知,样本中“智力评分”在 内的频数为28,
所以估计该校高一年级学生“智力评分”在 内的人数为 (人).
【点睛】
本题主要考查利用频率分布表作出频率分布直方图;属于基础题,常考题型.
57.(2020·广东肇庆·模拟预测(文))某快递公司为了解本公司快递业务情况,随机调查了100个营业
网点,得到了这些营业网点2019年全年快递单数增长率x的频数分布表:
(1)分别估计该快递公司快递单数增长率不低于40%的营业网点比例和快递单数负增长的营业网点比例;
(2)求2019年该快递公司快递单数增长率的平均数和标准差的估计值(同一组中的数据用该组区间的中
点值作为代表).(精确到0.01)参考数据:
【答案】(1)快递单数增长率不低于40%的营业网点比例为21%;快递单数负增长的营业网点比例为
2%(2)平均数的估计值为30%,标准差的估计值为17%
【分析】
(1)根据频数分布表得,所调查100个营业网点中,快递单数增长率不低于的营业网点的频率为0.21,快
递单数负增长的营业网点的频率为0.02,由此能求出结果.
(2)求出 0.0296,S2 ,由此能求出2019年该快递公司快递单数增长率的平均数
的估计值和标准差的估计值.
【详解】
(1)根据频数分布表得,所调查100个营业网点中,
快递单数增长率不低于的营业网点的频率为 ,快递单数负增长的营业网点的频率为 ,用样本频率分布估计总体分布得该快递公司快递单数增长率不低于40%的营业网点比例为21%,
快递单数负增长的营业网点比例为2%.
(2) ,
S2=(﹣0.10﹣0.3)2 (0.10﹣0.3)2 (0.30﹣0.3)2 (0.50﹣0.3)2 (0.70﹣
0.3)2 ,
∴ ,
∴2019年该快递公司快递单数增长率的平均数的估计值为30%,标准差的估计值为17%.
【点睛】
本题考查频率、平均数、标准差的求法,考查频数分布表的性质等基础知识,考查数据分析能力、运算求
解能力,是基础题.
58.(2020·全国·高三专题练习(文))对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作
统计,得到如图所示的频率分布直方图.
(1)根据直方图完成以下表格;
成绩 [50,60) [60,70) [70,80) [80,90) [90,100]
频数
(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩?
【答案】(1)表格见解析;(2)78;101;(3)初赛成绩为82分及其以上的选手均可进入复赛.
【分析】
(1)根据频率分布直方图确定每组数据的频率及频数;(2)根据频率分布直方图并利用平均值及方差公式求得参赛选手初赛的平均数及方差;(3)根据(1)的成绩分布表,确定进入复赛的最低分位于[80,90),故成绩为
分.
【详解】
(1)填表如下:
成绩 [50,60) [60,70) [70,80) [80,90) [90,100)
频数 50 150 350 350 100
(2)平均数为 ,
方差: .
(3)进入复赛选手的成绩为 (分),所以初赛成绩为82分及其以上的选手均
可进入复赛.(说明:回答82分以上,或82分及其以上均可).
【点睛】
利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是
众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于
频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
59.(2020·全国·高三开学考试(文))随着电子商务的发展,人们的购物习惯也在改变,几乎所有的需
求都可以通过网络购物来解决,同时顾客的评价也成为电子商铺的“生命线”.某电商平台从其旗下的所有
电商中随机抽取了 个电子商铺,对电商的顾客评价,包括商品符合度、物流服务、服务态度、快递包
装等方面进行调查,并把调查结果转化为顾客的评价指数 ,得到了如下的频率分布表:
评价指数
频数(1)画出这 个电子商铺顾客评价指数的频率分布直方图;
(2)求该电商平台旗下的所有电子商铺的顾客评价指数的平均数与标准差的估计值(同一组中的数据以
该组区间的中点值为代表).(精确到 )附: .
【答案】(1)频率分布直方图见解析;(2)平均数为 ,标准差为 .
【分析】
(1)根据频率分布表,即可得出频率分布直方图;
(2)根据频率分布直方图,由每组的中间值乘以该组的频率,再求和,即可得出平均数,根据方差的计
算公式,即可得出结果.
【详解】
(1)由题中数据,频率分布直方图如下,(2)由题中数据可得, ,方差为 ,
所以标准差 .
60.(2022·全国·模拟预测)中医药文化历史悠久.我国经历了数千年的艰难探索和发展,逐渐积淀成博大
精深的中医药文化.某医药采购商计划从云南昭通购买500千克乌天麻,购买数据如下表:
乌天麻规格
(支/千克)
数量(千克) 200 100 150 50
(1)估计每千克乌天麻的平均支数(同一组中的数据用该区间的中点值作代表);
(2)已知生产商提供该产品的两种销售方案供采购商选择,
方案一:这500千克乌天麻一律售价为280元/千克.
方案二:这500千克按规格不同售出,其售价如下:
乌天麻规格
(支/千克)
售价(元/千克) 300 280 260 240
从采购商的角度考虑,应该选择哪种方案?请说明理由.
【答案】
(1)16支
(2)选择方案二,理由见解析
【分析】
(1)根据频率分布表,利用平均数公式求解;
(2)根据频率分布表,利用平均数公式求得方案二的产品的平均售价,再比较下结论.
(1)
解: ,
所以该采购商购买的乌天麻每千克的平均支数为16支.
(2)
由题意知:方案二的产品的平均售价为:(元/千克).
因为278<280,所以从采购商的角度考虑,选择方案二.