文档内容
跟踪训练 06 随机抽样、样本估计总体
一.选择题(共15小题)
1.若样本数据 , , , 的方差为2,平均数 为5,则下列说法正确的个数为
①数据 , , , 的平均数为6;
②数据 , , , 的方差为3;
③数据 , , , 的平均数为15;
④数据 , , , 的方差为19.
A.4个 B.3个 C.2个 D.1个
【解答】解:对于①,平均数为
,①正确;
对于②,方差为
,②错误;
对于③,平均数为
,③错误;
对于④,方差为
,④错误.
故选: .2.有下列一组数据:4 4 2 4 9 8 0 5 3,则这组数据的第80百分位数是
A.5.6 B.5 C.8 D.6.2
【解答】解:将该组数据从小到大排列为:0,2,3,4,4,4,5,8,9,共9个,
,
故这组数据的第80百分位数是8.
故选: .
3.如图所示是一次体操比赛时七位评委对某选手打分的茎叶图,去掉一个最高分和一个最
低分后,所剩数据的平均数和标准差分别为
A.87.4,17.2 B.87.4,4.147 C.87,17.2 D.87,4.147
【解答】解:由已知的茎叶图可得七位评委为某参赛选手打出的分数为:82,80,83,
87,95,90,93,
去掉一个最高分95和一个最低分80后,所剩数据的平均数为 ,
所以方差 ,标准差
;
故选: .
4.在一次抽样活动中,采取系统抽样的方法,若第一组抽取的是 2号,第二组抽取的是
12号,则第三组抽取的是
A.21号 B.22号 C.23号 D.24号
【解答】解: 第一组抽取的是2号,第二组抽取的为12号,
组距为10,
故第三组抽取的是 号,
故选: .
5.某市政府部门为了解该市的“全国文明城市”创建情况,在该市的12个区县市中随
机抽查到了甲、乙两县,考核组对他们的创建工作进行量化考核.在两个县的量化考核成绩(均为整数)中各随机抽取20个,得到如图数据(用频率分布直方图估计总体平
均数时,每个区间的值均取该区间的中点值).关于甲乙两县的考核成绩,下列结论正
确的是
A.甲县平均数小于乙县平均数
B.甲县中位数小于乙县中位数
C.甲县众数不小于乙县众数
D.不低于80的数据个数,甲县多于乙县
【 解 答 】 解 : 由 条 形 图 可 知 , 甲 样 本 的 平 均 数 :
,
中位数:79,众数:79,不低于80的数据共5个;
由频率分布直方图可知,一样本的平均数:
中 位 数 : 设 中 位 数 为 , 由 ,
,
故中位数 , , ,
解得 ,众数 , 且 ,即 ,
不低于80的数据共 ,
所以 , , 选项错误,
故选: .6.一个样本容量为10的样本数据,它们组成一个公差为2的等差数列 ,若 , ,
成等比数列,则此样本的平均数和中位数分别是
A.12,13 B.13,13 C.13,12 D.12,14
【解答】解:依题意 , ,解得 ,
所以此样本的平均数为 ,中位数为 .
故选: .
7.要采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,
3, ,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9,抽到的32人
中,编号落入区间 , 的人数为 ,编号落入区间 , 的人数为 ,其余
的人数为 ,则
A. B. C. D.
【解答】解:根据系统抽样的定义先确定每组人数为 人,即抽到号码的公差
,
第一组采用简单随机抽样的方法抽到的号码为29,
等差数列的首项为29,
则抽到号码数为 ,
由 ,
得 ,
即 ,
,即编号落入区间 , 的人数为15人,即 .
由 ,得 ,
即 ,
则
,即编号落入区间 , 的人数为 人,即 .
则 人.
则 ,
故选: .
8.如果两组数 , , , 和 , , , 的平均数分别为 和 ,标准差分别
为 和 ,那么合为一组数 , , , , , , , 后的平均数和标准差
分别是
A. ,
B. ,
C. ,
D. ,
【解答】解:数据 , , , 和 , , , 的平均数分别为 和 ,
则 , ;
所以数据 , , , , , , , 的平均数为;
又标准差为 ,
;
,
;
所以数据 , , , , , , , 的标准差 满足
;
.
故选: .
9.某城市在进行创建文明城市的活动中,为了解居民对“创建文明城”的满意程度,组织
居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为120的样本,发
现所给数据均在 , 内.现将这些分数分成以下6组并画出样本的频率分布直方图,
但不小心污损了部分图形,如图所示.观察图形则下列说法中有错误的是A.第三组的频数为18人
B.根据频率分布直方图估计众数为75分
C.根据频率分布直方图估计样本的平均数为75分
D.根据频率分布直方图估计样本的中位数为75分
【解答】解:对于 ,因为各组的频率之和等于1,所以分数在 , 内的频率为:
,
所以第三组 , 的频数为 (人 ,故正确;
对于 ,因为众数的估计值是频率分布直方图中最高矩形的中点,从图中可看出众数的估
计值为75分,故正确;
对 于 , 又 根 据 频 率 分 布 直 方 图 , 样 本 的 平 均 数 的 估 计 值 为 :
(分 ,故错误;
对于 ,因为 , ,所以
中位数位于 , 上,所以中位数的估计值为: ,故正确;
故选: .
10.抽样统计甲、乙两位同学5次数学成绩绘制成如图所示的茎叶图,则成绩较稳定的那
位同学成绩的方差为A. B.2 C.4 D.10
【解答】解:根据题意,甲同学的5次成绩依次为:89、87、90、91、93,
其平均数 ,
其方差 ;
乙同学的5次成绩依次为:89、87、90、91、93,
其平均数 ,
其方差 ;
则乙同学的成绩较稳定,其方差为2;
故选: .
11.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分
配的分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为 120,女员工
的平均体重为 ,标准差为6,男员工的平均体重为 ,标准差为4.若样本中有21
名男员工,则女员工的人数为
A.28 B.35 C.39 D.48
【解答】解:由题意,记样本中女员工的平均体重和标准差分别为 , ,所占
权重为 ,
男员工的平均体重和标准差分别为 , ,所占权重为 ,
所以样本中全部员工的平均体重为 ,方差,
化简得 ,即 ,
解得 或 (舍 ,
所以女员工的人数为: .
故选: .
12.为了估计水库中鱼的尾数,可以使用以下方法:先从水库中捕出一定数量的鱼,例如
2000尾,给每尾鱼作上记号,不影响其存活,然后放回水库,经过适当时间,让其和水库
中其余的鱼充分混合,再从水库中捕出一定数的鱼,例如 500尾,查看其中有记号的鱼,
设有40尾,试上述数据,估计水库内鱼的尾数是
A.22000 B.23000 C.25000 D.26000
【解答】解:由题意可得有记号的鱼所占的比例大约为 ,设水库内鱼的尾数是 ,
则有 ,解得 ,
故选: .
13.为了了解学生遵守《中华人民共和国交通安全法》的情况,调查部门在某学校进行了
如下的随机调查:向被调查者提出两个问题:(1)你的学号是奇数吗?(2)在过路口
的时候你是否闯过红灯?要求被调查者对调查人员抛掷一枚硬币,如果出现正面,就回
答第(1)个问题;否则就回答第(2)个问题. 被调查者不必告诉调查人员自己回答
的是哪一个问题,只需回答“是”或“不是”,因为只有被调查者本人知道回答了哪个
问题,所以都如实做了回答,结果被调查者的300人(学号从1到 中有90人回答
了“是”,由此可以估计在这300人中闯过红灯的人数是
A.15 B.30 C.45 D.75
【解答】解:要调查300名学生,在准备的两个问题中每一个问题被问到的概率相同,
第一个问题可能被询问150次,
在被询问的150人中有75人学号是奇数,而有90人回答了“是”,
估计有15个人闯过红灯,即在150人中有15个人闯红灯,
根据概率的知识来计算这300人中有过闯过红灯的人数为 ,
故选: .
14.在一次数学竞赛中,高一 班30名学生的成绩茎叶图如图所示:若将学生按成绩由低
到高编为 号,再用系统抽样的方法从中抽取6人,则其中成绩在区间 , 上的
学生人数为
A.3 B.4 C.5 D.6
【解答】解:根据茎叶图得,成绩在区间 , 上的数据有15个,
所以,用系统抽样的方法从所有的30人中抽取6人,
成绩在区间 , 上的学生人数为 .
故选: .
15.某校为了了解学生近视的情况,对四个非毕业年级各班的近视学生人数做了统计,每
个年级都有7个班.如果某个年级的每个班的近视人数都不超过 5人,则认定该年级为
“学生视力保护达标年级”.这四个年级各班近视学生人数情况统计如表:
初一年级 平均值为2,方差为2
初二年级 平均值为1,方差大于0
高一年级 中位数为3,众数为4
高二年级 平均值为3,中位数为4
从表中数据可知:一定是“学生视力保护达标年级”的是
A.初一年级 B.初二年级 C.高一年级 D.高二年级【解答】解:能反应“学生视力保护达标年级”的是平均值和方差:
平均数:与每一个数据有关,更能反映全体的信息;
方差:方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
观察表格中的数据知,选项 符合题意.
故选: .
二.多选题(共5小题)
16.已知一组样本数据 , , , , 中, 与样本平均数相
等, .则去掉以下哪个数据以后,新的样本数据的方差一定比的来的样本数据的方
差小?
A. B. C. D.
【解答】解:根据方差的意义,可知去掉最大值和最小值都可以使样本数据的方差变小,
故 和 符合条件;
去掉 ,样本平均数不变,则根据方差的计算公式可知方差变大,
故 不符合条件;去掉 ,样本方差的变化情况无法确定,也不符合条件.
故选: .
17.为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策
专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分
布直方图.则下列关于这次考试成绩的估计正确的是A.众数为82.5
B.80百分位数为91.7
C.平均数为88
D.没有一半以上干部的成绩在 分之间
【解答】解:由图知:众数出现在 , 之间,故众数为82.5,故 正确;
由图可得该次考试成绩在90分以下所占比例为 ,
在95分以下所占比例为 ,
因此,第80百分位数一定位于 , 内,
所以第80百分位数为 ,故 正确;
由 , 错
误;
由 ,有一半以上干部的成绩在 分之间, 错误.
故选: .
18. 是居民消费价格即消费价格指数,是反映居民家庭一般所购买的消费品和服务项
目价格水平变动的宏观经济指标.如图是国家统计局发布的 2022年5月至2023年5月全
国居民消费价格涨跌幅统计图,其中同比是与上年同期对比(如今年5月与上年5月),
侧重数据长期趋势,环比是与上月对比(如今年5月与4月),侧重数据短期变化,则下
列说法正确的是A.2022年5月至2023年5月同比涨幅极差为
B.2023年1月至5月同比涨幅的 分位数为
C.从环比看, 由2023年2月至4月开始持续上涨
D.随机从2023年1月至5月的同比数据选择两个研究,则选取4月和5月的概率为
【解答】解:对于 ,极差为 ,故 正确;
对于 ,数据由小到大排列为 , , , , ,而 ,
所以 分位数为第4个数 ,故 正确;
对于 ,2月至4月均为负数,说明下降,故 错误;
对于 ,等价于从5个数字中随机选取2个,样本空间包含的样本点总数为10,其中随机
事件“选到4月和5月”包含的样本点数为1,
古典概型概率计算公式可得所求概率为 ,故 错误.
故选: .
19.为了打赢“脱贫攻坚”战役,国家设立了“中央财政脱贫专项资金”以保证对各省贫
困地区的持续投入.小莹同学通过登陆国家乡村振兴局网站,查询到了 2020年中央财政脱
贫专项资金对28个省份的分配额度(亿元),并对数据进行整理和分析.图1是反映2020
年中央财政脱贫专项资金分配额度的频数分布直方图,且在 这一组分配的额度
分别是:25,28,28,30,37,37,38,39,39.图2是反映 年中央财政脱贫专项资金对自治区 和自治区 的分配额度变化折线图.则下列说法中正确的是
A.2020年,中央财政脱贫专项资金对各省份的分配额度的中位数为37.5亿元
B.2020年,某省获得的分配额度为95亿元,该额度在28个省份中由高到低排第六名
C. 年,中央财政脱贫专项资金对自治区 的分配额度逐年增加
D. 年,中央财政脱贫专项资金对自治区 的分配额度比对自治区 的稳定
【解答】解:将这28个省、直辖市、自治区分配扶贫资金额度从小到大排列后处在中间位
置的两个数的平均数为 (亿元),
因此中位数是37.5亿元,故 说法正确;
由频数分布直方图可知, 的有2个省, 的有2个省,
的有1个省,
而95亿元在 且只有1个省,因此它位于第六名,故 说法正确;
由统计图可知, 年,中央财政脱贫专项资金对自治区 的分配额度逐年增加,
故 说法正确;
由两个自治区 年中央财政脱贫专项资金变化情况的折线统计图可直观得到,
自治区的比 自治区的变化、波动要大,所以中央财政脱贫专项资金对自治区 的分配
额度比对自治区 的稳定,故 说法错误.
故答案为: .
20.已知样本 , , , 的均值为4,标准差为 ,样本 , ,, 的均值为3,方差为4,则下列结论正确的是
A.
B.
C.样本 和样本 的极差相同
D.样本 和样本 的中位数相同
【解答】解:选项 , ,设样本 , , , 的均值为 ,方差为 ,极差为 ,
中位数为 ,
则 ,则 , , ,
所以 , , , ,故 正确, 错误;
选项 ,样本 , , , ;样本 , , , ,
可得样本 和样本 的极差相等,故 正确;
选项 ,设样本 的中位数为 ,样本 的中位数为 ,故 错误.
故选: .
三.填空题(共5小题)
21.已知一组数据 , , , , 的方差是 ,那么另一组数据 , ,
, , 的方差是 .
【解答】解:根据题意,设数据 , , , , 的平均数为 ,其方差是 ,
则有 ,
,
对于数据 , , , , ;其平均数 ;
其方差 ;
即数据 , , , , 的方差是 ;
故答案为: .
22.已知某区甲、乙、丙三所学科基地学校的数学强基小组人数分别为 24,8,16人,在
一次统一考试中,该区三所学校强基学生的平均分分别为 118,120,114,方差分别为
15,12,21,则该区所有数学强基学生成绩的平均数 11 7 ,方差 .
【解答】解:甲、乙、丙三所学科基地学校的数学强基小组人数分别为24,8,16人,
则甲、乙、丙三所学科基地学校的人数占比分别为: , ,
,
所以 ,
由方差公式 ,可得 ,
所以 ,即 ,所以 ,
,即 ,所以 ,
,即 ,所以 ,
则 .
故答案为:117;21.5.
23.某班运动队由足球队员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参
加一项),现从这些运动员中抽取一个容量为 的样本,若分别采用系统抽样和分层抽样法,则都不用剔除个体;当样本容量为 时,若采用系统抽样法,则需要剔除1个
个体,那么样本容量 为 6 .
【解答】解:由题意知采用系统抽样和分层抽样方法抽取,不用剔除个体;
如果样本容量增加一个,则在采用系统抽样时,
需要在总体中先剔除1个个体,
总体容量为 .
当样本容量是 时,由题意知,系统抽样的间隔为 ,
分层抽样的比例是 ,抽取的乒乓球运动员人数为 ,
篮球运动员人数为 ,足球运动员人数为 ,
应是6的倍数,36的约数,
即 ,12,18.
当样本容量为 时,总体容量是35人,
系统抽样的间隔为 ,
必须是整数,
只能取6.
即样本容量 .
故答案为:6
24.若某市6所中学参加中学生合唱比赛的得分用茎叶图表示如图,其中茎为十位数,叶
为个位数,则这组数据的方差是 .
【解答】解:根据题意,由茎叶图可得所给的数据为:87、91、93、92、90、93,
其平均数 ,
则其方差 ,故答案为: .
25.为了了解参加运动会的2000名运动员的年龄情况,从中抽取20名运动员的年龄进行
统计分析.就这个问题,下列说法中正确的有 ④⑥ .
①2000名运动员是总体;
②每个运动员是个体;
③所抽取的20名运动员是一个样本;
④样本容量为20;
⑤抽样方法可采用随机数法抽样;
⑥每个运动员被抽到的机会相等.
【解答】解:①2000名运动员的年龄是总体,故①错误;
②每个运动员的年龄是个体,故②错误;
③所抽取的20名运动员的年龄是一个样本,故③错误;
④从2000名运动员的年龄中抽取20名运动员的年龄进行统计分析,样本容量为20,正确;
⑤随机数法常常用于总体个数较少时,它的主要特征是从总体中逐个抽取,当总体中的个
体数较多时,编号复杂,将总体“搅拌均匀”也比较困难,用随机法产生的样本代表性
差的可能性很大,故⑤错误;
⑥每个运动员被抽到的机会相等,正确.
故答案为:④⑥.
四.解答题(共3小题)
26.某学校为了丰富学生课余生活,开展了“第二课堂”的活动,推出了以下四种选修课
程: .绘画; .唱歌; .演讲; .十字锈.学校规定:每个学生都必须报名且只
能选择其中的一个课程.学校随机抽查了部分学生,对他们选择的课程情况进行了统计,
并绘制了如下两幅不完整的统计图.请结合统计图中的信息,解决下列问题:
(1)这次学校抽查的学生人数是_____;
(2)将条形统计图补充完整;
(3)求扇形统计图中, 课程部分的圆心角的度数;
(4)如果该校共有1000名学生,请你估计该校报 的学生约有多少人?【解答】解:(1) (人 ,
这次学校抽查的学生人数是40人;
(2)样本中选择 课程的人数为: (人 ,
补全条形统计图如下:
(3) ,
即 课程部分的圆心角的度数为 ;
(4) (人 ,
即该校1000名学生中报 的大约有100人.
27.某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职
业的人举办了一次“一带一路”知识竞赛,满分100分 分及以上为认知程度高),结果
认知程度高的有 人,按年龄分成5组,其中第一组: , ,第二组: , ,第三组: , ,第四组: , ,第五组: , ,得到如图所示的频率分布
直方图,已知第一组有10人.
(1)根据频率分布直方图,估计这 人的平均年龄和第80百分位数;
(2)现从以上各组中用分层随机抽样的方法抽取 20人,担任本市的“中国梦”宣传使者.
若有甲(年龄 ,乙(年龄 两人已确定入选宣传使者,现计划从第四组和第五组被抽
到的使者中,再随机抽取2名作为组长,求甲、乙两人至少有一人被选上的概率.
【 解 答 】 解 : ( 1 ) 设 这 人 的 平 均 年 龄 为 , 则
(岁 ,
设第80百分位数为 ,
由 ,
解得 .
(2)由题意得,第四组应抽取4人,记为 , , ,甲,第五组抽取2人,记为 ,
乙,
对应的样本空间为: , , ,甲), ,乙), , , ,
甲), ,乙), , ,甲), ,乙), ,(甲,乙),(甲, ,
(乙, ,共15个样本点,
设事件 “甲、乙两人至少一人被选上”,则 ,甲), ,乙), ,甲), ,乙), ,甲), ,乙),(甲,
乙),(甲, ,(乙, ,共有9个样本点,
所以 .
28.某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛,为了了解本次竞赛
成绩情况,从中抽取了部分学生的成绩作为样本进行统计.请根据下面尚未完成并有局部
污损的频率分布表和频率分布直方图(如图所示)解决下列问题:
频率分布表:
组别 分组 频数 频率
第一组 8 0.16
,
第二组 ■
,
第三组 20 0.40
,
第四组 ■ 0.08
,
第五组 2
,
第六组 合计 ■ ■
(1)写出 , , , 的值;
(2)若根据这次成绩,学校准备淘汰 的同学,仅留 的同学进入下一轮竞赛,请
问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取了10名学生的分数: , , , , ,已知这
10个分数的平均数 ,标准差 ,若剔除其中的100和80两个分数,求剩余8个
分数的平均数与标准差.
( 附 : 方 差 计 算 公 式 : 或【解答】解:(1)根据分组在 , 的频数是8,频率是0.16,
样本容量为 ,
频率分布表为:
组别 分组 频数 频率
第1组 8 0.16
,
第2组 0.32
,
第3 组 20 0.40
,
第4 组 4 0.08
,
第5组 2
,
合计 50 1
, , , .
(2)由频率分布表得 , 的频率为: ,
, 的频率为0.08,
根据这次成绩,学校准备淘汰 的同学,仅留 的同学进入下一轮竞赛,
晋级分数线为: .
(3)由题意剩余的8个分数的平均值为 ,个分数的标准差为 ,
剩余8个分数的标准差为 .