文档内容
专题十六 《统计与统计案例》讲义
16.1 抽样方法与统计图表
题型一 . 抽样方法
1.①某高校为了解学生家庭经济收入情况,从来自城镇的 150名学生和来自农村的150
名学生中抽取100名学生的样本;
②某车间主任从100件产品中抽取10件样本进行产品质量检验.
I.简单随机抽样法;
Ⅱ.分层抽样法.
上述两问题和两方法配对正确的是( )
A.①配I,②配Ⅱ B.①配Ⅱ,②配Ⅰ C.①配I,②配I D.①配Ⅱ,②配
Ⅱ
【解答】解:①、总体中个体明显分层两层:来自城镇的学生和来自农村的学生,故
用分层抽样来抽取样本;
②,总体中个体的数目是100,不是很大,故用简单分层抽样来抽取样本.
故选:B.
2.某学校有男学生400名,女学生600名,为了解男女学生在学习兴趣与业余爱好方面是
否存在显著差异,拟从全体学生中抽取男学生40名,女学生60名进行调查,则这种抽
样方法是 分层抽样 .
【解答】解:总体由男生和女生组成,比例为400:600=4:6,所抽取的比例也是4:
6,故这种抽样方法是分层抽样
故答案为:分层抽样
3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进
行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.10 B.12 C.13 D.14
【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,
∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,
3
丙车间生产产品所占的比例 ,
13
3
因为样本中丙车间生产产品有3件,占总产品的 ,
133
所以样本容量n=3÷ =13;
13
故选:C.
4.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为6的样本,请从
随机数表的倒数第5行(如下,且下一行接在上一行右边)第10列开始,向右读取,
直到取足样本,则抽取样本的第五个号码是 1 7 .
第五行 95 33 95 22 00 18 74 72 00 18 38 79
58 69 32 81 76 80 26 92 82 80 84 25
【解答】解:根据题意,60个个体编号为00,01,…,59,现从中抽取一容量为6的
样本,
从随机数表的倒数第5行第10列开始,向右读取
01,87(舍去),47,20,01(舍去),83(舍去),87(舍去),95(舍去),
86(舍去),93(舍去),28,17,68(舍去),02共6个;
所以抽取样本的号码是01,47,20,28,17,02.
故答案为:17.
题型二 . 统计图表
1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014年1月至
2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根
据该折线图,下列结论正确的是 ②③④ .
①月接待游客量逐月增加;
②年接待游客量逐年增加;
③各年的月接待游客量高峰期大致在7,8月;
④各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳.
【解答】解:对于A,由折线图的变化趋势可得,月接待游客量有增有减,故选项A错
误;对于B,由折线图的变化趋势可得,年接待游客量逐年增加,故选项B正确;
对于C,由折线图可得,各年的月接待游客量高峰期大致在7,8月,故选项C正确;
对于D,由折线图可得,各年1月至6月的月接待游客量相对于7月至12月,
波动性更小,变化比较平稳,故选项D正确.
故答案为:②③④.
2.为了了解某地区高三学生的身体发育情况,抽查了该地区 100名年龄为17.5岁﹣18岁
的男生体重(kg),得到频率分布直方图如图,根据图可得这 100名学生中体重在
(56.5,64.5)的学生人数是( )
A.20 B.30 C.40 D.50
【 解 答 】 解 : 由 频 率 直 方 图 得 , 体 重 在 ( 56.5 , 64.5 ) 的 频 率 为
0.03×2+0.05×2+0.05×2+0.07×2=0.4,
∴所求人数为100×0.4=40.
故选:C.
3.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两
组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5 C.3,7 D.5,7
【解答】解:由已知中甲组数据的中位数为65,
故乙组数据的中位数也为65,
即y=5,
则乙组数据的平均数为:66,
故x=3,
故选:A.
4.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为X 、X ,
A B
样本标准差分别为S ,S ,则( )
A BA.X >X ,S >S B.X <X ,S >S
A B A B A B A B
C.X >X ,S <S D.X <X ,S <S
A B A B A B A B
【解答】解:∵样本A的数据均不大于10,
而样本B的数据均不小于10,
显然X <X ,
A B
由图可知A中数据波动程度较大,
B中数据较稳定,
∴s >s .
A B
故选:B.
题型三 . 统计大题
1.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:
00间各自的车流量(单位:百辆),得如图所示的统计图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,60]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
【解答】解:(1)甲交通站的车流量的极差为73﹣8=65(百辆),乙交通站的车流量
的极差为71﹣5=66(百辆);
7 1
(2)甲交通站的车流量在[10,60]间的频率为 = .
14 2
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上
方,从数据的分布情况来看,甲交通站更繁忙.2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果
得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 28 36 20 10
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值
作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值低于
95的产品至多占全部产品25%”的规定?
【解答】解:(1)由已知作出频率分布表为:
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125)
分组
频数 6 28 36 20 10
频率 0.06 0.28 0.36 0.20 0.10
由频率分布表作出这些数据的频率分布直方图为:
(2)质量指标值的样本平均数为:
x=80×0.06+90×0.28+100×0.36+110×0.20+120×0.10=100;
质量指标值的样本方差为:s2=(﹣20)2×0.06+(﹣10)2×0.28+02×0.36+102×0.20+202×0.10=112;
所以这种产品质量指标值的平均数的估计值为100,方差的计值为112;
(3)∵0.06+0.28=0.34>0.25,
∴不符合规定.
3.为增强市民的节能环保意识,某市面向全市征召义务宣传志愿者.从符合条件的 500名
志愿者中随机抽取100名志愿者,其年龄频率分布直方图如图所示,其中年龄分组区间
是:第一组第1组[20,25)、第2组[25,30)、第3组[30,35)、第4组[35,40)、
第5组[40,45].
(1)求图中x的值并根据频率分布直方图估计这500名志愿者中年龄在[35,40)的人
数;
(2)估计抽出的100名志愿者年龄的第50百分位数(精确到0.1)
(3)若在抽出的第2组和第4组志愿者中,采用按比例分配分层抽样的方法抽取5名志
愿者参加中心广场的宣传活动,再从这5名中采用简单随机抽样方法选取2名志愿者担
任主要负责人.求抽取的2名志愿者中恰好来自同一组的概率.
【解答】解:(1)因为小矩形的面积等于频率,
所以 除[35,40)外的频率和为0.7,
1−0.7
所以x= =0.06,
5
故在500名志愿者中年龄在[35,40)的人数为0.06×5×500=150;
(2)前两个分组的频率和为(0.01+0.04)×5=0.25,
前三个分组的频率和为(0.01+0.04+0.07)×5=0.6,
所以第50百分位数在[30,45)之间,
0.5−0.25
第50百分位数为30+ ×5≈32.09;
0.6
(3)用分层抽样的方法,从中选5名,
则其中第二组的人有2名,第四组的人有3名,
4 2
所以从中抽取的2名志愿者中恰来自同一组额概率为 = .
10 5课后作业 . 抽样方法与统计图表
1.某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学
测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
1
【解答】解:这5名男生成绩的方差为 (22+42+22+42 )=8,
5
1
女生的方差为 (22×3+32×2)=6,
5
男生方差大于女生方差,
所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90,
5名女生成绩的中位数93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,
但不能通过样本计算得到平均数准确值,所以C错;
若抽样方法是分层抽样,因为男生女生不等,
所以分别抽取的人数不等,所以D错.
故选:A.
2.已知样本数据为x ,x ,x ,x ,x ,该样本平均数为5,方差为2,现加入一个数5,
1 2 3 4 5
得到新样本的平均数为x,方差为s2,则( )
A.x>5,s2>2 B.x=5,s2<2 C.x<5,s2<2 D.x=5,s2>2
【解答】解:∵样本数据为x ,x ,x ,x ,x ,该样本平均数为5,方差为2,
1 2 3 4 5
现加入一个数5,得到新样本的平均数为x,方差为s2,
1
∴x= (5×5+5)=5,
6
1 5
方差为s2= [5×2+0]= <2.
6 3故选:B.
3.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛
进球个数的标准差为3;乙队平均每场进球数为 1.8,全年比赛进球个数的标准差为
0.3.下列说法正确的个数为( )
①甲队技术比乙队好;
②乙队发挥比甲队稳定;
③乙队几乎每场都进球;
④甲队表现时好时坏.
A.1 B.2 C.3 D.4
【解答】解:∵甲队平均每场进球数为3.2,乙队平均每场进球数为1.8,
∴甲队技术比乙队好,故①正确,
∵甲全年比赛进球个数的标准差为3;
乙全年比赛进球个数的标准差为0.3.
∴乙队发挥比甲队稳定,故②正确,
乙队标准差为0.3,说明每次进球数接近平均值,乙队几乎每场都进球,甲队标准差为
3,说明甲队表现时好时坏,故③④正确,
总上可知有4种说法正确,
故选:D.
4.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其它
1
7个小长方形的面积和的 ,且样本容量为200,则第8组的频数为( )
4
A.40 B.0.2 C.50 D.0.25
【解答】解:在样本的频率分布直方图中,共有8个小长方形,
1
若最后一个小长方形的面积等于其它7个小长方形的面积和的 ,
4
1
则第8组的频率为 ,
5
1
∵样本容量为200,∴第8组的频数为:200× =40.
5
故选:A.
5.某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,
统计他们的成绩如下表:分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) [90,95)
人数 1 3 6 6 2 1 1
若按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数线为( )
A.70分 B.75分 C.80分 D.85分
【解答】解:由题意得在抽查的20名应试者能能被录取的人数为:
40
20× =4人,
200
∴预测参加面试的分数线为80分.
故选:C.
6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据
(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,
17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试
验数据制成的频率分布直方图,已知第一组与第二组共有 20人,第三组没有疗效的有6
人,则第三组中有疗效的人数为 1 2 .
【解答】解:由频率分布直方图得第一组与第二组的频率和为:
1﹣(0.36+0.16+0.08)=0.4,
∵第一组与第二组共有20人,
20
∴样本单元数n= =50人,
0.4
∵第三组的频率为0.36,∴第三组共有:50×0.36=18人,
∵第三组没有疗效的有6人,
∴第三组中有疗效的人数为:18﹣6=12人.
故答案为:12.
7.某城市一入城交通路段限速50公里/小时,现对某时段通过该交通路段的n辆小汽车车
速进行统计,并绘制成频率分布直方图(如图).若这 n辆小汽车中,速度在40~50
公里/小时之间的车辆有150辆.(1)求n的值;
(2)估计这n辆小汽车车速的中位数;
(3)根据交通法规定,小车超速在规定时速10%以内(含10%)不罚款,超过时速规
定10%以上,需要罚款.试根据频率分布直方图,估计某辆小汽车在该路段被罚款的概
率.
【解答】解:(1)由直方图可知,车速在40~50公里/小时之间的频率为0.3,
150
所以 =0.3,解得n=500,
n
即n的值为500.
(2)设这n辆小汽车车速的中位数为x,
则0.008×10+0.024×10+0.03×(x﹣40)=0.5,
解得x=46,
所以可以估计这n辆小汽车车速的中位数为46.
(3)由交通法规可知,小车速度在55公里/小时以上需要罚款,
由直方图可知,小车速度在50~60公里/小时之间的有500×0.28=140辆,
由统计的有关知识,可以认为车速在55~60公里/小时之间的有70辆,
又小车速度在60~70公里/小时之间的有500×0.10=50辆,
所以这500辆小车中,有70+50=120辆小车超速10%以上,
120 6
故可以估计某辆小汽车在该路段被罚款的概率P= = .
500 25
8.某快餐连锁店招聘外卖骑手,该快餐连锁店外卖覆盖A,B两个区域,骑手入职只能选
择其中一个区域.其中区域A无底薪,外卖业务每完成一单提成5元;区域B规定每日
底薪150元,外卖业务的前35单没有提成,从第36单开始,每完成一单提成8元.为
激励员工,快餐连锁店还规定,凡当日外卖业务超过55单的外卖骑手可额外获得“精
英骑手”奖励50元.该快餐连锁店记录了骑手每天的人均业务量,整理得到如图所示
的两个区域外卖业务量的频率分布直方图.(1)从以往统计数据看,新入职骑手选择区域A的概率为0.6,选择区域B的概率为
0.4,
(ⅰ)随机抽取一名骑手,求该骑手获得当日“精英骑手”奖励的概率;
(ⅱ)若新入职的甲.乙、丙三名骑手分别到该快餐连锁店应聘,三人区域选择相互独
立,求至少有两名骑手选择区域A的概率;
(2)若仅从人均日收入的角度考虑,新聘骑手应选择入职哪一区域?请说明你的理由
(同组中的每个数据用该组区间的中点值代替).
【解答】解:(1)(i)设“随机抽取一名骑手是区域A骑手”为事件M,骑手获得”
精英骑手“奖励为事件N,
则P(M)=0.6,P(M)=0.4,结合频率分布直方图知,P(N|M)=0.3,P(N|M)
=0.2,
所以P(N)=P(M)P(N)|M)+P(M)P(N|M)=0.6×0.3+0.4×0.2=0.26,
因此该骑手获得当日“精英骑手”奖励的概率为0.26;
(ii)设X=选择区域A的骑手人数,则X~B(3,0.6),
P(X≥2)=P(X=2)+P(X=3) 0.62×0.4+0.63=0.648,
=C2×
3
故至少有两名骑手选择区域A的概率0.648;
(2)设Y =区域A骑手日工资,则随机变量Y 分布列为
1 1
Y 100 150 200 250 350 400
1
P 0.05 0.1 0.25 0.3 0.2 0.1
E(Y )=100×0.05+150×0.1+200×0.25+250×0.3+350×0.2+400×0.1=255,
1
设Y =区域B骑手日工资,则随机变量Y 分布列为
2 2
Y 150 190 270 400 480
2
P 0.25 0.25 0.3 0.15 0.05
E(Y )=150×0.25+190×0.25+270×0.3+400×0.15+480×0.05=250.
2
因为E(Y )>E(Y ),所以新聘骑手应选择区域A.
1 2声明:试题解析著作权属所有,未经书面同意,不得复制发布