文档内容
章末复习提升课
抽样方法
一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,
某月的产量(单位:辆)如下表:
轿车A 轿车B 轿车C
舒适型 100 150 z
标准型 300 450 600
按类用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中A类轿车有10辆.
(1)求z的值;
(2)用分层随机抽样的方法从C类轿车中抽取一个容量为5的样本,求舒适型、标准型
的轿车应分别抽取多少辆?
【解】 (1)设该厂本月生产轿车n辆,由题意得=,所以n=2 000,则z=2 000-100
-300-150-450-600=400.
(2)设所抽取的样本中有m辆舒适型轿车,因为用分层随机抽样的方法从C类轿车中抽
取一个容量为5的样本,所以由(1)知=,解得m=2,所以在C类轿车中抽取2辆舒适型轿
车,3辆标准型轿车.
与分层随机抽样有关问题的常见类型及解题策略
(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本
数)确定该层的样本(或总体)数.
(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.
1.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高
二年级学生180名,为了解学生身体状况,现采用分层随机抽样方法进行调查,在抽取的
样本中高二学生有32人,则该样本中高三学生人数为______.
解析:高三年级学生人数为430-160-180=90,设高三年级抽取x人,由分层随机抽
样可得=,解得x=16.
答案:16
2.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,
为了了解该单位职工的健康情况,用分层随机抽样的方法从中抽取样本,若样本中的青年
职工为14人,则样本量为______.
解析:因为分层随机抽样的抽样比应相等,所以=,样本量==32.
答案:32
频率分布直方图的应用
下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:
cm):
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
区间界限 [142,146) [146,150) [150,154) [154,158]
人数 20 11 6 5
(1)列出样本的频率分布表(频率保留两位小数);
(2)画出频率分布直方图;
(3)估计身高低于134 cm的人数占总人数的百分比.
【解】 (1)列出样本频率分布表:
分组 频数 频率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09[150,154) 6 0.05
[154,158] 5 0.04
合计 120 1.00
(2)画出频率分布直方图,如图所示.
(3)因为样本中身高低于134 cm的人数的频率为
=≈0.19.
所以估计身高低于134 cm的人数约占总人数的19%.
与频率分布直方图有关问题的常见类型
及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据
求出样本与整体的关系,利用频率和等于1可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学
生,得到这M名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方
图,如图所示:
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1
(1)求表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,
15)内的人数.
解:(1)由分组[10,15)的频数是10,频率是0.25,知=0.25,
解得M=40.
因为频数之和为40,所以10+24+m+2=40,
得m=4,p===0.10.
因为a是对应分组[15,20)的频率与组距的商,
所以a==0.12.
(2)因为该校高三学生有240人,分组[10,15)的频率是0.25,所以估计该校高三学生
参加社区服务的次数在区间[10,15)内的人数为240×0.25=60.
众数、中位数、平均数、方差与标准差的应用
某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若
干次测试成绩中随机抽取8次,数据如下(单位:分):
甲 95 82 88 81 93 79 84 78
乙 83 75 80 80 90 85 92 95
(1)请你计算这两组数据的平均数、中位数;
(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人
参加合适?请说明理由.
【解】 (1) x =(95+82+88+81+93+79+84+78)=85(分),
甲
x =(83+75+80+80+90+85+92+95)=85(分).
乙
甲、乙两组数据的中位数分别为83分、84分.
(2)由(1)知x =x =85分,所以
甲 乙
s=[(95-85)2+(82-85)2+…+(78-85)2]=35.5,
s=[(83-85)2+(75-85)2+…+(95-85)2]=41.
①从平均数看,甲、乙均为85分,平均水平相同;
②从中位数看,乙的中位数大于甲,乙的成绩好于甲;
③从方差来看,因为x =x ,s<s,所以甲的成绩较稳定;
甲 乙
④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成
绩好些;
⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.
综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头
等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.
用样本的数字特征估计总体的数字特征
应注意的问题
(1)众数、中位数、平均数的含义及求法.
(2)方差、标准差的计算.
(3)中位数用来描述分类变量的中心位置,众数体现了数据的最大集中点,平均数反映样本数据的总体水平.
(4)标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数
据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
为了比较甲、乙两地某月14时的气温情况,随机抽取了该月中的5天,
将这5天中14时的气温数据(单位:℃)列表如下:
甲 26 28 31 29 31
乙 28 30 29 31 32
以下结论正确的是( )
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
A.①③ B.①④
C.②③ D.②④
解析:选B.法一:因为x ==29,x ==30,
甲 乙
所以x s 故可判断结论①④正确.
甲 乙.
法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月
14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.
1.(2019·河北省沧州市期末考试)某学校高一、高二年级共有1 800人,现按照分层随
机抽样的方法,抽取90人作为样本进行某项调查.若样本中高一年级学生有42人,则该
校高一年级学生共有( )
A.420人 B.480人
C.840人 D.960人
解析:选C.由题意需要从1 800人中抽取90人,所以抽样比为=.又样本中高一年级学
生有42人,所以该校高一年级学生共有42×20=840(人).故选C.
2.(2019·陕西省西安市长安区第一中学期末考试)如图所示是一容量为100的样本的频
率分布直方图,则由图形中的数据,样本落在[5,10]内的频数为( )A.50 B.40
C.30 D.20
解析:选D.第一个小矩形的面积为0.04×5=0.2, 所以样本落在[5,10]内的频数为
0.2×100=20.故选D.
3.甲、乙两个城市某年4月中旬,每天的最高气温统计图如图所示,这9天里,气温
比较稳定的是________.
解析:从折线统计图中可以很清楚地看到乙城市的气温变化较大,而甲城市的气温相
对来说较稳定,变化基本不大.
答案:甲城市
4.由正整数组成的一组数据x ,x ,x ,x ,其平均数和中位数都是2,且标准差等于
1 2 3 4
1,则这组数据为________.(从小到大排列)
解析:假设这组数据按从小到大的顺序排列为x,x,x,x,则所以
1 2 3 4
又s=
=
==1,
所以(x-2)2+(x-2)2=2.
1 2
同理可求得(x-2)2+(x-2)2=2.
3 4
由x ,x ,x ,x 均为正整数,且(x ,x),(x ,x)均为圆(x-2)2+(y-2)2=2上的点,
1 2 3 4 1 2 3 4
分析知x,x,x,x 应为1,1,3,3.
1 2 3 4
答案:1,1,3,3
[A 基础达标]
1.某防疫站对学生进行身体健康调查,欲采用分层随机抽样的方法抽取样本.某中学
共有学生2 000名,从中抽取了一个容量为200的样本,其中男生103名,则该中学共有女
生为( )
A.1 030名 B.97名
C.950名 D.970名
解析:选D.由题意,知该中学共有女生2 000×=970(名),故选D.
2有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9
[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12
[35.5,39.5) 7 [39.5,43.5] 3则总体中大于或等于31.5的数据所占的比例为( )
A. B.
C. D.
解析:选B.由题意知,样本量为66,而落在[31.5,43.5]内的样本个数为12+7+3=
22,故总体中大于或等于31.5的数据约占=.
3.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的
有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众
数、中位数分别是( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
解析:选C.因为得85分的人数最多,为4人,所以众数为85,中位数为85,平均数
为(100+95+90×2+85×4+80+75)=87.
4.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分
布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为
( )
A.6万元 B.8万元
C.10万元 D.12万元
解析:选C.设11时至12时的销售额为x万元,由于频率分布直方图中各小组的组距
相同,故各小矩形的高度之比等于频率之比,也等于销售额之比,所以9时至10时的销售
额与11时至12时的销售额的比为=,
所以有=,解得x=10,故选C.
5.某学校举行的运动会上,七位评委为某位体操选手打出的分数为79,84,84,
86,84,87,93,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(
)
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
解析:选C.最高分是93分,最低分是79分,所剩数据的平均数为x=80+=85,方差
为s2=×[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.
6.12,13,25,26,28,31,32,40 的 25%分位数为________,80%分位数为
________.
解析:因为8×25%=2,8×80%=6.4.所以25%分位数为==19,80%分位数为x =
7
32.答案:19 32
7.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这
批产品的平均长度为________mm.
解析:根据频率分布直方图,估计这批产品的平均长度为(12.5×0.02+17.5×0.04+
22.5×0.08+27.5×0.03+32.5×0.03)×5=22.75 mm.
答案:22.75
8.下图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校共有学生 3
000人,由统计图可得该校共捐款为________元.
解析:由扇形统计图可知,该中学高一、高二、高三分别有学生960人、990人、1
050人,由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、10元,
所以共捐款15×960+13×990+10×1 050=37 770(元).
答案:37 770
9.为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有
900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩
(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率分
布直方图,解答下列问题:
组号 分组 频数 频率
1 [50,60) 4 0.08
2 [60,70) 8 0.16
3 [70,80) 10 0.20
4 [80,90) 16 0.32
5 [90,100]
合计
(1)填充频率分布表中的空格;
(2)如图,不具体计算,补全频率分布直方图;(3)估计这900名学生竞赛的平均成绩(同一组中的数据用该组区间的中点值作代表).
解:(1)=50,即样本量为50.
第5组的频数为50-4-8-10-16=12,
从而第5组的频率为=0.24.
又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.
(2)根据小长方形的高与频数成正比,设第一个小长方形的高为h ,第二个小长方形的
1
高为h,第五个小长方形的高为h.
2 5
由等量关系得=,=,补全的频率分布直方图如图所示.
(3)50名学生竞赛的平均成绩为
x==79.8≈80(分).
利用样本估计总体的思想可得这900名学生竞赛的平均成绩约为80分.
[B 能力提升]
10.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方
线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是
________.
解析:众数是一组数据出现次数最多的数,结合题中频率分布折线图可以看出,数据
“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众
数是115.
答案:115
11.某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得
数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是[0,100],样本数据分
组为[0,20),[20,40),[40,60),[60,80),[80,100].(1)频率分布直方图中x的值为________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1 200名,
估计新生中可以申请住校的学生有________名.
解析:(1)由频率分布直方图,可得20x+0.025×20+0.006 5×20+0.003×2×20=1,
所以x=0.012 5.
(2)新生上学路上所需时间不少于 1 小时的频率为 0.003×2×20=0.12,因为 1
200×0.12=144,所以1 200名新生中约有144名学生可以申请住校.
答案:(1)0.012 5 (2)144
12.共享单车入驻泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受人们
的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等
三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中
随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者
的满意度进行汇总,得到如下三个表格:
表(一)
使用者 25岁 26岁~ 36岁~ 45岁
年龄段 以下 35岁 45岁 以上
人数 20 40 10 10
表(二)
使用 0~6 7~14 15~22 23~31
频率 次/月 次/月 次/月 次/月
人数 5 10 20 5
表(三)
非常满意 满意 一般 不满意
满意度
(9~10) (8~9) (7~8) (6~7)
人数 15 10 10 5
(1)依据上述表格完成下列三个统计图形:(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁~35岁
之间,每月使用共享单车在7~14次的人数.
解:(1)
(2)由表(一)可知:年龄在26岁~35岁之间的有40人,占总抽取人数的一半,用样本
估计总体的思想可知,某城区30万人口中年龄在26岁~35岁之间的约有30×=15(万人);
又年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的,
用样本估计总体的思想可知,年龄在26岁~35岁之间15万人中每月使用共享单车在7~
14次之间的约有15×=(万人),所以年龄在26岁~35岁之间,每月使用共享单车在7~14
次之间的人数约为万人.[C 拓展探索]
13.某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测
得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组 频数 频率
[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10 000只,
试根据抽样检查结果估计这批产品的合格数.
解:(1)频率分布表:
分组 频数 频率
[39.95,39.97) 2 0.10 5
[39.97,39.99) 4 0.20 10
[39.99,40.01) 10 0.50 25
[40.01,40.03] 4 0.20 10
合计 20 1
频率分布直方图:
(2)因为抽样的20只产品中在[39.98,40.02]范围内有18只,所以合格率为×100%=
90%,
所以10 000×90%=9 000(只).即根据抽样检查结果,可以估计这批产品的合格数为9 000只.