文档内容
第九章 统计与统计案例
第一节 统计
核心素养立意下的命题导向
1.会用简单随机抽样方法从总体中抽取样本,凸显数据分析的核心素养.
2.借助频率分布表画频率分布直方图、频率折线图,提升读图、数据分析的能力,凸显直观想
象、数据分析的核心素养.
3.能从样本数据中提取样本的数字特征(如平均数、标准差),并做出合理的解释,凸显数学运
算的核心素养.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.
理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题,凸显数学
建模的核心素养.
[理清主干知识]
1.简单随机抽样
(1)抽取方式:逐个不放回地抽取.
(2)特点:每个个体被抽到的概率相等.
(3)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量
的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
4.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线
图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
5.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a,a,…,a 这n个数的平均数.
1 2 n
(4)标准差与方差:设一组数据x,x,x,…,x 的平均数为,则这组数据的标准差和方差分别
1 2 3 n
是
s= ,
s2=.
[澄清盲点误点]
一、关键点练明
1.(分层抽样)某公司生产A,B,C三种不同型号的轿车,其产量之比为2∶3∶4,为检验该公
司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B
种型号的轿车少8辆,则n=( )
A.96 B.72
C.48 D.36
解析:选B 由题意得n-n=8,所以n=72.故选B.
2.(多选·用样本估计总体)某城市收集并整理了该市2020年1月份至10月份每月最低气温
与最高气温(单位:℃)的数据,绘制了如图所示的折线图,已知该市每月的最低气温与当月的
最高气温两变量具有较好的线性关系,则根据该折线图,下列结论正确的是( )
A.每月的最低气温与当月的最高气温两变量为正相关
B.10月份的最高气温不低于5月份的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月份
D.最低气温低于0 ℃的月份有4个
解析:选ABC 由图可以看出,当最低气温较大时,最高气温也较大,故A正确;10月份的最
高气温大于20 ℃,而5月份的最高气温为不超过20 ℃,故B正确;从各月的温差看,1月份
的温差最大,故C正确;而最低气温低于0 ℃的月份是1,2,4三个月份,故D错误.
3.(数字特征)若数据x,x,x,…,x 的平均数=5,方差s2=2,则数据3x+1,3x+1,3x+
1 2 3 n 1 2 3
1,…,3x +1的平均数和方差分别为( )
n
A.5,2 B.16,2
C.16,18 D.16,9
解析:选C 因为x,x,x,…,x 的平均数为5,所以=5,所以+1=3×5+1=16,因为x,
1 2 3 n 1
x,x,…,x 的方差为2,所以3x+1,3x+1,3x+1,…,3x +1的方差是32×2=18.故选C.
2 3 n 1 2 3 n4.(频率分布直方图)如图是100位居民月均用水量的频率分布直方图,则月均用水量为
[2,2.5)范围内的居民数有________人.
解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为:0.5×0.5=
0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.
答案:25
二、易错点练清
1.(易忽略抽样的等可能性)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容
量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为( )
A.40 B.60
C.80 D.120
解析:选D 因为用分层抽样方法从总体中抽取一个容量为10的样本.由B层中每个个体被
抽到的概率都为,知在抽样过程中每个个体被抽到的概率是,所以总体中的个体数为10÷=
120.故选D.
2.(中位数、众数、平均数的求法不清)为了普及环保知识,增强环保意识,某大学随机抽取30
名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均
数为,则m,n,的大小关系为________.(用“<”连接)
解析:由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即
m=5.5;又5出现次数最多,故n=5;=(2×3+3×4+10×5+6×6+3×7+2×8+2×9+
2×10)≈5.97.故n300
空气质量 优 良 轻度污染 中度污染 重度污染 严重污染
下图是某市10月1日~20日AQI指数变化趋势,则下列叙述正确的是( )
A.这20天中AQI指数值的中位数略高于100
B.这20天中的中度污染及以上的天数占
C.该市10月的前半个月的空气质量越来越好D.总体来说,该市10月上旬的空气质量比中旬的好
[解析] (1)由饼状图可知互联网从业人员中90后占56%,一半以上,故A项正确;由条形图
知,90后从事技术岗位的人数占互联网行业为39.6%×56%=22.176%>20%,所以互联网
行业中从事技术岗位的人数占总人数的百分比大于等于22.176%,B项正确;由条形图知,
90后从事运营岗位的人数占互联网行业为17%×56%=9.52%,大于80前互联网从业人数,
C项正确;因为技术所占比例80后未知,且90后从事技术岗位的人数比22.176%<41%,所
以D项不一定正确.
(2)A项,由题图知排序后第10个数据、第11个数据的平均数大于100,即中位数略高于100;
B项,中度污染及以上的天数为5天,占;由题图知C错误;D项,总体来说,该市10月上旬
的空气质量比中旬的空气质量好.
[答案] (1)ABC (2)ABD
考法(二) 频率分布直方图
[例2] 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生
活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部
分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年
100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,
制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
[解] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,
0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,
解得a=0.30.
(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为 300
000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,
所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,
解得x=2.9.
所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过该标准.
[方法技巧]
1.由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
2.利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中
位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
[针对训练]
1.已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解
该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容
量和抽取的户主对四居室满意的人数分别为( )
A.240,18 B.200,20
C.240,20 D.200,18
解析:选A 样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为
150×30%×40%=18.故选A.
2.(2021·德州模拟)港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、
珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100
km/h,现对大桥某路段上1 000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如
图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90
km/h的频率分别为( )A.300,0.25 B.300,0.35
C.60,0.25 D.60,0.35
解析:选B 由频率分布直方图得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5
=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1 000=300,行驶速度超
过90 km/h的频率为(0.05+0.02)×5=0.35.故选B.
3.(多选)(2021·泰安模拟)某院校教师情况如下表所示:
类别 老年 中年 青年
年度 男 女 男 女 男 女
2018 120 60 240 120 100 40
2019 210 40 320 200 200 120
2020 300 150 400 270 320 280
关于2018年、2019年、2020年这3年该院校的教师情况,下面说法正确的是( )
A.2019年男教师最多
B.该校教师最多的是2020年
C.2019年中年男教师比2018年多80人
D.2018年到2020年,该校青年年龄段的男教师人数增长率为220%
解析:选BCD 由题意知,2020年的男教师最多,A错误;将表中各年度人数横向求和可知,
2020年共有1 720人,为人数最多的一年,B正确;2019年中年男教师比2018年多320-240
=80(人),故C正确;2018~2020青年男教师增加了220人,增长率为220÷100=220%,故D
正确.
考点三 用样本的数字特征估计总体的数字特征
[典例] (2020·全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为
A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工
费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分
厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为
决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品
的等级,整理如下:
甲分厂产品等级的频数分布表
等级 A B C D频数 40 20 20 20
乙分厂产品等级的频数分布表
等级 A B C D
频数 28 17 34 21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪
个分厂承接加工业务?
[解] (1)由试加工产品等级的频数分布表知,
甲分厂加工出来的一件产品为A级品的概率的估计值为=0.4;乙分厂加工出来的一件产品
为A级品的概率的估计值为=0.28.
(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为
利润 65 25 -5 -75
频数 40 20 20 20
因此甲分厂加工出来的100件产品的平均利润为
=15.
由数据知乙分厂加工出来的100件产品利润的频数分布表为
利润 70 30 0 -70
频数 28 17 34 21
因此乙分厂加工出来的100件产品的平均利润为
=10.
比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.
[方法技巧]
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.
标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,
越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[针对训练]
某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方
法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分
成7组,并整理得到如图所示的频率分布直方图.(1)估计总体的众数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.
试估计总体中男生和女生人数的比例.
解:(1)由频率分布直方图可估计总体的众数为=75.
(2)由频率分布直方图可知,样本中分数在区间[50,90)内的人数为(0.01+0.02+0.04+
0.02)×10×100=90.
因为样本中分数小于40的学生有5人,
所以样本中分数在区间[40,50)内的人数为100-90-5=5.
设总体中分数在区间[40,50)内的人数为x,
则=,解得x=20,
故估计总体中分数在区间[40,50)内的人数为20.
(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60.
因为样本中分数不小于70的男女学生人数相等,
所以样本中分数不小于70的男生人数为30.
因为样本中有一半男生的分数不小于70,所以样本中男生的人数为60,女生的人数为40.
由样本估计总体,得总体中男生和女生人数的比例约为3∶2.
创新思维角度——融会贯通学妙法
巧解平均数和方差
类型(一) 找齐法
在计算平均数时,如果这些数字都在某个数字左右摆动,就选取一个数字作为标准进行找齐.
[例1] 计算数据87,86,90,82,83,85,88,80,79,90的平均数和方差.
[解] 每个数据都减去85后得数据2,1,5,-3,-2,0,3,-5,-6,5,这组数据的平均数是(2+
1+5-3-2+0+3-5-6+5)=0,故原数据组的平均数为85+0=85.
数据组 2,1,5,-3,-2,0,3,-5,-6,5 的方差是=13.8,这个方差就是数据组
87,86,90,82,83,85,88,80,79,90的方差.
[名师微点]
找齐法的依据是平均数==
=a+;
方差s2=×[(x -)2+(x -)2+…+(x -)2]=×{[(x -a)-(-a)]2+[(x -a)-(-a)]2+…+
1 2 n 1 2
[(x -a)-(-a)]2},其中a为选取作为标准的数字,在使用找齐法时a的选取可以多种多样,
n
原则是便于计算.
类型(二) 方差的简化公式法
方差的一个简化公式是s2=[(x+x+…+x)-n()2]=-()2(其中=(x+x+…+x)),只要把方差
公式展开进行重组即可证明.
[例2] 计算数据54,55,53,56,57,58的方差.
[解] 法一:=≈3 083.17,=55.5,故s2=3 083.17-55.52=2.92.
法二:每个数据减去55得到新的数据组-1,0,-2,1,2,3,该组数据的方差与原数据组的方差
相等,且=≈3.17,==0.5,故s2=3.17-0.52=2.92.
[例3] (2020·全国卷Ⅲ)设一组样本数据x,x,…,x 的方差为0.01,则数据10x 10x,…,
1 2 n 1, 2
10x 的方差为( )
n
A.0.01 B.0.1
C.1 D.10
[解析] ∵样本数据x,x,…,x 的方差为0.01,
1 2 n
∴样本数据10x 10x,…,10x 的方差为102×0.01=1.
1, 2 n
[答案] C
[例4] (2021·湖北随州调研)2020年初新冠肺炎疫情袭击全国,口罩成为重要的抗疫物资,
为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产,设该工厂连续5天生
产的口罩数依次为x,x,x,x,x(单位:十万只),若这组数据x,x,x,x,x 的方差为1.44,
1 2 3 4 5 1 2 3 4 5
且x,x,x,x,x的平均数为4,则该工厂这5天平均每天生产口罩________十万只.
[解析] 法一:依题意,得x+x+…+x=20.
设x,x,x,x,x 的平均数为,
1 2 3 4 5
根据方差的计算公式有[(x-)2+(x-)2+…+(x-)2]=1.44,
1 2 5
∴(x+x+…+x)-2(x+x+…+x)+52=7.2,
1 2 5
即20-102+52=7.2,解得=1.6.
则该工厂这5天平均每天生产口罩1.6十万只.
法二:设x,x,x,x,x 的平均数为,
1 2 3 4 5
由方差的简化公式可得1.44=4-()2,解得=1.6.
则该工厂这5天平均每天生产口罩1.6十万只.
[答案] 1.6
1.(多选)为了了解全校1 740名学生的身高情况,从中抽取140名学生进行测量,下列说法正
确的是( )A.总体是1 740 B.个体是每一个学生的身高
C.样本是140名学生 D.样本量是140
解析:选BD 本题是测量1 740名学生的身高情况,故总体是1 740名学生的身高情况,个
体是每一个学生的身高情况,样本是140名学生的身高情况,样本容量是140,故选B、D.
2.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利
用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6
列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
A.23 B.09
C.02 D.17
解析:选C 从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则
选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.
3.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四
大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过
《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游
记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总
数比值的估计值为( )
A.0.5 B.0.6
C.0.7 D.0.8
解析:选C 设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解
得x=70,
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.
4.(多选)设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金
矩形,0.618称为标准值.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个
批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
则下列结论正确的是( )
A.甲批次的总体平均数比标准值高
B.乙批次的总体平均数比标准值低
C.甲、乙批次总体平均数与标准值相比,甲更接近
D.两个批次之和的总体平均数与标准值相同
解析:选BC 求得甲批次的平均数为0.617,乙批次的平均数为0.613,两批次之和的平均数
为0.615,故选B、C.5.(多选)CPI是居民消费价格指数的简称,它是一个反映居民家庭一般所购买的消费品和服
务项目价格水平变动情况的宏观经济指标.下图为国家统计局发布的2018年2月~2019年
2月全国居民消费价格指数(CPI)数据折线图(注:同比是今年第n个月与去年第n个月之比;
环比表示连续2个单位周期(比如连续两月)内的量的变化比,环比增长率=(本期数-上期
数)/上期数×100%).
下列说法正确的是( )
A.2019年2月份居民消费价格同比上涨1.5%
B.2019年2月份居民消费价格环比上涨1.0%
C.2018年6月份居民消费价格环比下降0.1%
D.2018年11月份居民消费价格同比下降0.3%
解析:选ABC 逐一考查所给的说法:A.2019年2月份居民消费价格同比上涨1.5%,题中
的说法正确;B.2019年2月份居民消费价格环比上涨1.0%,题中的说法正确;C.2018年6月
份居民消费价格环比下降0.1%,题中的说法正确;D.2018年11月份居民消费价格环比下降
0.3%,2018年11月份居民消费价格同比上涨2.2%,题中的说法错误.故选A、B、C.
6.(多选)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示
的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),
[90,100],60分以下视为不及格,若同一组中数据用该组区间中间值作代表值,则下列说法
中正确的是( )
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数约为75分
解析:选ABC 由频率分布直方图可得,成绩在[70,80)的频率最高,因此考生人数最多,故A
正确;
成绩在[40,60)的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4 000×0.25=1000,故B正确;
考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=
70.5,故C正确;
因为成绩在[40,70)的频率为0.45,在[70,80)的频率为0.3,所以中位数为70+10×≈71.67,故
D错误.
7.(2020·全国卷Ⅱ)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200
份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加
配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1 600份的概
率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的
配货的概率不小于0.95,则至少需要志愿者( )
A.10名 B.18名
C.24名 D.32名
解析:选B 由题意知超市第二天能完成1 200份订单的配货,如果没有志愿者帮忙,则超市
第二天共会积压超过500+(1 600-1 200)=900份订单的概率为0.05,因此要使第二天完成
积压订单及当日订单的配货的概率不小于0.95,至少需要志愿者=18(名),故选B.
8.(2021·苏州模拟)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国
100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分
别为x,x,x,…,x ,它们的平均数为,方差为s2;其中扫码支付使用的人数分别为3x+
1 2 3 100 1
2,3x+2,3x+2,…,3x +2,它们的平均数为,方差为s′2,则,s′2分别为( )
2 3 100
A.3+2,3s2+2 B.3,3s2
C.3+2,9s2 D.3+2,9s2+2
解析:选C 由平均数的计算公式,可得数据x,x,…,x 的平均数为=(x+x+x+…+
1 2 100 1 2 3
x ),
100
数据3x+2,3x+2,…,3x +2的平均数为:
1 2 100
[(3x +2)+(3x +2)+…+(3x +2)]=[3(x +x +…+x )+2×100]=3+2,
1 2 100 1 2 100
数据x,x,…,x 的方差为s2=[(x-)2+(x-)2+…+(x -)2],
1 2 100 1 2 100
数据3x+2,3x+2,…,3x +2的方差为:
1 2 100
{[(3x+2)-(3+2)]2+[(3x+2)-(3+2)]2+…+[(3x +2)-(3+2)]2}
1 2 100
=[9(x-)2+9(x-)2+…+9(x -)2]=9s2,故选C.
1 2 100
9.某校对高三年级1 600名男女学生的视力状况进行调查,现用分层抽样的方法抽取一个容
量是200的样本,已知样本中女生比男生少10人,则该校高三年级的女生人数是________.
解析:设样本中女生有x人,则男生有x+10人,所以x+x+10=200,得x=95,设该校高三
年级的女生有y人,则由分层抽样的定义可知=,解得y=760.
答案:760
10.高三某宿舍共8人,在一次体检中测得其中7个人的体重分别为60,55,60,55,65,50,50(单
位:千克),其中一人因故未测,已知该同学的体重在50~60千克之间,则此次体检中该宿舍成员体重的中位数为55的概率为________.
解析:将七个人的体重按顺序排列如下:50,50,55,55,60,60,65,若此次体检中该宿舍成员体重
的中位数为55,只需未测体重的同学体重要小于等于55,
又该同学的体重在50~60千克之间,
所以此次体检中该宿舍成员体重的中位数为55的概率为P==.
答案:
11.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生
的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生
近视人数分别为________、________.
解析:由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人
数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数
为40×50%=20.
答案:200 20
12.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作
出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,
第2个小组的频数为15,则被抽查的美术生的人数是________.
解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=
0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的
频数为15,所以前3个小组的频数分别为5,15,25,所以n==60.
答案:60
13.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验
的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表
中提供的信息解决下列问题:
成绩分组 频数 频率 平均分
[0,20) 3 0.015 16
[20,40) a b 32.1[40,60) 25 0.125 55
[60,80) c 0.5 74
[80,100] 62 0.31 88
(1)求a,b,c的值;
(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:
60分及60分以上为及格);
(3)试估计这次数学测验的年级平均分.
解:(1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,
a=200×0.05=10,c=200×0.5=100.
(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.
∴P===0.81.
(3)这次数学测验样本的平均分为
==73,
∴这次数学测验的年级平均分大约为73分.
14.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,
将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的
10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波
动情况,判断这两个工厂哪个的轮胎相对更好.
解:(1)甲厂10个轮胎宽度的平均值:
=×(195+194+196+193+194+197+196+195+193+197)=195(mm),
甲
乙厂10个轮胎宽度的平均值:
=×(195+196+193+192+195+194+195+192+195+193)=194(mm).
乙
(2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,
平均数:=×(195+194+196+194+196+195)=195,
1
方差:s=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+
(195-195)2]=,
乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,
平均数:=×(195+196+195+194+195+195)=195,
2
方差:s=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=,
∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,
∴乙厂的轮胎相对更好.