文档内容
§9.2 用样本估计总体
课标要求 1.会用统计图表对总体进行估计,会求n个数据的p%分位数.2.能用数字特征估
计总体集中趋势和总体离散程度.
知识梳理
1.百分位数
设一组数按照从小到大排列后为x ,x ,…,x ,计算i=np%的值,如果i不是整数,设i
1 2 n 0
为大于i的 ,取xi 为p%分位数;如果i是整数,取为p%分位数.特别地,规
0
定:0分位数是x(即最小值),100%分位数是 (即最大值).
1
2.平均数、中位数和众数
(1)平均数:=________________________.
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最________的一个数据(当
数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时).
(3)众数:一组数据中出现次数________的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=____________________________或-2.
(2)标准差:s=________________________.
4.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接
算出 对应的数字特征即可.
(2)对于分层抽样的情况,我们以分两层抽样的情况为例.假设第一层有 m个数,分别为
x ,x ,…,x ,平均数为,方差为s2;第二层有n个数,分别为y ,y ,…,y ,平均数为,
1 2 m 1 2 n
方差为t2.则=,s2=(x-)2,=,t2=(y-)2.
i i i i
如果记样本均值为,样本方差为b2,则可以算出
=(+)=,
i i
b2=
=.
常用结论
1.若x,x,…,x 的平均数为,那么mx+a,mx+a,…,mx+a的平均数为m+a.
1 2 n 1 2 n
2.数据x ,x ,…,x 与数据x′=x +a,x′=x +a,…,x′=x +a 的方差相等,即
1 2 n 1 1 2 2 n n
数据经过平移后方差不变.
3.若x,x,…,x 的方差为s2,那么ax+b,ax+b,…,ax+b的方差为a2s2.
1 2 n 1 2 n自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( )
(2)方差与标准差具有相同的单位.( )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.(
)
2.在下列统计量中,用来描述一组数据离散程度的量是( )
A.平均数 B.众数
C.百分位数 D.标准差
3.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下,则他们中参加奥运会的最佳人选
是______.
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差 3.5 3.5 2.1 8.7
4.有一组数据:-1,a,-2,3,4,2,它们的中位数是1,则这组数据的平均数是________.
题型一 样本的数字特征的估计
例1 (1)(多选)(2023·荆门联考)某单位为了解该单位党员开展学习党史知识活动情况,随机
抽取了30名党员,对他们一周的党史学习时间进行了统计,统计数据如下.则下列对该单
位党员一周学习党史时间的叙述,正确的有( )
党史学习时间(小时) 7 8 9 10 11
党员人数 4 8 7 6 5
A.众数是8 B.40%分位数为8
C.平均数是9 D.中位数是9
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x ,x ,…,x ,其中x 是最小值,x 是最大
1 2 6 1 6
值,则( )
A.x,x,x,x 的平均数等于x,x,…,x 的平均数
2 3 4 5 1 2 6
B.x,x,x,x 的中位数等于x,x,…,x 的中位数
2 3 4 5 1 2 6
C.x,x,x,x 的标准差不小于x,x,…,x 的标准差
2 3 4 5 1 2 6
D.x,x,x,x 的极差不大于x,x,…,x 的极差
2 3 4 5 1 2 6
跟踪训练1 (1)(多选)(2023·商丘模拟)在某次演讲比赛中,由两个评委小组(分别为专业人士
“小组A”和观众代表“小组B”)给参赛选手打分,根据两个评委小组给同一名选手打分的分值绘制成如图所示的折线图,则下列结论正确的是( )
A.小组A打分的分值的平均数为48
B.小组B打分的分值的中位数为66
C.小组A打分的分值的极差大于小组B打分的分值的极差
D.小组A打分的分值的方差小于小组B打分的分值的方差
(2)某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的25%分位数是________.
题型二 总体集中趋势的估计
例2 2024年,安徽、甘肃、广西、贵州、黑龙江、吉林、江西七省区作为第四批实施改革
的省份进入新高考.2023年10月,进入新高考的七个省份相继公布了高考选考科目的试卷结
构.某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己
的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解
高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段
[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试的及格率(“及格率”指得分为90分及以上的学生所占比
例);
(2)估计该校学生联考数学成绩的80%分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
思维升华 频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2 某市共有居民60万人,为了制定合理的节水方案,对居民用水情况进行了调查,
通过抽样,获得了某年 100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),
[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求a的值,并估计该市居民月均用水量不少于3吨的人数;
(2)估计该市居民月均用水量的众数和中位数.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
题型三 总体离散程度的估计
例3 (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次
配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,
另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品
的伸缩率分别记为x,y(i=1,2,…,10).试验结果如下:
i i
试验
1 2 3 4 5 6 7 8 9 10
序号i
伸缩
545 533 551 522 575 544 541 568 596 548
率x
i
伸缩
536 527 543 530 560 533 522 550 576 536
率y
i
记z=x-y(i=1,2,…,10),z,z,…,z 的样本平均数为,样本方差为s2.
i i i 1 2 10(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著
提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩
率有显著提高,否则不认为有显著提高).
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
跟踪训练3 (2024·江门模拟)某果园试种了 A,B两个品种的桃树各10棵,并在桃树成熟挂
果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,
方差分别为s和s.
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
(2)求,,s,s;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,
并说明理由.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________