文档内容
专题 9.6 随机抽样、样本估计总体
目录
题型一: 简单随机抽样...................................................................................................................4
题型二: 分层随机抽样...................................................................................................................5
题型三: 平均数、中位数、众数、方差、标准差、极差..........................................................6
题型四: 总体百分位数...................................................................................................................7
题型五: 频率分布直方图的应用..................................................................................................8
知识点总结
知识点一、简单随机抽样
(1)特点:逐个抽取,且每个个体被抽取的概率相等.
(2)常用方法:抽签法和随机数法.
(3)适用范围:个体性质相似,无明显层次,且个体数量较少,尤其是样本容量较少.
知识点二、分层随机抽样
(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于
一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合
在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)适用范围:总体可以分层,且层与层之间有明显区别,而层内个体差异较小.
(3)平均数的计算:各层抽样比乘以各层平均数的和.
知识点三、统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤
①求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
知识点四、用样本估计总体
(1)百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于
或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)平均数、中位数和众数
①平均数:=(x+x+…+x).
1 2 n
②中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据
个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
③众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
(3)方差或标准差
①方差:s2=(x-)2或-2.
i
②标准差:s=.
(4)总体(样本)方差和总体(样本)标准差①一般式:如果总体中所有个体的变量值分别为Y ,Y ,…,Y ,总体平均数为,则总体
1 2 n
方差S2=(Y-)2.
i
②加权式:如果总体的 N个变量值中,不同的值共有 k(k≤N)个,不妨记为Y ,Y ,…,
1 2
Y,其中Y出现的频数为f(i=1,2,…,k),则总体方差为S2=(Y-)2.
k i i i i
【常用结论与知识拓展】
1.频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以
小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x ,x ,…,x 的平均数为,那么mx +a,mx +a,mx +a,…,mx +a的平均
1 2 n 1 2 3 n
数是m+a.
(2)若数据x,x,…,x 的方差为s2,那么
1 2 n
①数据x+a,x+a,…,x+a的方差也为s2;
1 2 n
②数据ax,ax,…,ax 的方差为a2s2.
1 2 n
例题精讲
题型一:简单随机抽样
【要点讲解】(1)简单随机抽样需满足:①被抽取的样本总体中的个体数有限;②逐个抽取;
③等可能抽取.
(2)简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较
多的情况).【例1】已知某运动员每次投篮命中的概率都为 ,现采用随机模拟的方式估计该运动
员三次投篮恰有两次命中的概率:先由计算机产生0到9之间取整数值的随机数,指定1、
2、3、4表示命中,5、6、7、8、9、0表示不命中;再以三个随机数为一组,代表三次投
篮结果,经随机模拟产生了如下12组随机数:137 960 197 925 271 815 952 683 829 436 730
257.据此估计,该运动员三次投篮恰有两次命中的概率
A. B. C. D.
【变式训练1】学校举行舞蹈比赛,现从报名的50位学生中利用下面的随机数表抽取10位
同学参加,将这50位学生按01、02、 、50进行编号,假设从随机数表第1行第2个
数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选
出来的第5个号码所对应的学生编号为
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
5124 5179 3014 2310 2118 2191 3726 3890 0140 0523 2617
A.43 B.25 C.32 D.12
【变式训练2】采取随机模拟的方法估计气步枪学员击中目标的概率,先由计算器算出0到
9之间取整数值的随机数,指定1,2,3,4表示命中,5,6,7,8,9,0表示不命中,以
三个随机数为一组,代表三次射击击中的结果,经随机数模拟产生了20组随机数:
107 956 181 935 271 832 612 458 329 683
331 257 393 027 556 498 730 113 537 989
根据以上数据估计,该学员三次射击恰好击中1次的概率为
A. B. C. D.
【变式训练3】某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进
行编号,001,002, ,699,700.从中抽取70个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第 6个样本编号是
A.623 B.328 C.253 D.530
题型二:分层随机抽样
【要点讲解】在比例分配的分层随机抽样中,抽样比==;在比例分配的分层随机抽样中
如果第一层的样本量为m,平均值为;第二层的样本量为n,平均值为,则样本的平均值
为.
【例2】某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,
每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为 , ,
,且 ,全校参加登山的人数占总人数的 ,为了了解学生对本次比赛的满
意程度,按分层抽样的方法从中抽取一个容量为 200的样本进行调查,则应从高三年级参
加跑步的学生中抽取人数为 .
【变式训练1】某企业两个分厂生产同一种电子产品,产量之比为 ,现采用分层随机抽
样方法,从两个分厂生产的该产品中共抽取 100件做使用寿命的测试,由所得样品的测试
结果计算出该产品的平均使用寿命分别为 1000小时,1020小时,估计这个企业所生产的
该产品的平均使用寿命为
A.1012小时 B.1010小时 C.1008小时 D.1006小时
【变式训练2】某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大
学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出 100人
进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大
B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人
C.采用分层抽样比简单随机抽样更合理
D.该问题中的样本容量为100
【变式训练3】某班共有45名学生,其中女生25名,为了解学生的身体状况,现采用分层
抽样的方法进行调查,若样本中有5名女生,则样本中男生人数为
A.4 B.5 C.6 D.9
题型三:平均数、中位数、众数、方差、标准差、极差
【要点讲解】用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近
似值. 实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析
稳定情况.
【例3】一名同学掷骰子5次,记录每次骰子出现的点数,可以判断一定没有出现点数 6的
是
A.平均数为3,中位数为2 B.中位数为3,众数为2
C.平均数为2,方差为2.4 D.中位数为3,方差为2.8
【变式训练1】若一组样本数据 、 、 、 的平均数为10,另一组样本数据 、
、 、 的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为
A.17,54 B.17,48 C.15,54 D.15,48
【变式训练2】四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统
计结果,可以判断出一定没有出现点数6的是
A.平均数为3,中位数为2 B.中位数为3,众数为2
C.平均数为2,方差为2.4 D.中位数为3,方差为2.8
【变式训练3】某校高一年级有女生504人,男生596人.学校想通过抽样的方法估计高一
年级全体学生的平均体重,从高一女生和男生中随机抽取50人和60人,经计算这50个女
生的平均体重为 ,60个男生的平均体重为 ,依据以上条件,估计该校高一年级
全体学生的平均体重最合理的计算方法为
A. B.
C. D.
题型四:总体百分位数
【例4】为了进一步学习贯彻党的二十大精神,推进科普宣传教育,激发学生的学习热情,
营造良好的学习氛围,不断提高学生对科学、法律、健康等知识的了解,某学校组织全校
班级开展“红色百年路 科普万里行”知识竞赛.现抽取10个班级的平均成绩:70、71、
73、76、78、78、81、85、89、90,据此估计该校各个班级平均成绩的第40百分位数为
A.77 B.78 C.76 D.80
【变式训练1】某城市30天的空气质量指数如下:29,26,28,29,38,29,26,26,40,31,35,44,33,28,80,86,65,53,70,34,36, ,31,38,63,60,56,
34,74,34.则这组数据的第75百分位数为 .
【变式训练2】某地一年之内12个月的降水量从小到大分别为:46,48,51,53,53,
56,56,56,58,64,66,71,则该地区的月降水量 分位数为
A.58 B.60 C.61 D.62
2020年11月1日零时广西14个地区人口的男、女性别比如下表所示:
地区 南宁市 柳州市 桂林市 梧州市 玉林市 防城港市 钦州市
男、女性 106.71 107.74 103.33 106.77 107.81 119.01 110.66
别比
地区 贵港市 北海市 百色市 贺州市 河池市 来宾市 崇左市
男、女性 108.29 108.48 104.69 105.66 104.18 107.52 108.90
别比
【变式训练3】根据表中数据可知,这14个数据的第60百分位数对应的地区是
A.柳州市 B.南宁市 C.北海市 D.玉林市
题型五:频率分布直方图的应用
【例5】如图是根据原卫生部2009年6月发布的《中国7岁以下儿童生长发育参照标准》
绘制的我国7岁以下女童身高(长 的中位数散点图,下列可近似刻画身高 随年龄 变化
规律的函数模型是
A. B.C. D.
【变式训练1】某地发起“寻找绿色合伙人——低碳生活知识竞赛”活动,选取了 人参与
问卷调查,将他们的成绩进行适当分组后(每组为左闭右开的区间),得到如图所示的频
率分布直方图,且成绩落在 , 的人数为10,则
A.60 B.80 C.100 D.120
【变式训练2】在一次实验中,某小组测得一组数据 , ,2, , ,并由实
验数据得到下面的散点图.由此散点图,在区间 , 上,下列四个函数模型 , 为
待定系数)中,最能反映 , 函数关系的是
A. B. C. D.
【变式训练3】某柚子种植户挑选了100个柚子称重(单位:斤),将100个称重数据分成, , , , , , 这6组,并整理得到如图所示的频率分布
直方图,则质量在区间 , 内的柚子数量是
A.15 B.20 C.25 D.30
【例6】某中学为了解大数据提供的个性化作业质量情况,随机访问 50名学生,根据这50
名学生对个性化作业的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间
, 、 , 、 、 , 、 , .
(1)求频率分布直方图中 的值;
(2)估计该中学学生个性化作业评分的第70百分位数.(结果保留一位小数);
(3)从评分在 , 的受访学生中,随机抽取2人,求此2人评分都在 , 的概
率.【变式训练1】俄罗斯与乌克兰的军事冲突导致石油、天然气价格飙升.燃油价格问题是人
们关心的热点问题,某网站为此进行了调查,现从参与者中随机选出 100人作为样本,并
将这100人按年龄分组:第1组 , ,第2组 , ,第3组 , ,第4组
, ,第5组 , ,得到的频率分布直方图如图所示:
(1)求 的值及样本数据的第50百分位数;
(2)若将频率视为概率,现在要从 , 和 , 两组中用分层抽样的方法抽取6
人,再从这6人中随机抽取2人进行座谈,求抽取的2人中至少有1人的年龄在 ,
这一组的概率.【变式训练2】某电信运营公司为响应国家 网络建设政策,拟实行 网络流量阶梯定价,
每人月用流量中不超过 (一种流量计算单位)的部分按0.8元 收费,超过 的
部分按2元 收费,从用户群中随机调查了10000位用户,获得了他们某月的流量使用
数据,整理得到如下的频率分布直方图.已知用户月使用流量的中位数为31.
(1)求表中的 ;
(2)若 为整数,依据本次调查为使 以上用户在该月的流量价格为0.8元 ,则
至少定为多少?
(3)为了进一步了解用户使用 流量与年龄的相关关系,由频率分布直方图中流量在
, 和 , 两组用户中,按人数比例分配的分层抽样方法中抽取了100名用户,
已知 , 组用户平均年龄为30,方差为36,流量在 , 组用户的平均年龄为
20,方差为16,求抽取的100名用户年龄的方差.
【变式训练3】长沙市某中学近几年加大了对学生奥赛的培训,为了选择培训的对象,2023
年5月该中学进行一次数学竞赛,从参加竞赛的同学中,选取50名同学将其成绩(百分制,均为整数)分成六组:第1组 , ,第2组 , ,第3组 , ,第4组 ,
,第5组 , ,第6组 , ,得到频率分布直方图(如图),观察图中信息,
回答下列问题:
(1)根据频率分布直方图,估计本次考试成绩的平均数和第 71百分位数(同一组中的数
据用该组区间的中点值作代表);
(2)已知学生成绩评定等级有优秀、良好、一般三个等级,其中成绩不小于 90分时为优
秀等级,若从成绩在第5组和第6组的学生中,随机抽取2人,求所抽取的2人中至少有1
人成绩优秀的概率.
【变式训练4】“山水画卷,郴州相见”,2023年9月16日,第二届湖南省旅游发展大会
开幕式暨文化旅游推介会在郴州举行.开幕式期间,湖南卫视全程直播.学校统计了 100
名学生观看开幕式直播的时长情况(单位:分钟),将其按照 , , , , ,
, , , , , , 分成6组,制成了如图所示的频率分布直方图:请完成以下问题:
(1)求 的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)为进一步了解学生观看开幕式的情况,采用分层抽样的方法在观看时长为 ,
和 , 的两组中共抽取5名学生,再从这5名学生中随机抽取2名学生进行问卷调查,
求抽取的这2名学生至少有1人观看时长在 , 内的概率.