文档内容
第 01 讲 随机抽样、统计图表 (精讲)
目录
第一部分:知识点精准记忆
第二部分:课前自我评估测试
第三部分:典型例题剖析
题型一:简单随机抽样
题型二:分层随机抽样及其应用
题型三:统计图表
角度1:扇形图、条形图
角度2:折线图
角度3:频率分布直方图
第四部分:高考真题感悟
第一部分:知 识 点 精 准 记 忆
知识点一:简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
知识点二:总体平均数与样本平均数知识点三:分层随机抽样
名称 定义
一般地,总体中有 个个体,它们的变量值分别为
总体均值(总体平均数)
, , , ,则称
为总体均值,又称总体平均数.
如果总体的 个变量值中,不同的值共有 (
)个,不妨记为 , , , ,其中 出现
的频率 ( )则总体均值还可以写成
加权平均数的形式
如果从总体中抽取一个容量为 的样本,它们的变
量值分别为 , , ,则称
样本均值(样本平均数)
为样本均值,又称
样本平均数.
说明:(1)在简单随机抽样中,我们常用样本均值 去估计总体平均数 ;
(2)总体平均数是一个确定的数,样本平均数具有随机性(应为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总
体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为 和 ,抽取的样本量
分 别 为 和 , 第 1 层 和 第 2 层 的 样 本 平 均 数 分 别 为 , , 样 本 平 均 数 位 , 则
.我们可以采用样本平均数 估计总体平均数
知识点四:统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义
(3)绘制频率分布直方图的步骤及频率分布直方图的性质①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容
量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第 组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示.实际上就是频率分布直方图中各小长方形的高度,它
反映了各组样本观测数据的疏密程度.
第二部分:课 前 自 我 评 估 测 试
1.(2022·全国·高一课时练习)某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:
日期 6日 7日 8日 9日 10日 11日
当日销售量/本 30 40 28 44 38 42
根据上表估计该书店该月(按31天计算)的销售总量约是( )
A.1147本 B.1110本 C.1340本 D.1278本
2.(2022·山西·平遥县第二中学校高一阶段练习)为了了解某路口每天在学校放学时段的车流量,有下面
几个样本,统计该路口在学校放学时段的车流量,你认为合适的是( )
A.抽取两天作为一个样本
B.春、夏、秋、冬每个季节各选两周作为样本
C.选取每周星期日作为样本
D.以全年每一天作为样本
3.(2022·新疆·新和县实验中学高一期末)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若
干人,西乡三百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有300人,南面有200人,这三面要征调60人,而北面共征调10人(用分
层抽样的方法),则北面共有( )人.”
A.200 B.100 C.400 D.300
4.(2022·全国·高一单元测试)我国在贵州省平塘县修建的500米口径球面射电望远镜(FAST)是目前世
界上最大单口径射电望远镜.截至2021年5月,该射电望远镜发现脉冲星逾370颗.脉冲星就是旋转的中子
星,每一颗脉冲星每两脉冲间隔时间(脉冲星的自转周期)是一定的,最小的自转周期小到0.0014秒,最
长的也不过11.765735秒.某天文研究机构观测并统计了其中93颗脉冲星的自转周期,绘制了如图所示的频
率分布直方图.在这93颗脉冲星中,自转周期在2秒至10秒的颗数大约为___________ 颗.
5.(2022·全国·高一单元测试)某校举行了一次网络安全知识竞赛,满分10分,有10名同学代表班级参
加比赛,已知学生得分均为整数,比赛结束后统计这10名同学得分情况如折线图所示,若这10名同学成
绩的极差为a,平均数为b,则 =___________.
6.(2022·全国·高一单元测试)挂壁公路是一种最有特色的公路,是在峭壁上开凿而出的奇险公路,其中
位于河南辉县的郭亮挂壁公路最为出名,被称为“全球最奇特18条公路”之一.现对该公路某路段上1000
辆汽车的行驶速度进行抽样调查,画出频率分布直方图(如图),根据频率分布直方图估计在此路段上汽
车行驶速度在区间[85,90)的车辆数为___________,行驶速度不小于90km/h的概率为___________
第三部分:典 型 例 题 剖 析题型一:简单随机抽样
典型例题
例题1.(2022·河南安阳·高一期末)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中
随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )
A.总体是36个篮球 B.样本是4个篮球
C.样本容量是4 D.每个篮球被抽到的可能性不同
例题2.(2022·全国·高一期末)管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又
从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是(
)
A.2800 B.1800 C.1400 D.1200
例题3.(2022·全国·益阳平高学校高一期末) 年 月 日,女排世界杯在日本拉开帷幕,某网络直
播平台开通观众留言渠道,为中国女排加油.现该平台欲利用随机数表法从编号为 、 、…、 的号码
中选取 个幸运号码,选取方法是从下方随机数表第 行第 列的数字开始,从左往右依次选取 个数字,
则第 个被选中的号码为( )
A. B. C. D.
例题4.(2022·浙江温州·高一期末)利用简单随机抽样的方法,从 个个体 中抽取13个个体,若
第二次抽取时,余下的每个个体被抽到的概率为 ,则在整个抽样过程中,每个个体被抽到的可能性为
___________.
同类题型归类练
1.(2022·江苏省江浦高级中学高一期末)总体编号为01,02,…,29,30的30个个体组成.利用下面
的随机数表选取5个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两
个数字,则选出来的第5个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.15 C.16 D.19
2.(2022·全国·高一期末)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要
从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第1个零件
编号是( )
A.36 B.16 C.11 D.14
3.(2022·全国·高一单元测试)中国农历的“二十四节气”已正式被联合国教科文组织列入人类非物质文
化遗产,也被誉为“中国的第五大发明”,“二十四节气歌”是为便于记忆我国古时历法中二十四节气而编成的小诗歌.某小学三年级共有学生500名,随机抽查100名学生并提问“二十四节气歌”,只能说出
其中两句的有45人,能说出其中三句及以上的有32人,据此估计该校三年级的500名学生中,对“二十
四节气歌”只能说出一句或一句也说不出的人数约为______.
4.(2022·山西临汾·二模(文))现从某学校450名同学中用随机数表法随机抽取30人参加一项活动.将
这450名同学编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被
抽到的编号为_________.
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
题型二:分层随机抽样及其应用
典型例题
例题1.(2022·全国·高一课时练习)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设
了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求
每人只能参加一个社团,各年级参加社团的人数情况如下表:
高一年级 高二年级 高三年级
泥塑
剪纸
其中 ,且“泥塑”社团的人数占两个社团总人数的 .为了了解学生对两个社团活动的满
意程度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为(
)
A.4 B.6 C.9 D.10
例题2.(2022·全国·高一专题练习)某个高级中学组织物理、化学学科能力竞赛,全校1000名学生都参加
两科考试,考试后按学科分别评出一、二、三等奖和淘汰的这四个等级,现有某考场的两科考试数据统计如
下,其中物理科目成绩为二等奖的考生有12人.如果以这个考场考生的物理和化学成绩去估计全校考生的
物理和化学成绩分布,则以下说法正确的是( )①该考场化学考试获得一等奖的有4人;
②全校物理考试获得二等奖的有240人;
③如果采用分层抽样从全校抽取200人,则化学考试被淘汰78人.
A.①②③ B.②③ C.①② D.①③
例题3.(2022·贵州黔东南·高一期末)某学校有高中学生1000人,其中高一年级、高二年级、高三年级
的人数分别为320,300,380,为了调查学生参加“社区志愿服务”的意向,现采用分层抽样的方法从该
校学生中抽取一个样本量为200的样本,那么应抽取高二年级学生的人数为________
例题4.(2022·全国·高一单元测试)某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数
如下表:
甲校 乙校 丙校
男生 97 90 x
女生 153 160 y
(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?
(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,
将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取
的4个人的编号.(下面摘取了随机数表第7行至第9行)
同类题型归类练
1.(2022·云南红河·高一期末)我国古代数学名著《九章算术》有一抽样问题:“今有北乡六千七百七十
三人,西乡五千二百二十七人,南乡若干人,凡三乡,发役五百人,而南乡需遣二百人,问南乡人数几
何?”其意思为:今某地北面有6773人,西面有5227人,南面有若干人,这三面要征调500人,而南面
共征调200人(用分层抽样的方法),则南面共有( )人.
A.7200 B.8000 C.8200 D.8800
2.(2022·全国·高一单元测试)北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮
相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15
只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量
为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.
3.(2022·全国·高一课时练习)某公司生产甲、乙两种产品的数量之比为 ,现用分层抽样的方法抽出
一个样本,已知样本中甲种产品比乙种产品多6件,则甲种产品被抽取的件数为_______.
4.(2022·全国·高一专题练习)某校共有高一、高二、高三学生1290人,其中高一480人,高二比高三
多30人,为了解该校学生的身体健康情况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生96人,则该样本中的高三学生人数为________.
题型三:统计图表
角度1:扇形图、条形图
典型例题
例题1.(2022·浙江丽水·高一期末)某校高一年级 名学生的血型统计情况如图所示.某课外兴趣小
组为了研究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为 的样本,则从
高一年级 型血的学生中应抽取的人数是( )
A. B. C. D.
例题2.(2022·全国·高一专题练习)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了
解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和估计抽取
的高中生近视人数分别为( )
A.180,40 B.180,20 C.180,10 D.100,10
例题3.(2022·陕西·大荔县教学研究室高一期末)新冠肺炎期间某商场开通三种平台销售商品,收集一月
内的数据如图1;为了解消费者对各平台销售方式的满意程度,该商场用分层抽样的方法抽取4%的顾客进
行满意度调查,得到的数据如图2.下列说法错误的是( )A.样本容量为240
B.若样本中对平台三满意的人数为40,则
C.总体中对平台二满意的消费者人数约为300
D.样本中对平台一满意的人数为24人
同类题型归类练
1.(2022·福建·三明一中模拟预测)已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,
为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取 的学生进行调查,其中被抽取
的小学生有80人,则样本容量和该地区的高中生近视人数分别为( )
A.200,25 B.200,2500 C.8000,25 D.8000,2500
2.(2022·湖南常德·高一期末)某校为更好地支持学生个性发展,开设了学科拓展类、创新素质类、兴趣
爱好类三种类型的校本课程,每位同学从中选择一门课程学习.现对该校6000名学生的选课情况进行了统
计,如图①,并用分层抽样的方法从中抽取 的学生对所选课程进行了满意率调查,如图②.
则下列说法错误的是( )
A.抽取的样本容量为120
B.该校学生中对兴趣爱好类课程满意的人数约为1050
C.若抽取的学生中对创新素质类课程满意的人数为36,则
D.该校学生中选择学科拓展类课程的人数为1500
3.(2022·新疆·乌鲁木齐市第70中高一期末)已知某地 、 、 三个村的人口户数及贫困情况分别如图(1)和图(2)所示,为了解该地三个村的贫困原因,当地政府决定采用分层抽样的方法抽取 的户
数进行调查,则样本容量和抽取 村贫困户的户数分别是( )
A. , B. ,
C. , D. ,
4.(2022·全国·高一期末)某单位200名职工的年龄分布情况如图所示,现要从中抽取一个容量为40的
样本,用分层抽样法应抽取50岁以上年龄段的职工___________人.
角度2:折线图
典型例题
例题1.(2022·黑龙江·哈九中高一期末)如图一所示,某市 月 日至 日 的日均值(单位:
)变化的折线图,则该组数据第 百分位数为( )
A. B. C. D.
例题2.(2022·广西桂林·模拟预测(文))已知全国农产品批发价格200指数月度变化情况如图所示,下
列正确的选项是( )A.全国农产品夏季价格比冬季低
B.全国农产品价格指数2022年每个月逐渐增加
C.全国农产品价格指数2022年菜篮子产品价格批发指数与农产品价格指数趋势基本保持一致
D.2022年6月农产品批发价格指数大于116.
例题3.(2022·辽宁·模拟预测)下图是2020年8月至2021年9月我国智能手机占比情况统计图,记这14
个月的统计数据占比的众数、中位数分别为 , ,则 ______.
例题4.(2022·全国·高三专题练习)下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已
知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股
票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买
股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在
全年都处于上升趋势.其中正确的结论是________(填序号).
同类题型归类练
1.(2022·广西河池·高一期末)某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图:
用样本估计总体,以下四个选项错误的是( )
A.30~41周岁参保人数最多
B.随着年龄的增长,人均参保费用越来越多
C.54周岁以下的参保人数约占总参保人数的8%
D.定期寿险最受参保人青睐
2.(2022·贵州·六盘水市第二中学高一阶段练习)某社区通过公益讲座以普及社区居民的垃圾分类知识.为
了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10
位社区居民在讲座前和讲座后问卷答题的正确率如下图,则下列说法错误的是( )A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
3.(2022·陕西咸阳·高一期中)空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明
空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为
“良”;AQI指数大于100,空气质量为“污染”.如图是某市2021年空气质量指数(AQI)的月折线图.下
列关于该市2021年空气质量的叙述中,不正确的是______.(填序号)
①全年的平均AQI指数对应的空气质量等级为优或良;
②每月都至少有一天空气质量为优;
③2月,8月,9月和12月均出现污染天气;
④空气质量为“污染”的天数最多的月份是2月份.
4.(2022·全国·高一课时练习)下图是一名护士为一位病人测量体温所得数据的折线统计图.以下描述正
确的是__________.(填上所有正确的序号)
①护士平均每天为病人测量4次体温;②第一天病人病情并未得到有效控制,体温在不断反复;③从第二
天凌晨起病人体温在一直下降;④病人体温的极差为2.7℃.角度3:频率分布直方图
典型例题
例题1.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒
张压数据(单位: )的分组区间为 ,将其按从左到右的顺序分别
编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组
共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8 B.12 C.16 D.18
例题2.(2022·全国·高一单元测试)为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展
“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所
示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别
是( )A.85,87.5 B.86.75,86.67 C.86.75,85 D.85,85
例题3.(2022·全国·高一单元测试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名
学生,得到这M名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图如下所示:
分组 频数 频率
[10,15) 10 0.25
[15,20) 24
[20,25)
[25,30] 2 0.05
合计 1
(1)求表中 , 及图中 的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间 内的人数.
例题4.(2022·海南·琼海市嘉积第二中学高二期中)某中学高三年级有400名学生参加月考,用简单随机
抽样的方法抽取了一个容量为50的样本,得到数学成绩的频率分布直方图如图所示.
(1)求第四个小矩形的高;
(2)估算样本的众数、中位数和平均数.同类题型归类练
1.(2022·黑龙江·大庆实验中学高一期末)某个容量为1000的样本的频率分布直方图如下,则在区间
上的数据的频数为( )
A.300 B.30 C.20 D.200
2.(2022·河北张家口·高一期末)持续两年多的“新冠肺炎”疫情给我们的社会、生产、生活带来了极大
的不便,某医学院组织学生展开对“新型冠状病毒”的病理及防治的研究,通过一年多的试验,让学生根
据试验结果,写“新冠肺炎的预防和治疗”毕业论文.如图所示是学校对60名学生的论文进行打分并整理
后分成5组画出的频率分布直方图,已知从左到右4个小组的频率依次是0.05,0.15,0.35,0.30,那么在
这次打分中,这60名学生论文得分的中位数大约是( )(精确到0.1)
A.78.1 B.78.2 C.78.3 D.78.4
3.(2022·新疆·沙湾县第一中学高一期末(文))某地教育部门对某学校学生的阅读素养进行检测,在该
校随机抽取了 名学生进行检测,实行百分制,现将所得的成绩按照
分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.(1)求出表中 及图中 的值;
(2)估计该校学生阅读素养的成绩中位数以及平均数.
4.(2022·河南·商丘市第一高级中学高一阶段练习)第24届冬奥会于2022年2月在北京举行,志愿者的
服务工作是冬奥会成功举办的重要保障.某高校承办了北京志愿者选拔的面试工作.现随机抽取了100名
候选者的面试成绩,并分成五组:第一组 ,第二组 ,第三组 ,第四组 ,第五
组 ,绘制成如图所示的频率分布直方图.已知第三、四、五组的频率之和为0.7,第一组和第五组
的频率相同.
(1)求a,b的值;
(2)估计这100名候选者面试成绩的平均数和第60%分位数(分位数精确到0.1).第四部分:高考真题感悟
1.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压
数据(单位: )的分组区间为 ,将其按从左到右的顺序分别编号
为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有
20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8 B.12 C.16 D.18
2.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取 部,统计其评分数据,将所得 个
评分数据分为 组: 、 、 、 ,并整理得到如下的频率分布直方图,则评分在区间
内的影视作品数量是( )
A. B. C. D.
3.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农
户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间