当前位置:首页>文档>第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章

第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章

  • 2026-06-23 04:28:56 2026-06-23 04:28:56

文档预览

第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章
第五节统计_高中三年全科资料_高中_2026年高考《MST高考》一轮复习系列(数学)_十一章

文档信息

文档格式
pdf
文档大小
0.753 MB
文档页数
11 页
上传时间
2026-06-23 04:28:56

文档内容

MST老唐说题26版一轮 第 节 统计 5 知识点一、抽样 1、抽样调查 (1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体. (2)个体:构成总体的每一个元素叫做个体. (3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样 本中个体的数目叫做样本容量. 2、简单随机抽样 (1)定义 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽 取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫 做简单随机样本. (2)两种常用的简单随机抽样方法 ①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器 中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本. ②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随 机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的. 注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置. (3)抽签法与随机数法的适用情况 抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量 很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便. (4)简单随机抽样的特征 ①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析. ②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作. ③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算. ④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平. 只有四个特点都满足的抽样才是简单随机抽样. 3、分层抽样 (1)定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的 个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. 分层抽样适用于已知总体是由差异明显的几部分组成的. 1/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 (2)分层抽样问题类型及解题思路 ①求某层应抽个体数量:按该层所占总体的比例计算. ②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. 样本容量 各层样本数量 ③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比= = ” 总体容量 各层个体数量 N 注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取n n i (i1,2,,k)个个体 i N (其中i是层数,n是抽取的样本容量,N 是第i层中个体的个数,N是总体容量). i 知识点二、用样本估计总体 1、频率分布直方图 (1)频率、频数、样本容量的计算方法 频率 ① ×组距=频率. 组距 频数 频数 ② =频率, =样本容量,样本容量×频率=频数. 样本容量 频率 ③频率分布直方图中各个小方形的面积总和等于1. 2、频率分布直方图中数字特征的计算 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用x左(右)侧矩形面积之 和等于0.5,即可求出x. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形 底边中点的横坐标之和,即有xx p x p x p ,其中x 为每个小长方形底边的中点, p 为每个小 1 1 1 1 n n n n 长方形的面积. 3、百分位数 (1)定义 一组数据的第 p百分位数是这样一个值,它使得这组数据中至少有 p0 的数据小于或等于这个值,且至 0 少有100 p 0 的数据大于或等于这个值. 0 (2)计算一组n个数据的的第 p百分位数的步骤 ①按从小到大排列原始数据. ②计算inp0 . 0 ③若i不是整数而大于i的比邻整数 j,则第 p百分位数为第 j项数据;若i是整数,则第 p百分位数为 第i项与第i1项数据的平均数. (3)四分位数 我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有 2/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位 数. 4、样本的数字特征 (1)众数、中位数、平均数 ①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平. ②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平 均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. x x x ③平均数:n个样本数据x,x ,,x 的平均数为x 1 2 n ,反应一组数据的平均水平,公式 1 2 n n n 变形:x nx. i i1 5、标准差和方差 (1)定义 ①标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是x,x ,,x , 1 2 n 1 x表示这组数据的平均数,则标准差s [(x x)2 (x x)2 (x x)2]. n 1 2 n 1 ②方差:方差就是标准差的平方,即s2  [(x x)2 (x x)2 (x x)2].显然,在刻画样本数据 n 1 2 n 的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (2)数据特征 标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越 大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小. (3)平均数、方差的性质 如果数据x,x ,,x 的平均数为x,方差为s2,那么 1 2 n ①一组新数据x b,x b,x b的平均数为xb,方差是s2. 1 2 n ②一组新数据ax,ax ,,ax 的平均数为ax,方差是a2s2. 1 2 n ③一组新数据ax b,ax b,,ax b的平均数为axb,方差是a2s2. 1 2 n 题型一 随机抽样、分层抽样 【例1】现要完成下列2项抽样调查: ①从10盒酸奶中抽取3盒进行食品卫生检查; ②东方中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学 校在校务公开方面的意见,拟抽取一个容量为20的样本. 较为合理的抽样方法是( ) A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样 3/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 C.①随机数法,②抽签法 D.①抽签法, ②随机数法 【例2】某工厂为了对产品质量进行严格把关,从500件产品中随机抽出50件进行检验,对这500件产品 进行编号001,002,…,500,从下列随机数表的第二行第三组第一个数字开始,每次从左往右选取三个数 字,则抽到第四件产品的编号为( ) 2839 3125 8395 9524 7232 8995 7216 2884 3660 1073 4366 7575 9436 6118 4479 5140 9694 9592 6017 4951 4068 7516 3241 4782 A.447 B.366 C.140 D.118 【例3】为了庆祝中国共产党第二十次全国代表大会,学校采用按比例分配的分层随机抽样的方法从高一 1002人,高二1002人,高三1503人中抽取126人观看“中国共产党第二十次全国代表大会”直播,那么高 三年级被抽取的人数为( ) A.36 B.42 C.50 D.54 题型二 统计图表 【例1】(2023•上海)如图为20172021年上海市货物进出口总额的条形统计图,则下列对于进出口贸易 额描述错误的是( ) A.从2018年开始,2021年的进出口总额增长率最大 B.从2018年开始,进出口总额逐年增大 C.从2018年开始,进口总额逐年增大 D.从2018年开始,2020年的进出口总额增长率最小 4/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 【例2】(2017•新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年 1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 【例3】(多选题)某公司经营五种产业,为应对市场变化,在五年前进行了产业结构调整,优化后的产业 结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后的各产业利润与总利润的占比如 图所示,则下列结论错误的是( ) A.调整后传媒的利润增量小于杂志 B.调整后房地产的利润有所下降 C.调整后试卷的利润增加不到一倍 D.调整后图书的利润增长了一倍以上 5/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 题型三 频率分布直方图 频率分布直方图的数字特征 1.众数:最高矩形的底边中点的横坐标. 2.中位数:中位数左边和右边的矩形的面积和应该相等. 3.平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和. 【例1】(2022•天津)将1916年到2015年的全球年平均气温(单位:C),共100个数据,分成6组[13.55, 13.75),[13.75,13.95),[13.95,14.15),[14.15,14.35),[14.35,14.55),[14.55,14.75],并整理得 到如下的频率分布直方图,则全球年平均气温在区间[14.35,14.75]内的有( ) A.22年 B.23年 C.25年 D.35年 【例2】(2021•甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收 入的调查数据整理得到如下频率分布直方图: 根据此频率分布直方图,下面结论中不正确的是( ) A.该地农户家庭年收入低于4.5万元的农户比率估计为6% B.该地农户家庭年收入不低于10.5万元的农户比率估计为10% C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 6/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 【例3】(2023•新高考Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显 差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判 定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为 p(c);误诊率是将未患病者判定为 阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率. (1)当漏诊率 p(c)0.5%时,求临界值c和误诊率q(c); (2)设函数 f (c) p(c)q(c).当c[95,105],求 f (c)的解析式,并求 f (c)在区间[95,105] 的最小值. 题型四 百分位数 【例1】以下数据为参加数学竞赛决赛的15人的成绩(单位:分),分数从低到高依次: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,则这15人成绩的第80百分位数是 . 【例2】为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57, 45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x( ) A.58或64 B.59或64 C.58 D.59 7/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 题型五 样本的数字特征 1.平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. 2.方差的简化计算公式:s2  1 [  x2 x2 x2 nx 2 ]或写成s2  1 x2 x2 x2 x 2,即方差等于原 n 1 2 n n 1 2 n 数据平方的平均数减去平均数的平方. 【例1】(2017•新课标Ⅰ•多选)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量 (单位:kg)分别是x ,x ,,x ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) 1 2 n A.x ,x ,,x 的平均数 B.x ,x ,,x 的标准差 1 2 n 1 2 n C.x ,x ,,x 的最大值 D.x ,x ,,x 的中位数 1 2 n 1 2 n 【例2】(2021•新高考Ⅱ•多选)下列统计量中,能度量样本x ,x ,,x 的离散程度的有( ) 1 2 n A.样本x ,x ,,x 的标准差 B.样本x ,x ,,x 的中位数 1 2 n 1 2 n C.样本x ,x ,,x 的极差 D.样本x ,x ,,x 的平均数 1 2 n 1 2 n 【例3】(2023•新高考Ⅰ•多选)有一组样本数据x ,x ,,x ,其中x 是最小值,x 是最大值,则( ) 1 2 6 1 6 A.x ,x ,x ,x 的平均数等于x ,x ,,x 的平均数 2 3 4 5 1 2 6 B.x ,x ,x ,x 的中位数等于x ,x ,,x 的中位数 2 3 4 5 1 2 6 C.x ,x ,x ,x 的标准差不小于x ,x ,,x 的标准差 2 3 4 5 1 2 6 D.x ,x ,x ,x 的极差不大于x ,x ,,x 的极差 2 3 4 5 1 2 6 【例4】(多选题)有一组样本数据:x ,x ,,x ,其平均数为2,由这组样本数据得到新样本数据:x,x ,,x ,2, 1 2 8 1 2 8 那么这两组样本数据一定有相同的( ) A.平均数 B.中位数 C.方差 D.极差 8/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 题型六 分层方差问题 分层随机抽样的方差:设样本容量为n,平均数为x,其中两层的个体数量分别为n ,n ,两层的平均数分 1 2 n n 别为x ,x ,方差分别为s2,s2,则这个样本的方差为s2  1  s2  x x 2 2  s2  x x 2. 1 2 1 2 n  1 1  n  2 2  【例1】某车间有甲、乙两台机床同时加工直径为100 cm的零件,为检验质量,从中各抽取6件,测得甲、 7 乙两组数据的均值为x x 100,两组数据的方差分别为s2= ,s2 1,则估计该车间这批零件的直径 甲 乙 甲 3 乙 的方差s2  . 【例2】某校高三年级有男生400人和女生600人,为分析期末物理调研测试成绩,按照男女比例通过分层 随机抽样的方法取到一个样本,样本中男生的平均成绩为80分,方差为10,女生的平均成绩为60分,方 差为20,由此可以估计该校高三年级期末物理调研测试成绩的方差为 . 【例3】湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为3:2:1,三所学校共有数学强基 学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为21.5.已知甲、乙两所学校的数学 强基小组学生的平均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是 . 9/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 题型七 利用样本的数字特征解决优化决策问题 【例1】(2021•乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高, 用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s2和s2. 1 2 (1)求x,y,s2,s2; 1 2 s2 s2 (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果yx2 1 2 ,则认为新设 10 备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高). 【例2】(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠 随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠 给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分 比.根据试验数据分别得到如图直方图: 记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70. (1)求乙离子残留百分比直方图中a,b的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 10/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司MST老唐说题26版一轮 【例3】(2019•新课标Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这 些企业第一季度相对于前一年第一季度产值增长率y的频数分布表. y的分组 [0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80) 企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精 确到0.01) 附: 74 8.602. 【例4】为了监控某种装件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测 量其尺寸(单位:cm).其中x 元近似为样本平均数,s近似为样本的标准差,用样本平均数x 和标准差s能 够反映数据取值的信息.根据长期生产经验,一天内抽检零件中,如果出现了尺寸在(x3s,x3s)之外的 零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.下面 是检验员在一天内抽取的16个零件的尺寸: 9.9 10.1 10.2 10.2 9.9 9.8 10.1 10 10.2 10.3 9.1 10.1 9.9 9.9 10.1 10.2 经计算得 1 16 1 16 1 16  x  x 10,s x x 2  x 216x 2   0.280,160.282 16 i 16 i 16  i  i1 i1 i1 1.25,1510.062 1518.05, 0.026 0.16,其中x 为抽取的第i个零件的尺寸,i1,2,,16. i (1)利用估计值判断是否需对当天的生产过程进行检查? (2)剔除(x3s,x3s)之外的数据,用剩下的数据估计样本平均数x 和样本标准差s(精确到0.01). 11/11 学学学科科科网网网(((北北北京京京)))股股股份份份有有有限限限公公公司司司