文档内容
考向 50 抽样方法与总体分布
的估计
1.(2021·全国·高考真题)(多选题)有一组样本数据 , ,…, ,由这组数据得到新样本数据
, ,…, ,其中 ( 为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样数据的样本极差相同
【答案】CD
【分析】
A、C利用两组数据的线性关系有 、 ,即可判断正误;根据中位数、极差的定义,
结合已知线性关系可判断B、D的正误.
【详解】
A: 且 ,故平均数不相同,错误;
B:若第一组中位数为 ,则第二组的中位数为 ,显然不相同,错误;
C: ,故方差相同,正确;
D:由极差的定义知:若第一组的极差为 ,则第二组的极差为
,故极差相同,正确;故选:CD
2.(2021·山东·高考真题)打算从500名学生中抽取50名进行问卷调查,拟采纳系统抽样方式,为此
将他们一一编号为1~500,并对编号进行分段,假设从第一个号码段中随机抽出的号码是2,那么从第五个
号码段中抽出的号码应是______.
【答案】42
【分析】
由题设,根据等距抽样的特点确定第五个号码段中抽出的号码即可.
【详解】
从500名学生中抽取50名,那么每两相邻号码之间的距离是10,
第一个号码是2,那么第五个号码段中抽取的号码应是 .
故答案为:42
1. 系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
N N
①先将总体的N个个体编号②确定分段间隔k,对编号进行分段.n(n是样本容量)是整数时,取k=n;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编
号l+2k,依次进行下去,直到获取整个样本.
2.要点归纳
(1)在三种抽样方法中,简单随机抽样是最基本、最简单的抽样方法,其他两种抽样方法都是建立在它
的基础之上的.
(2)三种抽样方法各有特点和适用范围,在抽样实践中要根据具体情况选取相应的抽样方法.
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,
叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将
各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.系统抽样
定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分
抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.
3.频率分布直方图
频率 频率
(1)纵轴表示组距,即小长方形的高=组距;
频率
(2)小长方形的面积=组距×组距=频率;
(3)各个小方形的面积总和等于1 .
4.频率分布表的画法
极差
第一步:求极差,决定组数和组距,组距=组数;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
5.茎叶图
茎叶图是统计中用来表示数据的一种图,
茎是指中间的一列数,叶就是从茎的旁
边生长出来的数.
6.中位数、众数、平均数的定义
(1)中位数
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中
位数.
(2)众数一组数据中出现次数最多的数据叫做这组数据的众数.
(3)平均数
1
一组数据的算术平均数即为这组数据的平均数,n个数据x,x,…,x的平均数=n(x+x+…+x).
1 2 n 1 2 n
7.样本的数字特征
如果有n个数据x,x,…,x,那么这n个数的
1 2 n
1
(1)平均数=n(x+x+…+x).
1 2 n
(2)标准差s= .
1
(3)方差s2=n[(x-)2+(x-)2+…+(x-)2].
1 2 n
【常用结论】
1.(2021·宁夏·银川一中三模(文))关于线性回归的描述,有下列命题:
①回归直线一定经过样本中心点;
②相关系数 的绝对值越大,拟合效果越好;
③相关指数 越接近1拟合效果越好;
④残差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
2.(2021·广东肇庆·模拟预测)(多选题)以下命题是真命题的是( )
A.当总体是由差异明显的几个部分组成时,通常采用分层抽样
B.若 为数据 ,2,3, , 的中位数,则
C.回归直线可能不经过样本点的中心D.独立性检验不可以 确定两个变量之间是否具有某种关系
3.(2021·四川省南充市白塔中学模拟预测(理))某单位有员工 人,其中女员工有 人,为做某
项调查,拟采用分层抽样的方法抽取容量为 的样本,则应抽取的男员工人数是
_______________________.
4.(2021·黑龙江·佳木斯一中三模(文))下列说法正确的是___________.
①平面内到定点与定直线的距离相等的点的轨迹是抛物线.
②利用最小二乘法原理求回归直线,就是使残差平方和最小的原理求得参数b的.
③在线性回归模型中,计算相关指数 ,这表明解释变量只解释了60%预报变量的变化.
④若存在实数 ,使 , ,对 恒有 ,则 是 的一个周期.
1.(2021·陕西·模拟预测(文))某乡政府对甲、乙、丙三个村的扶贫对象进行抽样调查,其中甲村
30人,乙村25人,丙村40人,用分层抽样的方法抽取19人,则从甲、丙两村共抽取的人数为( )
A.8 B.11 C.13 D.14
2.(2021·甘肃·天水市第一中学模拟预测(文))我国古代数学名著《数书九章》中有“米谷粒分”
问题;“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十
四粒内有谷二十八颗,凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来
米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.153石 B.154石 C.169石 D.170石
3.(2021·北京·模拟预测)某学校高二年级选择“史政地”、“史政生”和“史地生”这三种组合的
学生人数分别为210、90和 若采用分层抽样的方法从中随机抽取12名学生,则从“史政生”组合中抽
取的学生人数为( )
A.7 B.6 C.3 D.2
4.(2021·云南大理·模拟预测(理))在发生某公共卫生事件期间,有专业机构认为该事件在一段事
件内没有发生大规模群体感染的标志是“连续 日,每天新增疑似病例不超过 人”.过去 日,甲、乙、
丙、丁四地新增疑似病例数据信息如下:
甲地:总体平均数为 ,中位数为 ;
乙地:总体平均数为 ,总体方差大于 ;
丙地:中位数为 ,众数为 ;丁地:总体平均数为 ,总体方差为 .
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
5.(2020·四川宜宾·一模(文))某团支部随机抽取甲乙两位同学连续 期“青年大学习”的成绩(单
位:分),得到如图所示的成绩茎叶图,关于这 期的成绩,则下列说法正确的是( )
A.甲成绩的中位数为
B.乙成绩的极差为
C.甲乙两人成绩的众数相等
D.甲成绩的平均数高于乙成绩的平均数
6.(2021·广东肇庆·模拟预测)(多选题)已知一组数据为-1,1,5,5,0,则该组数据的( )
A.众数是5 B.平均数是2
C.中位数是5 D.方差是
7.(2021·上海·模拟预测)已知某市A社区35岁至45岁的居民有450人,46岁至55岁的居民有750
人,56岁至65岁的居民有900人,为了解该社区35岁至65岁居民的身体健康状兄,社区负责人采用分层
抽样技术抽取若干人进行体检调查,若这次抽样调查抽取的人数是70人,则从46岁至55岁的居民中随机
抽取了_______人.
8.(2021·河南驻马店·模拟预测(文))某班级为了解本班48名学生的心理健康情况,将这些学生编
号为1,2,3,…,48,从这些学生中用系统抽样方法等距抽取6名学生进行心理健康测试.若33号学生
被抽到,则在13-18号学生中被抽到的是______号.
9.(2021·新疆·克拉玛依市教育研究所模拟预测(理)) 年是全面实现小康社会目标的一年,也
是全面打赢脱贫攻坚战的一年.某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去 年(
年到 年)的家庭收入情况分别进行统计,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断如下:
①过去的 年,“甲”的极差小于“乙”的极差;
②过去的 年,“甲”的平均值小于“乙”的平均值;
③过去的 年,“甲”的中位数小于“乙”的中位数;
④过去的 年,“甲”的平均增长率小于“乙”的平均增长率.
上述判断中,所有正确结论的序号为_______.
10.(2021·四川·成都七中实验学校三模(文))医学统计表明, 疾病在老年人中发病率较高.已知
某地区老年人的男女比例为3:2,为了解 疾病在该地区老年人中发病情况,按分层抽样抽取100名老人
作为样本,对这100位老人是否患有 疾病进行统计,得条形图如下所示.
(1)完成下列2×2列联表,并判断有没有90%的把握认为患 疾病与性别有关?
男性 女性 合计
患有 疾病
未患 疾病
合计
(2)在这100个样本中,将未患 疾病老年人按年龄段 , , , , 分
成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).
附: ,其中 .0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
11.(2020·陕西富平·二模(文))在全面建成小康社会的决胜阶段,让贫困地区同全国人民共同进入
全面小康社会是我们党的庄严承诺.在“脱真贫,真脱贫”的过程中,精准扶贫助推社会公平显得尤其重
要.若某农村地区有 户贫困户,经过一年扶贫后,对该地风的“精准扶贫”的成效检查验收.从这
户贫困户中随机抽出 户,对各户的人均年收入(单位:千元)进行调查得到如下频数表:
人均年收入
频数
若人均年收入在 元以下的判定为贫困户,人均年收入在 元 元的判定为脱贫户,人均年收
入达到 元的判定为小康户.为了了解未脱贫的原因,从抽取的 户中用分层抽样的方法抽 户进行调
研.
(1)贫困户、脱贫户、小康户分别抽到的户数是多少?
(2)从被抽到的脱贫户和小康户中各选 人做经验介绍,求小康户中人均年收入最高的一户被选到的概率.
12.(2021·广东肇庆·模拟预测)为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学
生化学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组 ,第二组
,第三组 ,第四组 ,第五组 .已知图中前三个组的频率依次构成等差数列,
第一组和第五组的频率相同.(1)求 , 的值;
(2)估算高分(大于等于80分)人数;
(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位
数精确到0.1).
1.(2021·湖南·高考真题)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了
解该地区中小学生的近视形成原因,用分层抽样的方法抽取 的学生进行调查,则在抽取的高中生中,
近视人数约为( )
A.1000 B.40 C.27 D.20
2.(2019·全国·高考真题(文))某学校为了解1 000名新生的身体素质,将这些学生编号为1,
2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则
下面4名学生中被抽到的是
A.8号学生 B.200号学生 C.616号学生 D.815号学生
3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取 部,统计其评分数据,将所得
个评分数据分为 组: 、 、 、 ,并整理得到如下的频率分布直方图,则
评分在区间 内的影视作品数量是( )A. B. C. D.
4.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,
将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
5.(2008·山东·高考真题(文))从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成
绩的标准差为( )
分数 5 4 3 2 1人数 20 10 30 30 10
A. B. C.3 D.
6.(2020·山东·高考真题)某创新企业为了解新研发的一种产品的销售情况,从编号为001,002,…
480的480个专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为005,
021,…则样本中的最后一个个体编号是______.
7.(2019·全国·高考真题(文))我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,
有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站
高铁列车所有车次的平均正点率的估计值为___________.
8.(2010·安徽·高考真题(文))某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000
户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行
调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些
数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 .
9.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某
项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为 和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 ,则认为新
设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
10.(2014·全国·高考真题(文))从某企业生产的某种产品中抽取100件,测量这些产品的一项质量
指标值,由测量表得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:
(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少
要占全部产品的80%”的规定?
1.C
【分析】
根据回归直线方程的性质,相关系数、相关系数及残差平方和的意义判断各项的正误即可.
【详解】
对于①,回归直线一定经过样本中心点,故正确;
对于②,相关系数 的绝对值越接近于1,相关性越强,故错误;
对于③,相关指数 越接近1拟合效果越好,故正确;
对于④,残差平方和越小,拟合效果越好,故正确.
故选:C.
2.AD【分析】
由分层抽样的定义可判断A;由中位数的定义可判断B;由回归直线的性质可判断C;由独立性检验的定义
可判断D
【详解】
选项A,由分层抽样的定义,当总体是由差异明显的几个部分组成时,通常采用分层抽样,正确;
选项B,由于数据 ,2,3, , 的大小关系不确定,故中位数不一定为 ,错误;
选项C,由回归直线的性质,回归直线一定经过样本点的中心 ,错误;
选项D,独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上
具有这种关系,但不能100%肯定这种关系,正确
故选:AD
3.
【分析】
按照分层抽样的定义,按照比例抽取即可
【详解】
由题意,设应抽取的男员工人数是
则
解得:
故答案为:90
4.②
【分析】
对于①,当定点在直线上时,其轨迹不是抛物线;对于②,由最小二乘法的原理可判断;对于③,相关指
数 ,这表明解释变量对于预报变量变化的贡献率约为60%;对于④,利用周期的定义判断即可
【详解】
解:①平面内到定点与定直线的距离相等的点的轨迹是抛物线.必须是定点在直线外,所以①不正确.
②利用最小二乘法原理求回归直线,就是使残差平方和最小的原理求得参数 的.所以②正确.
③在线性回归模型中,计算相关指数 ,这表明解释变量对于预报变量变化的贡献率约为60%;不是
解释变量只解释了60%预报变量的变化.所以C不正确;
④若存在非零实数 ,使 , ,对 恒有 ,则 是 的一个周期,所
以④不正确.故答案为:②.
1.D
【分析】
根据分层抽样原理分别求得甲、丙两村抽取的人数即可.
【详解】
设甲、丙两村抽取的人数分别为 、 .
依题意得 ,解得 , ,所以 .
故选:D.
2.C
【分析】
这批米内夹谷约为 石,则 ,由此能求出这批米内夹谷数量.
【详解】
这批米内夹谷约为 石,根据题意可得
解得
故选:C
3.C
【分析】
先求出“史政生”所占的比例,然后按比例抽取人数,即可得到答案.
【详解】
由题意可知,“史政地”、“史政生”和“史地生”这三种组合的学生人数分别为210,90和60,
故“史政生”所占的比例为 ,
由分层抽样是按比例抽取可得,“史政生”组合中抽取的学生人数为 .
故选:C
4.D
【分析】通过反例可知甲乙丙三地均不符合没有发生大规模群体感染的标志;假设丁地某天数据为 ,结合平均数
可知方差必大于 ,由此知丁地没有发生大规模群体感染.
【详解】
对于甲地,若连续 日的数据为 ,则满足平均数为 ,中位数为 ,但不符合没有发
生大规模群体感染的标志,A错误;
对于乙地,若连续 日的数据为 ,则满足平均数为 ,方差大于 ,但不符合没有发生
大规模群体感染的标志,B错误;
对于丙地,若连续 日的数据为 ,则满足中位数为 ,众数为 ,但不符合没有发生大
规模群体感染的标志,C错误;
对于丁地,若总体平均数为 ,假设有一天数据为 人,则方差 ,不可能总体方差
为 ,则不可能有一天数据超过 人,符合没有发生大规模群体感染的标志,D正确.
故选:D.
5.A
【分析】
根据茎叶图求出甲成绩的中位数,乙成绩的极差,众数,平均数即可判断.
【详解】
对A,根据茎叶图可得甲成绩的中位数为32,故A正确;
对B,乙同学的成绩最高为52,最低为10,所以极差为 ,故B错误;
对C,由茎叶图可知甲同学成绩的众数为32,乙同学的成绩的众数为42,不相等,故C错误;
对D,因为甲成绩的平均数为 ,乙成绩的平均数为
, ,故D错误.
故选:A.
6.ABD
【分析】
计算数据的众数为5,平均数为2,中位数为1,方差为 ,对比选项得到答案.
【详解】
数据为-1,1,5,5,0,的众数为5,A正确;
数据的平均数为 ,B正确;数据的中位数为1,C错误;
数据的方差为 ,D正确.
故选:ABD.
7.25
【分析】
根据已知条件求出抽样比即可求解.
【详解】
由题意,可知A社区总人数为450+750+900=2100,样本容量为70,
所以抽样比为 ,
故从46岁至55岁的居民中随机抽取的人数为 .
故答案为:25.
8.17
【分析】
分成6组,抽取的学生编号间隔8,由此可得.
【详解】
48人中抽取人,可分成6组,每组8人,由系统抽样,抽取学生的编号间隔为8,
33-8=25,25-8=17,
故答案为:17.
9.①③④
【分析】
根据茎叶图依次计算“甲”和“乙”的极差、平均数、中位数和平均增长率,进而得到结果.
【详解】
对于①,“甲”的极差为 ,“乙”的极差为 ,
, “甲”的极差小于“乙”的极差,①正确;
对于②,“甲”的平均值为 ,“乙”的平均值为
,
, “甲”的平均值大于“乙”的平均值,②错误;对于③,“甲”的中位数为 ,“乙”的中位数为 ,
, “甲”的中位数小于“乙”的中位数,③正确;
对于④,“甲”的平均增长率为 ,“乙”的平均增长率为 ,
, , “甲”的平均增长率小于“乙”的平均增长率,④正确.
故答案为:①③④
10.(1)填表见解析;没有90%的把握认为患 疾病与性别有关;(2)中位数约为74.5.
【分析】
(1)由分层抽样确定样本中老年男性、女性的人数,根据条形图可知未患X疾病的男性、女性人数,进而
写出列联表,由卡方公式求 值,即可给出结论.
(2)由频率直方图中频率和为1求参数a,根据中位数在直方图中的性质:其两侧面积相等,即可求中位
数.
【详解】
解:(1)由条形图知男性共60人,女性共40人,
未患有X疾病男性有40人,未患有X疾病女性25人,完成2×2列联表如下:
男性 女性 合计
患有 疾病 20 15 35
未患 疾病 40 25 65
合计 60 40 100
计算:
所以,没有90%的把握认为患 疾病与性别有关.
(2)由频率分布直方图得: ,
得
设中位数为 ,则 .,得
即未患病老人的年龄中位数约为74.5.
11.(1)贫困户、脱贫户、小康户分别抽到的户数分别为 、 、 ;(2) .
【分析】
(1)利用分层抽样可计算得出贫困户、脱贫户、小康户分别抽到的户数;
(2)用 、 、 、 、 、 表示脱贫户, 、 、 表示小康户,设 为小康户中人均年收入最高的
一户,列举出所有的基本事件,利用古典概型的概率公式可求得所求事件的概率.
【详解】
(1)由分层抽样可知,贫困户抽到的户数为 ,
脱贫户抽到的户数为 ,小康户抽到的户数为 ;
(2)用 、 、 、 、 、 表示脱贫户, 、 、 表示小康户,设 为小康户中人均年收入最高的
一户.
从从被抽到的脱贫户和小康户中各选 户,所有的基本事件有: 、 、 、 、 、 、 、 、
、 、 、 、 、 、
、 、 、 ,共 种,
其中,事件“小康户中人均年收入最高的一户被选到”所包含的基本事件有: 、 、 、 、
、 ,共 种,
故所求概率为 .
12.(1) ;(2)90;(3)平均值为69.5,中位数为69.4
【分析】
(1)根据题意得到方程组 ,解得答案.
(2)计算高分频率为高分的频率约为 ,得到人数.(3)直接利用平均数公式计算得到平均值,再设中位数为 ,则
,解得答案.
【详解】
(1)由题意可知: ,解得 .
(2)高分的频率约为: .
故高分人数为: .
(3)平均值为:
.
设中位数为 ,则 , .
故中位数为 .
1.D
【分析】
根据高中生的总人数乘以抽样比 可得所抽的高中生人数,再由近视率为 即可求解.
【详解】
由图(1)知高中生的总人数为 人,
所以应抽取的高中生为 人,
抽取的高中生中,近视人数约为 人,
故选:D
2.C
【分析】
等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.
【详解】
详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,
所以第一组抽到6号,且每组抽到的学生号构成等差数列 ,公差 ,所以 ,
若 ,则 ,不合题意;若 ,则 ,不合题意;
若 ,则 ,符合题意;若 ,则 ,不合题意.故选C.
【点睛】
本题主要考查系统抽样.
3.D
【分析】
利用频率分布直方图可计算出评分在区间 内的影视作品数量.
【详解】
由频率分布直方图可知,评分在区间 内的影视作品数量为 .
故选:D.
4.C
【分析】
根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,
然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】
因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体
的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为 ,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为 ,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为 ,
故D正确;
该地农户家庭年收入的平均值的估计值为
(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
【点睛】
本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.
注意各组的频率等于 .
5.B
【详解】
试题分析:根据平均数、方差、标准差的概念直接运算即可.
解:∵ ,
∴
=
= , .
故选B.
6.469
【分析】
先求得编号间隔为16以及样本容量,再由样本中所有数据编号为 求解.
【详解】
间隔为021-005=16,
则样本容量为 ,
样本中所有数据编号为 ,
所以样本中的最后一个个体的编号为 ,
故答案为:469
7.0.98.
【分析】
本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.
【详解】
由题意得,经停该高铁站的列车正点数约为 ,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为 .
【点睛】
本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概
率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.
8.5.7%
【分析】
首先根据拥有3套或3套以上住房的家庭所占的比例,得出100 000户中居民中拥有3套或3套以上住房
的户数,它除以100 000得到的值,为该地拥有3套或3套以上住房的家庭所占比例的合理估计.
【详解】
该地拥有3套或3套以上住房的家庭可以估计有:
则该地拥有3套或3套以上住房的家庭所占比例的合理估计为
故答案为
【点睛】
本题考查了分层抽样问题的运用,首先要注意分层抽样的方法与特点,进而根据合理估计的计算方法,得
到答案.
9.(1) ;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【分析】
(1)根据平均数和方差的计算方法,计算出平均数和方差.
(2)根据题目所给判断依据,结合(1)的结论进行判断.
【详解】
(1) ,
,
,
.(2)依题意, , ,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
10.(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标
值不低于95的产品至少要占全部产品80%”的规定.
【详解】
(1)直方图如图,
(2)质量指标值的样本平均数为
.
质量指标值的样本方差为
.
(3)质量指标值不低于95的产品所占比例的估计值为
,
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全
部产品80%”的规定.