文档内容
专题 09 概率与统计
1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)
的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散
点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方
程类型的是
A. B.
C. D.
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率 和温度 的回归方程类型的是 .
故选:D.
【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
2.【2020年高考全国II卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200
份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工
作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过 1600份的概率为0.05,志愿者
每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于 0.95,则至少需要志愿者
A.10名 B.18名
C.24名 D.32名
【答案】B
【解析】由题意,第二天新增订单数为 ,设需要志愿者x名,
, ,故需要志愿者 名.
故选:B
【点晴】本题主要考查函数模型的简单应用,属于基础题.
3.【2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为 ,且
,则下面四种情形中,对应样本的标准差最大的一组是
A. B.
C. D.
【答案】B
【解析】对于A选项,该组数据的平均数为 ,
方差为 ;
对于B选项,该组数据的平均数为 ,
方差为 ;
对于C选项,该组数据的平均数为 ,
方差为 ;
对于D选项,该组数据的平均数为 ,方差为 .
的
因此,B选项这一组 标准差最大.
故选:B.
【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.
4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学
生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是
A.62% B.56%
C.46% D.42%
【答案】C
【解析】记“该中学学生喜欢足球”为事件 ,“该中学学生喜欢游泳”为事件 ,则“该中学学生
喜欢足球或游泳”为事件 ,“该中学学生既喜欢足球又喜欢游泳”为事件 ,
则 , , ,
所以
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为 .
故选:C.
【点睛】本题考查了积事件的概率公式,属于基础题.
5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为 ,且
,定义X的信息熵 .
A.若n=1,则H(X)=0
B.若n=2,则H(X)随着 的增大而增大
C.若 ,则H(X)随着n的增大而增大
D.若 n=2m,随机变量 Y 所有可能的取值为 ,且 ,则
H(X)≤H(Y)【答案】AC
【解析】对于A选项,若 ,则 ,所以 ,所以A选项正确.
对于B选项,若 ,则 , ,
所以 ,
当 时, ,
当 时, ,
两者相等,所以B选项错误.
对于C选项,若 ,则
,
则 随着 的增大而增大,所以C选项正确.
对于D选项,若 ,随机变量 的所有可能的取值为 ,且 (
).
.由于
,所以 ,所以 ,
所以 ,
所以 ,所以D选项错误.
故选:AC
【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及
对数运算和对数函数及不等式的基本性质的运用,属于难题.
6.【2020年高考江苏】已知一组数据 的平均数为4,则 的值是 ▲ .
【答案】2
【解析】∵数据 的平均数为4
∴ ,即 .
故答案为:2.
【点睛】本题主要考查平均数的计算和应用,比较基础.
7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的
概率是_____.
【答案】
【解析】根据题意可得基本事件数总为 个.
点数和为5的基本事件有 , , , 共4个.
∴出现向上的点数和为5的概率为 .故答案为: .
【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题.
8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位: ),将所得数据分为9组:
,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间
内的个数为
A.10 B.18
C.20 D.36
【答案】B
【解析】根据直方图,直径落在区间 之间的零件频率为: ,
则区间 内零件的个数为: .
故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.
9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为 和 .假定两球是否落入盒子互不影响,
则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.
【答案】
【解析】甲、乙两球落入盒子的概率分别为 ,
且两球是否落入盒子互不影响,
所以甲、乙都落入盒子 概的率为 ,
甲、乙两球都不落入盒子的概率为 ,
所以甲、乙两球至少有一个落入盒子的概率为 .
故答案为: ; .
【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.
10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1
个,不放回,直到取出红球为止.设此过程中取到黄球的个数为 ,则 _______,
_______.
【答案】 ,
【解析】因为 对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,
所以 ,随机变量 ,
,
,
所以 .
故答案为: .
【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基
础题.
11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:
累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行
下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其
中一人被淘汰,另一人最终获胜,比赛结束.
经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为 ,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【解析】(1)甲连胜四场的概率为 .
(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.
比赛四场结束,共有三种情况:
甲连胜四场的概率为 ;
乙连胜四场的概率为 ;
丙上场后连胜三场的概率为 .所以需要进行第五场比赛的概率为 .
(3)丙最终获胜,有两种情况:
比赛四场结束且丙最终获胜的概率为 .
比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜
胜负胜,胜负空胜,负空胜胜,概率分别为 , , .
因此丙最终获胜的概率为 .
12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.
为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样
的方法抽取20个作为样区,调查得到样本数据(x,y)(i=1,2,…,20),其中x和y分别表示第i个样
i i i i
区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 , ,
, , .
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平
均数乘以地块数);
(2)求样本(x,y) (i=1,2,…,20)的相关系数(精确到0.01);
i i
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生
动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数 , .
【解析】(1)由已知得样本平均数 ,从而该地区这种野生动物数量的估计值为
60×200=12000.(2)样本 的相关系数
.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆
盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样
本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的
估计.
13.【2020年高考全国III卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天
到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
锻炼人次
[0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称
这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的
把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
P(K2≥k) 0.050 0.010 0.001
附:K2= k 3.841 6.635 10.828 .
,【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为
.
(3)根据所给数据,可得 列联表:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
根据列联表得
.
由于 ,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
14.【2020年高考山东】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 天空气中
的 和 浓度(单位: ),得下表:
32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中 浓度不超过 ,且 浓度不超过 ”的概率;
(2)根据所给数据,完成下面的 列联表:(3)根据(2)中的列联表,判断是否有 的把握认为该市一天空气中 浓度与 浓度有关?
附: ,
0.050 0.010 0.001
3.841 6.635 10.828
【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且 浓度不超过150的天数
为 ,因此,该市一天空气中PM2.5浓度不超过75,且 浓度不超过150的概率的估
计值为 .
(2)根据抽查数据,可得 列联表:
64 16
10 10
(3)根据(2)的列联表得 .
由于 ,故有 的把握认为该市一天空气中 浓度与 浓度有关.
15.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.
为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
男生 女生
支持 不支持 支持 不支持
方案一 200人 400人 300人 100人
方案二 350人 250人 150人 250人
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一
的概率;(Ⅲ)将该校学生支持方案的概率估计值记为 ,假设该校年级有500名男生和300名女生,除一年级
外其他年级学生支持方案二的概率估计值记为 ,试比较 与 的大小.(结论不要求证明)
【解析】(Ⅰ)该校男生支持方案一的概率为 ,
该校女生支持方案一的概率为 ;
(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方
案一,一个女生支持方案一,
所以3人中恰有2人支持方案一概率为: ;
(Ⅲ)
【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.
1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的
办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学
号应为
A. B.
C. D.
【答案】B
【解析】由题可知,该班共有45人,按学号用系统抽样的办法抽取一个容量为5的样本,
则抽到的每个同学的学号之间的间隔为: ,
而已知学号为6、24、33的同学在样本中,
即抽到的第一个学号为6,则第二个学号为:6+9=15,
第三个学号为:15+9=24,则第四个学号为:24+9=33,第五个学号为:33+9=42,
所以样本中还有两个同学的学号应为:15,42.
故选:B.
2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组 表示的平面区域为 ,若从圆
: 的内部随机选取一点 ,则 取自 的概率为
A. B.
C. D.
【答案】B
【解析】作出 中在圆 内部的区域,如图所示,
因为直线 , 的倾斜角分别为 , ,
所以由图可得 取自 的概率为 .
故选:B
【点睛】本小题主要考查几何概型的计算,考查线性可行域的画法,属于基础题.
3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:
“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对
应的二进制数011 化为十进制的计算如下:011 =0×22+1×21+1×20=3 .若从两类符号中任取2个符
(2) (2) (10)
号进行排列,则得到的二进制数所对应的十进制数大于2的概率为A. B.
C. D.
【答案】D
【解析】根据题意,不同符号可分为三类:
第一类:由两个“─”组成,其二进制为:11(2)=3(10);
第二类:由两个“﹣﹣“组成,其二进制为:00(2)=0(10);
第三类:由一个“─”和一个“﹣﹣”组成,其二进制为:10(2)=2(10),01(2)=1(10),
所以从两类符号中任取2个符号排列,则组成不同的十进制数为0,1,2,3,
则得到的二进制数所对应的十进制数大于2的概率P .
故选:D.
【点睛】本题主要考查了古典概型及其概率的计算,以及转化的应用,意在考查学生的计算能力和应用
能力,属于中档试题.
4.【2020·河南省高三三模】随着 年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速
上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是 年至 年中国雪
场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是
A. 年至 年,中国雪场滑雪人次逐年增加
B. 年至 年,中国雪场滑雪人次和同比增长率均逐年增加C. 年与 年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等
D. 年与 年相比,中国雪场滑雪人次增长率约为
【答案】C
【解析】由 年至 年中国雪场滑雪人次(万人次)与同比增长率的统计图,得:对于A,
年至 年,中国雪场滑雪人次逐年增加,故A正确;
对于B, 年至 年,中国雪场滑雪人次和同比增长率均逐年增加,故B正确;
对于C, 年与 年相比,中国雪场滑雪人次的同比增长率近似相等,
但是同比增长人数也不相等, 年比 年增长人数多,故C错误;
对于D, 年与 年相比,中国雪场滑雪人次增长率约为:
.故D正确.
故选:C.
【点睛】本题考查统计图表的应用,考查学生的数据分析能力,属于基础题.
5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒( )引起的肺炎疫情爆
发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方
法后,每周治愈的患者人数如下表所示:
周数(x) 1 2 3 4 5
治愈人数
2 17 36 93 142
(y)
由表格可得 关于 的二次回归方程为 ,则此回归模型第4周的残差(实际值与预报值之差)
为
A.5 B.4
C.1 D.0
【答案】A【解析】设 ,则 ,
,所以 .令 ,得 .
故选:A
6.【2020·四川省绵阳南山中学高三一模】从标号分别为 、 、 、 、 的 张标签中随机抽取一张,
放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差 的概率为
A. B.
C. D.
【答案】D
【解析】从标号分别为 、 、 、 、 的 张标签中随机抽取一张,放回后再随机抽取一张,
所有的基本事件数为 ,
其中,事件“抽得的第一张标签的标号与第二张标签的标号恰好相差 ”所包含的基本事件有: 、
、 、 、 、 、 、 ,共 种情况,
因此,所求事件的概率为 .
故选:D.
【点睛】本题考查利用古典概型的概率公式求事件的概率,一般利用列举法列举出基本事件,考查计算
能力,属于基础题.
7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算
筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为
“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个
数字表示两位数中,能被3整除的概率是A. B.
C. D.
【答案】D
【解析】1根算筹只能表示1,2根根算筹可以表示2和6,3根算筹可以表示3和7,4根算筹可以表示4和
8,5根算筹可以表示5和9,
因此6根算筹表示的两位数有15,19,51,91,24,28,64,68,42,82,46,86,37,33,73,77共16个,其中
15,51,24,42,33共5个可以被3整除,
所以所求概率为 .
故选:D.
【点睛】本题考查古典概型,考查中国古代数学文化,解题关键是用列举法写出6根算筹所能表示的两
位数.
8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、
机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点
间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边
三角形的边长比为 ,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是A. B.
C. D.
【答案】C
【解析】设图中的小的勒洛三角形所对应的等边三角形的边长为 ,
则小勒洛三角形的面积 ,
因为大小两个勒洛三角形,它们所对应的等边三角形的边长比为 ,
所以在勒洛三角形的面积为
若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率为 ,
故选:C
【点睛】此题考查概率与几何概型、平面图形等知识,考查阅读能力和数学计算能力,属于中档题.
9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是
A.若随机变量 服从正态分布 , ,则 ;
B.已知直线 平面 ,直线 平面 ,则“ ”是“ ”的必要不充分条件;
C.若 ,则 在 方向上的正射影的数量为
D.命题 的否定
【答案】BCD
【解析】对于A,随机变量 服从正态分布 ,
所以图像关于 对称,根据 ,
可得 ,所以 ,故A正确;
对于B,直线 平面 ,直线 平面 ,
若 ,则 是真命题;若 ,则 是假命题,
所以“ ”是“ ”的充分不必要条件,故B错误;
对于C,若 ,则 在 方向上的正射影的数量为 或 ,故C错误;
对于D,命题 的否定 ,故D错误;
故选:BCD
【点睛】本题主要考查了正态分布概率的性质、充分性与必要性的定义、向量数量积的几何意义、特称
命题的否定变换原则,属于基础题.
10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户
低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.
【答案】56
【解析】该社区共有 户,
利用分层抽样的方法, 中等收入家庭应选 户,
故答案为:56.
【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.
11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.
农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛
拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅
定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相
同的概率为______.
【答案】
【解析】记布施,持戒,忍辱,精进,禅定,般若分别为 , , , , , ,则基本事件有 , , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
, , , , , ,
共36个,其中符合条件的有6个,故所求概率 .
故答案为 .
12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活
动,并在培训结束后对学生进行了考核.记 表示学生的考核成绩,并规定 为考核优秀.为
了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶
图:
(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率;
(Ⅱ)从图中考核成绩满足 的学生中任取2人,求至少有一人考核优秀的概率;
(Ⅲ)记 表示学生的考核成绩在区间 的概率,根据以往培训数据,规定当
时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明理由.
【答案】(Ⅰ) (Ⅱ) (Ⅲ)见解析
【解析】(Ⅰ)设这名学生考核优秀为事件 ,
由茎叶图中的数据可以知道,30名同学中,有7名同学考核优秀,
所以所求概率 约为
(Ⅱ)设从图中考核成绩满足 的学生中任取2人,
至少有一人考核成绩优秀为事件 ,
因为表中成绩在 的6人中有2个人考核为优,
所以基本事件空间 包含15个基本事件,事件 包含9个基本事件,
所以
(Ⅲ)根据表格中的数据,满足 的成绩有16个,
所以
所以可以认为此次冰雪培训活动有效.
13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明
显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等
级与空气质量指数对照如下表:空气质量
300以上
指数
六级
一级 二级 三级 四级 五级
空气质量
(严重污
等级 (优) (良) (轻度污染) (中度污染) (重度污染)
染)
(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;
(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空
气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).
①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,
求X的分布列和数学期望;
②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不
影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不
宜进行户外体育运动的概率.
【答案】(1)28天;(2)①分布列见解析, ;② .
【解析】(1)由频率分布直方图可得,空气质量指数在 的天数为2天,所以估计空气质量指数
在 的天数为1天,故在这30天中空气质量等级属于优或良的天数为28天.
(2)①在这30天中,乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数共6天,
∴ , , ,
∴X的分布列为X 0 1 2
P
∴ .
②甲不宜进行户外体育运动的概率为 ,乙不宜进行户外体育运动的概率为 ,
∴ .
【点睛】此题考查离散型随机变量的分布列及期望的求法,频率分布表的应用,属于中档题.
14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对
2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元)
人数 10 15 20 15 20 10
(1)根据以上数据完成 列联表,并判断是否有 的把握认为购买金额是否少于60元与性别有关.
不少于60元 少于60元 合计
男 40
女 18
合计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为 (每
次抽奖互不影响,且 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2
次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数 (元)的分布列并
求其数学期望.
附:参考公式和数据: , .
附表:2.072 2.706 3.841 6.635 7.879
0.150 0.100 0.050 0.010 0.005
【答案】(1)见解析,有 的把握认为购买金额是否少于60元与性别有关.(2)分布列见解析,数学期
望75
【解析】(1) 列联表如下:
不少于60元 少于60元 合计
男 12 40 52
女 18 20 38
合计 30 60 90
,
因此有 的把握认为购买金额是否少于60元与性别有关.
(2) 可能取值为65,70,75,80,且 .
, ,
, ,
所以 的分布列为
65 70 75 80
.
15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技
术改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)数据,并绘制了如下茎叶图:
(Ⅰ)(1)设所采集的40个连续正常运行时间的中位数 ,并将连续正常运行时间超过 和不超过 的次
数填入下面的列联表:
超过 不超过
改造前
改造后
试写出 , , , 的值;
(2)根据(1)中的列联表,能否有 的把握认为生产线技术改造前后的连续正常运行时间有差异?
附: ,
0.050 0.010 0.001
3.841 6.635 10.828
(Ⅱ)工厂的生产线的运行需要进行维护.工厂对生产线的生产维护费用包括正常维护费、保障维护费两
种对生产线设定维护周期为 天(即从开工运行到第 天( )进行维护.生产线在一个生产周期内
设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产线能连续运行,则不会产生保
障维护费;若生产线不能连续运行,则产生保障维护费.经测算,正常维护费为0.5万元 次;保障维
护费第一次为0.2万元 周期,此后每增加一次则保障维护费增加0.2万元.现制定生产线一个生产周期
(以120天计)内的维护方案: , ,2,3,4.以生产线在技术改造后一个维护周期内能连续
正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及期望值.【答案】(Ⅰ)(1) , , , ,(2)有 的把握认为连续正常运行时间有差异;(Ⅱ)分
布列见解析,2.275万元.
【解析】(Ⅰ)(1)由茎叶图知 ,根据茎叶图可得: , , , .
(2)由于 ,所以有 的把握认为连续正常运行时间有差异.
(Ⅱ)生产周期内有4个维护周期,一个维护周期为30天,一个维护周期内,生产线需保障维护的概率为
.
设一个生产周期内需保障维护的次数为 次,则正常维护费为 万元,保障维护费为
万元.
故一个生产周期内需保障维护 次时的生产维护费为 万元.
由于 ,设一个生产周期内的生产维护费为 万元,则分布列为
2 2.2 2.6 3.2 4
则
万元.
故一个生产周期内生产维护费的期望值为2.275万元.
【点睛】本题考查了独立性检验,分布列,数学期望,意在考查学生的计算能力和综合应用能力.16.【2020·四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用
简单随机抽样方法从该地区调查了500位被隔离者,结果如下:
性别
男 女
是否需要
需要 40 30
不需要 160 270
0.050 0.010 0.001
3.841 6.635 10.828
(1)估计该地区被隔离者中,需要社区非医护人员提供帮助的被隔离者的比例;
(2)能否有99%的把握认为该地区的被隔离者是否需要社区非医护人员提供帮助与性别有关?
【答案】(1) ;(2)有99%的把握认为该地区的被隔离者是否需要帮助与性别有关.
【解析】(1)∵调查的500位被隔离者中有 位
需要社区非医护人员提供帮助,
∴该地区被隔离者中需要帮助的被隔离者的比例的估算值为
;
(2)根据列联表所给的数据,代入随机变量的观测值公式,
.
∵ ,
∴有99%的把握认为该地区的被隔离者是否需要帮助与性别有关.
17.【2020·四川省阆中中学高三其他】共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,
2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所
示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁
及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有 是“年轻人”.
(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个
容量为200的样本,请你根据图表中的数据,补全下列 列联表,并根据列联表的独立性检验,
判断是否有85%的把握认为经常使用共享单车与年龄有关?
使用共享单车情况与年龄列联表
年轻人 非年轻人 合计
经常使用单车用户 120
不常使用单车用户 80
合计 160 40 200
(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人
数为随机变量 ,求 的分布列与期望.
参考数据:独立性检验界值表
0.15 0.10 0.050 0.025 0.010
2.072 2.706 3.841 5.024 6.635
其中, ,
【答案】(1)列联表见解析,有 的把握可以认为经常使用共享单车与年龄有关;(2)分布列见解析,数学期望为 .
【解析】(1)补全的列联表如下:
年轻人 非年轻人 合计
经常使用共享单
100 20 120
车
不常使用共享单
60 20 80
车
合计 160 40 200
于是 , , , ,
∴ ,
即有 的把握可以认为经常使用共享单车与年龄有关.
(2)由(1)的列联表可知,
经常使用共享单车的“非年轻人”占样本总数的频率为 ,
即在抽取的用户中出现经常使用单车的“非年轻人”的概率为0.1,
∵ ,
∴ ,
, ,
∴ 的分布列为
0 1 2 3
0.729 0.243 0.027 0.001.
∴ 的数学期望 .
【点睛】本题主要考查了 列联表,独立性检验,二项分布,二项分布的期望,属于中档题.
18.【2020·山西省高三月考】在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.
(1)一研究团队统计了某地区1000名患者的相关信息,得到如下表格,
该传染病的潜伏期受诸多因素影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准
进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表,请将列联表补充完整,并根据列
联表判断是否有95%的把握认为潜伏期与患者年龄有关
潜伏期≤6天 潜伏期>6天 总计
50岁以上(含50岁) 100
50岁以下 55
总计 200
(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名
患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期
超过6天的人数最有可能(即概率最大)是多少?
附:下面的临界值表仅供参考.
0.05 0.025 0.010
3.841 5.024 6.635
(参考公式: ,其中 .)
【答案】(1)没有95%的把握认为潜伏期与患者年龄有关;(2)8
【解析】(1)根据题意,补充完整列联表如下:
潜伏期≤6天 潜伏期>6天 总计
50岁以上(含50岁) 65 35 100
50岁以下 55 45 100
总计 120 80 200所以 ,
所以没有95%的把握认为潜伏期与患者年龄有关;
(2)根据题意得,该地区每1 名患者潜伏期超过6天发生的概率为 ,
设被调查的20名患者中潜伏期超过6天的人数为 ,则 ,
,
由 ,
得 ,、
化简得 ,解得 ≤ ≤ ,
因为 ,所以 ,
所以这20名患者中潜伏期超过6天的人数最有可能为8人.
【点睛】此题考查二项分布的随机变量概率值最大取值问题,考查了独立性检验,考查了分析问题、解
决问题的能力,属于中档题.