文档内容
专题 09 概率与统计
1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)
的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散
点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方
程类型的是
A. B.
C. D.
2.【2020年高考全国II卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200
份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工
作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过 1600份的概率为0.05,志愿者
每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于 0.95,则
至少需要志愿者
A.10名 B.18名
C.24名 D.32名
3.【2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为 ,且,则下面四种情形中,对应样本的标准差最大的一组是
A. B.
C. D.
4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学
生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是
A.62% B.56%
C.46% D.42%
5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为 ,且
,定义X的信息熵 .
A.若n=1,则H(X)=0
B.若n=2,则H(X)随着 的增大而增大
C.若 ,则H(X)随着n的增大而增大
D.若 n=2m,随机变量 Y 所有可能的取值为 ,且 ,则
H(X)≤H(Y)
6.【2020年高考江苏】已知一组数据 的平均数为4,则 的值是 ▲ .
7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的
概率是_____.
8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位: ),将所得数据分为9组:
,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为
A.10 B.18
C.20 D.36
9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为 和 .假定两球是否落入盒子互不影响,
则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.
10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1
个,不放回,直到取出红球为止.设此过程中取到黄球的个数为 ,则 _______,
_______.
11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:
累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行
下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其
中一人被淘汰,另一人最终获胜,比赛结束.
经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为 ,
(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.
为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样
的方法抽取20个作为样区,调查得到样本数据(x,y)(i=1,2,…,20),其中x和y分别表示第i个样
i i i i
区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 , ,
, , .
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平
均数乘以地块数);
(2)求样本(x,y) (i=1,2,…,20)的相关系数(精确到0.01);
i i
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生
动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数 , .
13.【2020年高考全国III卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天
到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
锻炼人次
[0,200] (200,400] (400,600]
空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称
这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的
把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
P(K2≥k) 0.050 0.010 0.001
附:K2= k 3.841 6.635 10.828 .
,
14.【2020年高考山东】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 天空气中
的 和 浓度(单位: ),得下表:
32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中 浓度不超过 ,且 浓度不超过 ”的概率;
(2)根据所给数据,完成下面的 列联表:
(3)根据(2)中的列联表,判断是否有 的把握认为该市一天空气中 浓度与 浓度有关?
附: ,
0.050 0.010 0.001
3.841 6.635 10.82818.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.
为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
男生 女生
支持 不支持 支持 不支持
方案一 200人 400人 300人 100人
方案二 350人 250人 150人 250人
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一
的概率;
(Ⅲ)将该校学生支持方案的概率估计值记为 ,假设该校年级有500名男生和300名女生,除一年级
外其他年级学生支持方案二的概率估计值记为 ,试比较 与 的大小.(结论不要求证明)
1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的
办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学
号应为
A. B.
C. D.
2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组 表示的平面区域为 ,若从圆
: 的内部随机选取一点 ,则 取自 的概率为
A. B.C. D.
3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:
“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对
应的二进制数011 化为十进制的计算如下:011 =0×22+1×21+1×20=3 .若从两类符号中任取2个符
(2) (2) (10)
号进行排列,则得到的二进制数所对应的十进制数大于2的概率为
A. B.
C. D.
4.【2020·河南省高三三模】随着 年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速
上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是 年至 年中国雪
场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是
A. 年至 年,中国雪场滑雪人次逐年增加
B. 年至 年,中国雪场滑雪人次和同比增长率均逐年增加
C. 年与 年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等
D. 年与 年相比,中国雪场滑雪人次增长率约为5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒( )引起的肺炎疫情爆
发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方
法后,每周治愈的患者人数如下表所示:
周数(x) 1 2 3 4 5
治愈人数
2 17 36 93 142
(y)
由表格可得 关于 的二次回归方程为 ,则此回归模型第4周的残差(实际值与预报值之差)
为
A.5 B.4
C.1 D.0
6.【2020·四川省绵阳南山中学高三一模】从标号分别为 、 、 、 、 的 张标签中随机抽取一张,
放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差 的概率为
A. B.
C. D.
7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算
筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为
“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个
数字表示两位数中,能被3整除的概率是
A. B.
C. D.8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、
机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点
间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边
三角形的边长比为 ,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是
A. B.
C. D.
9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是
A.若随机变量 服从正态分布 , ,则 ;
B.已知直线 平面 ,直线 平面 ,则“ ”是“ ”的必要不充分条件;
C.若 ,则 在 方向上的正射影的数量为
D.命题 的否定
10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户
低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.
11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.
农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛
拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅
定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相
同的概率为______.12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活
动,并在培训结束后对学生进行了考核.记 表示学生的考核成绩,并规定 为考核优秀.为
了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶
图:
(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率;
(Ⅱ)从图中考核成绩满足 的学生中任取2人,求至少有一人考核优秀的概率;
(Ⅲ)记 表示学生的考核成绩在区间 的概率,根据以往培训数据,规定当
时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说
明理由.
13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明
显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等
级与空气质量指数对照如下表:
空气质量
300以上
指数六级
一级 二级 三级 四级 五级
空气质量
(严重污
等级 (优) (良) (轻度污染) (中度污染) (重度污染)
染)
(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;
(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空
气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).
①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,
求X的分布列和数学期望;
②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不
影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不
宜进行户外体育运动的概率.
14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对
2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元)
人数 10 15 20 15 20 10
(1)根据以上数据完成 列联表,并判断是否有 的把握认为购买金额是否少于60元与性别有关.
不少于60元 少于60元 合计
男 40
女 18
合计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为 (每
次抽奖互不影响,且 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2
次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数 (元)的分布列并
求其数学期望.
附:参考公式和数据: , .
附表:2.072 2.706 3.841 6.635 7.879
0.150 0.100 0.050 0.010 0.005
15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技
术改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度
(单位:天)数据,并绘制了如下茎叶图:
(Ⅰ)(1)设所采集的40个连续正常运行时间的中位数 ,并将连续正常运行时间超过 和不超过 的次
数填入下面的列联表:
超过 不超过
改造前
改造后
试写出 , , , 的值;
(2)根据(1)中的列联表,能否有 的把握认为生产线技术改造前后的连续正常运行时间有差异?
附: ,
0.050 0.010 0.001
3.841 6.635 10.828
(Ⅱ)工厂的生产线的运行需要进行维护.工厂对生产线的生产维护费用包括正常维护费、保障维护费两
种对生产线设定维护周期为 天(即从开工运行到第 天( )进行维护.生产线在一个生产周期内
设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产线能连续运行,则不会产生保障维护费;若生产线不能连续运行,则产生保障维护费.经测算,正常维护费为0.5万元 次;保障维
护费第一次为0.2万元 周期,此后每增加一次则保障维护费增加0.2万元.现制定生产线一个生产周期
(以120天计)内的维护方案: , ,2,3,4.以生产线在技术改造后一个维护周期内能连续
正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及期望值.
16.【2020·四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用
简单随机抽样方法从该地区调查了500位被隔离者,结果如下:
性别
男 女
是否需要
需要 40 30
不需要 160 270
0.050 0.010 0.001
3.841 6.635 10.828
(1)估计该地区被隔离者中,需要社区非医护人员提供帮助的被隔离者的比例;
(2)能否有99%的把握认为该地区的被隔离者是否需要社区非医护人员提供帮助与性别有关?
17.【2020·四川省阆中中学高三其他】共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,
2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所
示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁
及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次
或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有 是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个
容量为200的样本,请你根据图表中的数据,补全下列 列联表,并根据列联表的独立性检验,
判断是否有85%的把握认为经常使用共享单车与年龄有关?
使用共享单车情况与年龄列联表
年轻人 非年轻人 合计
经常使用单车用户 120
不常使用单车用户 80
合计 160 40 200
(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人
数为随机变量 ,求 的分布列与期望.
参考数据:独立性检验界值表
0.15 0.10 0.050 0.025 0.010
2.072 2.706 3.841 5.024 6.635
其中, ,
18.【2020·山西省高三月考】在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机
体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.
(1)一研究团队统计了某地区1000名患者的相关信息,得到如下表格,该传染病的潜伏期受诸多因素影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准
进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表,请将列联表补充完整,并根据列
联表判断是否有95%的把握认为潜伏期与患者年龄有关
潜伏期≤6天 潜伏期>6天 总计
50岁以上(含50岁) 100
50岁以下 55
总计 200
(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名
患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期
超过6天的人数最有可能(即概率最大)是多少?
附:下面的临界值表仅供参考.
0.05 0.025 0.010
3.841 5.024 6.635
(参考公式: ,其中 .)