文档内容
专题 22 概率与统计的综合应用与高级分析
目录
01 模拟基础练...............................................................................................................2
题型一:求概率及随机变量的分布列与期望.............................................................2
题型二:超几何分布与二项分布.................................................................................4
题型三:概率与其它知识的交汇问题.........................................................................6
题型四:期望与方差的实际应用.................................................................................8
题型五:正态分布与标准正态分布...........................................................................11
题型六:统计图表及数字特征...................................................................................12
题型七:线性回归与非线性回归分析.......................................................................13
题型八:独立性检验...................................................................................................16
题型九:与体育比赛规则有关的概率问题...............................................................19
题型十:决策型问题...................................................................................................21
题型十一:递推型概率命题.......................................................................................22
题型十二:条件概率、全概率公式、贝叶斯公式...................................................23
重难点突破:高等背景下的概统问题.......................................................................25
02 重难创新练.............................................................................................................30
题型一:求概率及随机变量的分布列与期望
1.2024年5月某数据挖掘与分析机构发布《2024年中国国货消费品牌500强》,统计榜单前20名品牌所
在行业,得到如下频数表.
行业 汽车出行 3C数码 家用电器 食品饮料 生鲜水果 珠宝文玩
频数 7 4 4 3 1 1(1)从表中家用电器、生鲜水果、珠宝文玩行业的6个品牌中随机抽3个,求抽取的3个品牌恰好来自2个
不同行业的概率;
(2)从来自汽车出行、3C数码及家用电器的15个品牌中抽取4个品牌,且来自3C数码及家用电器的品牌抽
取的数目相同,记该数目为X,求X的分布列与期望.
【解析】(1)从这6个品牌中随机抽3个,抽取的3个品牌恰好来自2个不同行业,
抽取结果数为 ,
所以所求概率为 .
(2) 的取值依次为0,1,2,
从15个品牌中抽取4个品牌,且来自3C数码及家用电器的品牌抽取的数目相同的总数为
,
,
,
,
所以 的分布列为
0 1 2
.
2.甲、乙、丙 人进行跳棋比赛, 人两两各进行 局,共进行 局,赢的局数多者获胜,且这 人只有
人可获胜,若没有获胜者,则这 人两两再各进行 局,若还没有获胜者,则比赛结束.假设甲、乙、丙每
人每局赢的概率均为 ,每局是平局的概率均为 ,每人每局的结果相互独立.设每赢 局得 分,平 局得
分,输 局得 分.
(1)求该跳棋比赛前 局没有获胜者且乙和丙的得分相等的概率;
(2)已知前 局中甲、乙、丙各赢 局,这 人两两再各进行 局,记甲在这 局中获得的总分为 ,求 的分布列与数学期望.
【解析】(1)依题意可得乙和丙不可能都得 分或 分,
则乙和丙可能都得 分或 分,
当乙和丙都得 分时,这 局均为平局或这 局每人各赢 局;
当乙和丙都得 分时,乙与丙都赢了甲且乙与丙的对局结果为平局.
所以该跳棋比赛前 局没有获胜者且乙和丙的得分相等的概率为 .
(2)依题意可得 的可能取值为 ,
则 , ,
, ,
,
则 的分布列为:
6 5 4 3 2
故 .
题型二:超几何分布与二项分布
3.某学校为了了解学生平时的运动时长情况,现从全校 名学生中随机抽取 名学生,统计出他们的
运动时长(单位:分钟),将这些运动时长按 、 、 、 分成五组,得到如图所示的
频率分布直方图.(1)求出 的值,并估计全校学生中运动时长超过 分钟的人数;
(2)在上述选取的 名学生中任意选取 名学生,设 为运动时长超过 分钟的人数,求 的分布列与期
望 ;
(3)现将运动时长高于 分钟的学生称为“热爱运动者”,现从样本中任意选取 名学生,求恰有 名学生
是“热爱运动者”的概率.
【解析】(1)由于频率分布直方图中所有矩形面积之和为 ,
则 .
全校学生运动时长超过 分钟的人数约为 .
(2)由图可知,运动时长超过 分钟的人数为 ,
运动时长不超过 分钟的人数为 ,
由题意可知 的可能取值为 、 、 ,
则 , , ,
所以 的分布列为
所以 .
(3)运动时长超过 分钟的人数为 ,运动时长不超过 分钟的人数为 ,
所以从样本中任意选取 名学生,
恰有 名学生是“热爱运动者”的概率 .
4.某公司拟通过摸球的方式给员工发放节日红包,在一个不透明的袋子中装有5个标有红包金额的球,其
中2个球分别标注40元,2个球分别标注50元,1个球标注60元,这5个球除标注的金额外完全相同.每
名员工从袋中一次摸出1个球,共摸n次,摸出的球上所标注的金额之和为该员工所获得的红包金额.
(1)若 ,求一名员工所获得的红包金额不低于50元的概率;
(2)若 ,且每次摸出的球放回袋中,设事件A为“一名员工所获得的红包金额不大于100元”,事件B
为“一名员工所获得的红包金额不小于100元”,试判断A,B是否相互独立,并说明理由.
【解析】(1)一名员工所获得的红包金额不低于50元,即获得50元或60元,
故所求概率为 .
(2)由题意,事件AB表示“一名员工所获得的红包金额为100元”.
因为 ,
所以 .
“一名员工所获得的红包金额为80元或90元或100元”,
因为 ,
所以 .
“一名员工所获得的红包金额为100元或110元或120元,
因为 ,
所以 .
所以 ,
所以A,B不相互独立.题型三:概率与其它知识的交汇问题
5.某工业流水线生产一种零件,该流水线的次品率为 ,且各个零件的生产互不影响.
(1)若流水线生产零件共有两道工序,且互不影响,其次品率依次为 .
①求p;
②现对该流水线生产的零件进行质量检测,检测分为两个环节:先进行自动智能检测,若为次品,零件就
会被自动淘汰;若智能检测结果为合格,则进行人工抽检.已知自动智能检测显示该批零件的合格率为
99%,求人工抽检时,抽检的一个零件是合格品的概率(合格品不会被误检成次品).
(2)视p为概率,记从该流水线生产的零件中随机抽取n个产品,其中恰好含有 个次品的概率为
,求函数 最大值.
【解析】(1)①因为两道生产工序互不影响,
所以 .
②记该款芯片自动智能检测合格为事件A,人工抽检合格为事件B,
且 ,
则人工抽检时,抽检的一个芯片恰是合格品的概率为 .
(2)因为各个芯片的生产互不影响,所以 ,
所以 ,
令 ,得 ,又 ,则 ,
所以当 时, 为单调增函数,
当 时, 为单调减函数,
所以,当 时, 取得最大值,则 最大值为 .
6.袋中有大小、形状完全相同的4个红球,2个白球,采用有放回摸球,从袋中随机摸出1个球,定义
变换为:若摸出的球是白球,则把 图象上所有点的横坐标伸长到原来的2倍(纵坐标不变);若摸出
的是红球,则将 图象上所有的点向上平移1个单位,函数 经过1次 变换后的函数记为 ,
经过2次 变换后的函数记为 ,…,经过 次 变换后的函数记为 .现对函数
进行连续的 变换.
(1)若第一次摸出的是白球,第二次摸出的是红球,求 ;
(2)记 ,求随机变量 的分布列及数学期望.
【解析】(1)第一次从袋中摸出的是白球,把函数 变换为 ,
第二次从袋中摸出的是红球,把函数 变换为 ,
所以 .
(2)经过3次 变换后, 有4种情况:
若摸出的3个球都是白球,则 ;
若摸出的3个球为2个白球、1个红球,则 ;
若摸出的3个球为1个白球、2个红球,则 ;
若摸出的3个球都是红球,则 ;
所以随机变量 的可能取值为 .因为从袋中随机摸出1个球,是白球的概率为 ,是红球的概率为 ,
故 ,
,
,
.
所以所求随机变量 的分布列为
所以, .
题型四:期望与方差的实际应用
7.随着巴黎奥运会的举办,中国义乌再度吸引全球目光,“义乌制造”再次被奥运“带火”.某义乌体
育用品公司承接了部分巴黎奥运会体育产品的制造,假设该产品在试产阶段采用 两种不同的方案进行
生产,已知每种方案均有三道加工工序,每道工序的加工结果相互独立,且只有每道加工工序都合格,该
产品方能出厂进行销售,若某道加工工序不合格,则该产品停止加工.已知方案 :每道加工工序合格的
概率均为 ;方案 :第一、二、三道加工工序合格的概率分别为 .
(1)若分别采用 两种方案各自生产一件产品,求生产的两件产品中只有一件产品可以出厂销售的概率;
(2)若方案 :每件产品每道工序的加工成本为10元,销售时单价为100元;方案 :每件产品的第一、二、
三道工序的加工成本分别为5元,10元和15元,销售时单价为100元.若以每件产品获利的数学期望为决
策依据,请判断该公司应采用哪种方案进行加工生产.【解析】(1)采用方案 加工的产品可以出厂销售的概率为 ;
采用方案 加工的产品可以出厂销售的概率为 ,
故生产的两件产品只有一件可以出厂销售的概率 .
(2)用 表示方案 每件产品的利润,
则 的所有可能取值为 ,
, ,
,
,
所以 的分布列为:
则 .
用 表示方案 每件产品的利润,
则 的所有可能取值为 ,
, ,
, ,
则 的分布列为:
则 .因为 ,所以该公司应采用方案 进行加工生产.
8.近些年天然气使用逐渐普及,为了百姓能够安全用气,国务院办公厅印发《城市燃气管道等老化更新
改造实施方案(2022―2025年)》.某市在实施管道老化更新的过程中,从本市某社区1000个家庭中随机
抽取了100个家庭燃气使用情况进行调查,统计了这100个家庭一个月的燃气使用量(单位: ),得到
如下频数分布表:
燃
气
使
用
量
(单
位
:
)
频
6 14 18 30 16 12 4
数
(1)若采用分层抽样的方法从燃气使用量在 和 这两组的家庭中随机抽取8个家庭,市
政府决定从这8个家庭中抽取4个跟踪调查其使用情况,记随机变量 表示这4个家庭中燃气使用量在
内的家庭个数,求 的分布列和数学期望;
(2)将这一个月燃气使用量超过22 的家庭定为“超标”家庭.若该社区这一个月燃气使用量服从正态分布
,其中 近似为100个样本家庭的平均值,估计该社区中“超标”家庭的户数.(结果四舍五入
取整数)
附:若X服从正态分布 ,则 , ,
.
【解析】(1)燃气使用量在 的家庭个数为: (个),
在 的家庭个数为: (个),
则 的所有可能取值有0,1,2,, , ,
则 的分布列为
0 1 2
所以 .
(2)由题意知这100个样本家庭的平均值 ,
所以 ,
又 ,估计该社区中“超标”家庭的户数为159个.
题型五:正态分布与标准正态分布
9.某同学进行投篮训练,已知每次投篮的命中率均为0.5.
(1)若该同学共投篮4次,求在投中2次的条件下,第二次没有投中的概率;
(2)设随机变量 服从二项分布 ,记 则当 时,可认为η服从标准正态分布
.若保证投中的频率在区间 的概率不低于 ,求该同学至少要投多少次.
附: 若 ,则 , .
【解析】(1)该同学投篮了四次,设 分别表示“第二次没有投中”和“恰投中两次”.
则有 .
(2)随机变量 代表 次投篮后命中的次数,则 服从二项分布 ,然后令随机变量 ,并近似视为其服从正态分布 .
题目条件即为 ,即 的概率至少为 .
由于我们有 ,
故命题等价于 ,解得 .
综上,该同学至少要投 次.
10.怀远石榴是安徽省怀远县的特产,国家地理标志产品,唐代已有栽植.怀远石榴籽白莹澈如水晶,果
实大如碗,皮黄而透红,肉肥核细,汁多味甘.现按照怀远石榴的果径大小分为四类:特级果,一级果,
二级果,三级果.某果农从其果园采摘的石榴中随机选取50个,测量果径对照分类标准得到数据如表所示:
等级 特级果 一级果 二级果 三级果
个数 5 10 20 a
(1)求a的值并计算三级果所占的百分比;
(2)用样本估计总体,该果农参考以下两种销售方案进行销售.
方案1:分类出售,各等级石榴的市场价如表所示:
等级 特级果 一级果 二级果 三级果
售价(元/个) 10 8 5 2
方案2:不分类出售,均按二级果售价出售.
从果农的收益考虑,不考虑其它因素应该采用哪种方案较好?说明理由.
【解析】(1) ,三级果所占的百分比为 .
(2)用样本估计总体的分布,可得方案1的石榴的平均售价为
(元),
因为 ,所以选择方案1较好.
题型六:统计图表及数字特征
11.为激发户外运动爱好者健身热情,增进群众健身获得感、幸福感. 某市体育部门随机抽取200名群众进行每天体育运动时间的调查,按照时长(单位:分钟)分成6组:[30,40),[40,50),[50,60),[60,70),
[70,80),[80,90]. 处理后绘制了如下图的频率分布直方图.
(1)求图中 的值;
(2)求运动时长在[50,70)的样本群众人数;
(3)估计该市群众每天体育运动时间的众数、平均数、中位数(保留1位小数).
【解析】(1)根据题意,
, 解得 .
(2)运动时长为 的频率为
所以运动时长为 的样本群众人数为 (人)
(3)由图可知,该市群众每天体育运动时间的众数约为 .
该市群众每天体育运动时间的平均数约为
由题意知, 前两组的频率为 ,
前三组的频率为 .
所以 中位数在50和60之间,设为x,则 + ( ,解得 ,
即该市群众每天体育运动时间的中位数约为 .
题型七:线性回归与非线性回归分析
12.某乒乓球训练机构以培训青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位
置(称为“准点球”),每周记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比
(y%),A学员已经训练了1年,下表记录了A学员最近七周“准点球”的百分比:
周次(x) 1 2 3 4 5 6 7y(%) 52 52.8 53.5 54 54.5 54.9 55.3
若 .
(1)根据上表数据,计算y与z的相关系数r,并说明y与z的线性相关性的强弱;(若 ,则认为
y与z线性相关性很强;若 ,则认为y与z线性相关性一般;若 ,则认为y与z线性相
关性较弱)(精确到0.01)
(2)求y关于x的线性回归方程,并预测第9周“准点球”的百分比(精确到0.01);
(3)若现在认为A学员“准点球”的百分比为55%,并以此为概率,现让A学员打3个球,以X表示“准点
球”的个数,求X的数学期望.
参考公式和数据:对于一组数据
, , , , ,
, , , , .
【解析】(1)
故 与 线性相关性很强.
(2) ,
,
所以 关于 的线性回归方程为 ,将 代入 ,
得 .
当 时, ,
故预测第9周“准点球”的百分比为55.89%.
(3)现在A学员任打一球是“准点球”的概率为: ,
由题意 ,数学期望 .
13.某市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1日~9月9日连续9天
的呼吸机日生产量为 (单位:百台, ,2, ,9),数据作了初步处理,得到如图所示的散点图.
2.73 19 5 285 1095
注:图中日期代码1~9分别对应9月1日~9月9日;表中 , .
(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于
200台的概率;
(2)由散点图分析,样本点都集中在曲线 的附近,求y关于t的方程 ,并估计该公
司从生产之日起,需要多少天呼吸机日生产量可超过500台.
参考数据: .
【解析】(1)由散点图知,不高于300台的样本点有5个,其中高于200台的样本点有4个,则在2个样本点的生产量都不高于300台的条件下,2个样本点都高于200台的概率为
(2)
则由回归直线方程系数求解公式知,
,
,
故 .
,
所以需要38天呼吸机日生产量可超过500台.
题型八:独立性检验
14.为了解2024年长春市居民网购消费情况,在全市随机抽取了100人,对其2024年全年网购消费金额
(单位:千元)进行了统计,所统计的金额均在区间 内,并按 , , , 分成6组,
制成如图所示的频率分布直方图.
(1)求图中 的值,并估计居民网购消费金额的中位数.
(2)若将全年网购消费金额在20千元及以上者称为网购迷,结合图表数据,补全下面的 列联表,并判
断能否依据小概率值 的 独立性检验认为样本数据中网购迷与性别有关.男 女 合计
网购迷 20
非网购迷 45
合计
附: ,其中 .
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解析】(1)由题意得: ,
解得 ;
设中位数为x,前3组的频率为: ,
前4组的频率为: ,
所以中位数在第四组,则 ,解得 ;
(2)由(1)知:网购迷人数为: 人,非网购迷人数为65人,
则 列联表如下:
男 女 合计
网购迷 15 20 35
非网购迷 45 20 65
合计 60 40 100
因为 ,
所以依据小概率值 的 独立性检验认为样本数据中网购迷与性别有关.
15.向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展.以人工智能的应用为例,人工
智能中的文生视频模型 (以下简称 ),能够根据用户的文本提示创建最长 秒的逼真视频.为调查 的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了 名视频从业人员进
行调查,结果如下表所示.
视频从业人员
Sora的应用情况 合计
减少 未减少
应用
没有应用
合计
(1)根据所给数据完成题中表格,并判断是否有 的把握认为 的应用与视频从业人员的减少有关?
(2)某公司视频部现有员工 人,公司拟开展 培训,分三轮进行,每位员工第一轮至第三轮培训达到
“优秀”的概率分别为 ,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用 .
(i)求员工经过培训能应用 的概率;
(ii)已知开展 培训前,员工每人每年平均为公司创造利润 万元;开展 培训后,能应用 的
员工每人每年平均为公司创造利润 万元; 培训平均每人每年成本为 万元.根据公司发展需要,计划
先将视频部的部分员工随机调至其他部门,然后对剩余员工开展 培训,现要求培训后视频部的年利润
不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
附: ,其中 .
【解析】(1)依题意, 列联表如下:
视频从业人员
Sora的应用情况 合计
减少 未减少
应用
没有应用
合计零假设 为: 的应用与视频从业人员的减少独立, 的应用前后视频从业人员无差异,
由列联表中数据得, .
根据小概率值 的 的独立性检验,推断 不成立,
所以有 的把握认为 的应用与视频从业人员的减少有关;
(2)(i)设 “员工第 轮获得优秀” ,且 相互独立.
设 “员工经过培训能应用 ”,则
故员工经过培训能应用 的概率是 .
(ii)设视频部调 人至其他部门, 为培训后视频部能应用 的人数,
则 ,因此 ,
调整后视频部的年利润为
(万元),
令 ,解得 ,又 ,所以 .
因此,视频部最多可以调 人到其他部门.
题型九:与体育比赛规则有关的概率问题
16.第24届冬奥会于2022年2月4日在北京国家体育场开幕,“冬奥热”在国民中迅速升温.某电视台举
办“冬奥会”知识挑战赛,初赛环节,每位选手先从A(滑雪),B(滑冰),C(冰球)三类问题中选择
一类.该类题库随机提出一个问题,该选手若回答错误则被淘汰,若回答正确则需从余下两类问题中选择一
类继续回答.该类题库随机提出一个问题,该选手若回答正确则取得复赛资格,本轮比赛结束,否则该选手
需要回答由最后一类题库随机提出的两个问题,两个问题均回答正确该选手才可取得复赛资格,否则被淘汰.已知选手甲能正确回答A,B两类问题的概率均为 ,能正确回答C类问题的概率为 ,每题是否回答
正确与回答顺序无关,且各题回答正确与否相互独立.
(1)已知选手甲先选择A类问题且回答正确,接下来他等可能地选择B,C中的一类问题继续回答,求他能
取得复赛资格的概率;
(2)为使取得复赛资格的概率最大,选手甲应如何选择各类问题的回答顺序?请说明理由.
【解析】(1)甲接下来选择回答B类问题并取得复赛资格的概率为 ,
甲接下来选择回答C类问题并取得复赛资格的概率为 ,
∴所求概率为 .
(2)由于甲回答A,B两类问题的概率相同,故只需考虑 , , 这三种回答顺序,
按 顺序回答,取得复赛资格的概率为 ,
按 顺序回答,取得复赛资格的概率为 ,
按 顺序回答,取得复赛资格的概率为 ,
∵ ,
∴按 或 顺序回答问题取得复资资格的概率最大.
17.在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.
在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方
均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为 ,且各回合相互独立.若第一回合
该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为 ;求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
【解析】(1)设事件 表示第一回合该中国队运动员赢球,事件 表示第二回合该中国队运动员赢球,
事件 表示第二回合比赛有运动员得分,
由已知, , ,
则
,
即第二回合比赛有运动员得分的概率为 .
(2)设运动员甲先发球,记事件 表示第i回合该运动员甲赢球,
记事件 表示运动员甲先得第一分,
则 ,
则 ,
所以 ,即则第一回合发球者在整场比赛中先得第一分的概率大于 ,
则比赛双方运动员实力相当的情况下,先发球者更大概率占据心理上的优势,所以旧制不合理.
题型十:决策型问题
18.贝叶斯公式 中, 称为先验概率, 称为后验概率.先验概率 表
达了对事件 的初始判断,当新的信息 出现后,我们可以利用贝叶斯公式求出后验概率 ,以此
修正自己的判断并校正决策.利用这种思想方法我们来解决如下一个实际问题.
某趣味抽奖活动准备了三个外观相同的不透明箱子,已知三个箱子中分别装有10个红球、5个红球5个白
球、10个白球(球的大小、质地相同).抽奖活动共设计了两个轮次:第一轮规则:抽奖者从三个箱子中随机选择一个箱子,并从该箱子中取出两球(分两次取出,每次取一球,
取出的球不放回),若取出的两个球都是红球则可以进入第二轮,否则抽奖活动结束(无奖金).
第二轮规则:进入第二轮的抽奖者可以选择三种抽奖方案.方案一:就此停止,并获得奖金300元;方案
二:继续从第一轮抽取的箱子中再取一球,若为红球则可获得奖金400元,若为白球奖金变为0元;方案
三:不再从第一轮抽取的箱子中取球,而是从另外两个箱子中随机选择一个箱子,并从中取出一球,若为
红球则可获得奖金800元,若为白球奖金变为80元.
(1)求抽奖者在第一次取出红球的条件下,能进入第二轮的概率;
(2)在第二轮的三种抽奖方案中,从抽奖者获得奖金的数学期望的角度,找出三种抽奖方案的最佳方案.
【解析】(1)设第 次取到红球为事件 ,
从装有10个红球、5个红球5个白球、10个白球的箱子取球分别为事件 .
在第一次取出红球的条件下,要进入第二轮只需第二次也取出红球,
所以概率为 .
(2)先分别求出在进入第二轮的条件下,第一轮在各个箱子取球的概率:
方案一:所获得奖金为300;方案二:继续取出红球的概率 ,
设所获得奖金为X,则 .
方案三:继续取出红球的概率 ,
设所获得奖金为 ,则 ,
所以方案二最佳.
题型十一:递推型概率命题
19.夏日天气炎热,学校为高三备考的同学准备了绿豆汤和银耳羹两种凉饮,某同学每天都会在两种凉饮
中选择一种,已知该同学第1天选择绿豆汤的概率是 ,若前一天选择绿豆汤,后一天继续选择绿豆汤的
概率为 ,而前一天选择银耳羹,后一天继续选择银耳羹的概率为 ,如此往复.
(1)求该同学第2天选择绿豆汤的概率;
(2)记该同学第 天选择绿豆汤的概率为 ,证明: 为等比数列;
(3)求从第1天到第10天中,该同学选择绿豆汤的概率大于选择银耳羹概率的天数.
【解析】(1)设 表示第1天选择绿豆汤, 表示第2天选择绿豆汤,则 表示第1天选择银耳羹,
根据题意得, ,
所以 .
(2)设 表示第 天选择绿豆汤,则 ,
根据题意得, ,由全概率公式得, ,
即 ,整理得, ,又 ,
所以 是以 为首项, 为公比的等比数列.
(3)由(2)得, ,
由题意,只需 ,即 ,
则 ,即 ,
显然 必为奇数, 为偶数时不成立,
当 时,考虑 的解,
当 时, 显然成立,
当 时, ,不成立,
由 单调递减得, 时,也不成立,
综上,该同学只有1天选择绿豆汤的概率大于选择银耳羹的概率.
题型十二:条件概率、全概率公式、贝叶斯公式
20.《推动大规模设备更新和消费品以旧换新行动方案》于2024年3月1日经国务院常务会议审议通过.
家电以旧换新的具体品类包括冰箱、洗衣机、电视、空调、电脑、热水器、家用灶具、吸油烟机等,每位
消费者每类产品可补贴一件,每件补贴标准不超过2000元,部分品类及补贴标准如下表.居民甲欲将家中
电视机和洗衣机进行更换,其中更换电视机的概率为0.6,两种电器只更换一件的概率为0.4,两种电器都
不更换的概率为0.2.热水 冰 洗衣 电视
品类名称 空调
器 箱 机 机
补贴标准(单位: 100
1000 1500 2000 2000
元/件) 0
(1)求居民甲在不更换洗衣机的条件下更换电视机的概率;
(2)居民乙欲从表中5个品类中任选3个不同的品类进行以旧换新,每个品类只选一件,记居民乙获得政府
补贴为 ,求 的分布列与期望.
【解析】(1)设事件 “更换电视机”,事件 “更换洗衣机”,
因为 ,所以 ,
因为 , ,且 ,
所以 ,
由全概率公式 ,得 ,
所以 ,
同理可得 ,所以 ,
则 ,
所以居民甲在不更换洗衣机的条件下更换电视机的概率为0.5.
(2)由题意知 的可能取值为3500,4000,4500,5000,5500,
, , ,
, .
所以 的分布列为
3500 4000 4500 5000 5500则 元.
重难点突破:高等背景下的概统问题
21.错排问题最早由伯努利与欧拉系统研究,历史上称为伯努利-欧拉的装错信封问题.现在定义错排数
为将 共 个元素排列在 共 个位置上,其中有 个元素不在其对应位置
上的情况数( 的对应位置为 , , ).容易得到, , , ,规
定 .
(1)计算 , .
(2)记 , 的前 项和为 ,证明: .
(3)定义错排概率 为随机将 共 个元素排列在 共 个位置上,其中恰有
个元素不在其对应位置上的概率,证明: .
【解析】(1) 可以排在 上,有 种排法.不妨设 排在 上,接下来讨论 .
当 排在 上时,剩下两个元素 的排法有 (种).
当 不排在 上时,可以排在 上,有 种情况.
若 排在 上,剩下两个元素 只有1种排法.
所以 .
可以排在 上,有 种情况.不妨设 排在 上,接下来讨论 ,
①当 排在 上时,剩下三个元素 分别不排在 上,则 的不同排法有
(种).
②当 不排在 上时,可以排在 上,有 种排法.
若 排在 上,接下来讨论 .
(i)当 排在 上时,剩下两个元素 的排法有 (种);
(ii)当 不排在 上时,可以排在 上,有 种排法,剩下两个元素 只有1种排法.
故 .
(2)当 时, ,满足 .
当 时,要证明 ,只需证明 ,
所以只需证明 , .
当 时, ,成立.
回到定义,当 时,对于 ,不妨从 开始排列,
设 排在 上,有 种排法.接下来讨论 ,
①当 排在 上时,剩下 共 个元素分别不在 上,共有
种排法.
②当 不排在 上时,因为 分别不在 上,
所以 共 个元素分别不在 上,
共有 种排法.
所以 .
(第(1)问中对于 的递推关系以及证明有所提示, ,
,可以从第(1)问的计算方法入手,得出递推关系)
所以 , ,
即 , .
综上, 成立.
(3)根据定义, .
先从 个元素中选出 个元素,再对它们进行排列,并使它们均不排在对应位置上,
所以 .(由于在第(2)问中已求出 的递推关系,因此可以尝试由此得到
的表达式)
所以 .
不妨记 ,
则 ,且 , , ,
得 ,则 ,(难点:将递推关系转化为容易处理的等比数列形式)
故 是等比数列,且公比为 ,
又 ,所以 ,
变形得 ,(难点:同时除以 ,使其结构上易于处理)
则当 时, , , , ,
累加得 ,
经检验 也符合上式,
所以 ,
所以 .
22.在信息论中,熵(entropy)是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵.若把
信息熵定义为概率分布的对数的相反数,设随机变量 的所有取值为 ,定
义信息熵:
(1)若 ,且 ,求随机变量 的信息熵;
(2)若 ,求随机变量 的信息熵;
(3)设 和 是两个独立的随机变量,求证: .
【解析】(1)若 ,则随机变量 的取值为1或2,又 ,故 ,
,
所以随机变量 的信息熵为1.
(2)由题意,当 时, ,
,
而 ,
,
令 ,则 ,两式相减得
,
所以 ,
则 .
(3)由题意, ,
,
而且 , ,
所以.1.(2025·广东深圳·模拟预测)某单位组织 名职工利用周末和节假日参加社会公益活动,活动内容是:
到各社区宣传慰问,倡导文明新风; 到指定的社区、车站、码头做义工,帮助哪些需要帮助的人,
各位职工根据各自的实际情况,选择了不同的活动项目,相关系数据如下表所示:
宣传慰
义工救助 总计
问
至
岁
大于 岁
总 计
(1)用分层抽样的方法在做义工救助的职工中随机抽取 名,求在年龄大于 岁的职工中,应该抽取几名?
(2)在(1)中抽取的 名职工中,任取 名,求选到的职工的年龄大于 岁的数学期望.
【解析】(1)因为参加义工救助的共有 人,其中 岁以上的共 人,抽样比为 ,
故在做义工救助的职工中随机抽取 名,在年龄大于 岁的职工中,应该抽取 名;
(2)由(1)可得 有三种可能 , ,
则,
,
则随机变量 的分布列为:则
2.(2025·上海·模拟预测)为了检查一批零件的质量是否合格,检查员计划从中依次随机抽取零件检查:
第 次检查抽取 号零件,测量其尺寸 (单位:厘米).检查员共进行了100次检查,整理并计算得到如下数
据: , , .
(1)这批零件共有1000个.若在抽查过程中,质量合格的零件共有60个,估计这批零件中质量合格的零件数
量;
(2)若变量 与 存在线性关系,记 ,求回归系数 的值;
(3)在抽出的100个零件中,检查员计划从中随机抽出20个零件进行进一步检查,记抽出的20个零件中有
对相邻序号的零件,求 的数学期望.
示例零件序号为“1、2、4、5”与“1、2、3、5”时均恰有2对相邻序号的零件.
参考公式:(1)线性回归方程: ,其中 , .
(2)期望的线性性质: ,其中 是若干随机变量.
【解析】(1)因为在这100个零件中,合格的零件为60个,
故质量合格的零件所占样本比例为 .
而在这1000个零件中,质量合格的零件数为: (个).
(2)由 可得, ,
又因为 , ,
因此可得: .代入数据可得: .
(3)用 表示抽查的结果,若第 个零件与第 个零件被选中,则记 ;
若结果是其余情况,则记 , .
由线性期望的性质可得:
(个).
3.(2025·吉林·二模)国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设. 现对
近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份 2020年 2021年 2022年 2023年
年份序号 1 2 3 4
项目支出/百亿元 90 96 100 108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系. 请求出项目支出y关于年份序号x的经验
回归方程,并预测2025年的项目支出;
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,
天元基金委员会举办了论坛活动. 经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据
如下表:
男生 女生 合计/人
甲 65 35 100
乙 45 55 100
合计/人 110 90 200
(i)根据小概率值 的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),现采用按男、女样本量比例分配的分层
随机抽样,从上述200人中抽取40人进行访谈,其中男生样本的满意度平均数为9分,方差为7.19,女生
样本的满意度平均数为7分,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全
体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.附: , , ,其中
.
0.1 0.05 0.025 0.01 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【解析】(1)(法一) ,
,
,
所以 ,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为 .
当 时, (百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(法二) ,
,
,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为 .
当 时, (百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(2)(i)零假设为申报天元基金者的所在地区与性别无关联.
根据列联表中的数据,经计算得到
.
依据小概率值 的独立性检验,我们推断 不成立,即认为申报天元基金者的所在地区与性别有
关联,此推断犯错误的概率不大于0.005.
(ⅱ)把男生样本的满意度平均数记为 ,方差记为 ;
女生样本的满意度平均数记为 ,方差记为 ;总样本的满意度平均数记为 ,方差记为 .
则 ,
根据男、女样本量按比例分配的分层随机抽样总样本平均数与各层样本平均数的关系,
可得总样本的满意度平均数为 ,
.
总样本的满意度的平均数为8.1,方差为8.
并据此估计全体参加论坛活动的天元基金者的满意度的平均数为8.1,方差为8.
4.(2025·福建漳州·模拟预测)某校开展“强国知识”挑战赛,比赛分为两轮,规则如下:
①第一轮为“时事政治”试题,共3道试题,至少正确回答2道,才能进入第二轮,否则挑战失败;第二
轮为“科普知识”试题,共3道试题,也要至少正确回答2道才能算挑战成功,否则挑战失败(进入比赛
轮次后,该轮次中所有题目均需要作答);两轮都挑战成功,可以获得“强国小能手”称号;
②每个参赛组由两人组成,作答方案有两个:第一种方案是在第一轮和第二轮中,两人依次轮流答题(例
如:甲先回答第一轮第一题,则乙回答第一轮第二题;甲再回答第一轮第三题;若进入第二轮,则由乙回
答第二轮第一题甲回答第二轮第二题,乙再回答第二轮第三题);第二种方案是由参赛两人分别回答第一
轮所有试题和第二轮所有试题(如甲回答第一轮所有试题,则乙回答第二轮的所有试题)
已知某小组由甲、乙两名同学组成,甲同学正确回答第一轮、第二轮中的每道试题的概率分别为 ;乙
同学正确回答第一轮、第二轮中的每道试题的概率分别为 .(1)若该小组采用第一种方案答题,且甲先回答第一轮中的第一题.
(i)求该小组在第一轮中就挑战失败的概率.
(ⅱ)已知该小组获得“强国小能手”称号,求甲正确回答了3道试题的概率.
(2)无论采用哪一种作答方案,第一轮第一题均由甲作答,以该小组获得“强国小能手”称号的概率大小为
决策依据,应该选择哪一种作答方案?并说明理由.
【解析】(1)记“甲在第i轮正确回答第j道题”为 ,“乙在第i轮正确回答第j道题”为 ,
采用第一种方案答题且甲先答题时该小组第一轮比赛至少正确作答2道题的概率为 ,该小组在第二轮中
至少正确作答2道题的概率为 ,
(i)依题意,
,
则采用第一种方案答题且甲先答题时,该小组在第一轮中就挑战失败的概率为 .
(ii)结合(ⅰ)得
.
记“采用第一种方案答题且甲先答题时,该小组两轮都挑战成功”为事件M,
则 ,
记“采用第一种方案答题且甲先答题时,甲正确回答了3道试题”为事件N,
.
又,
则 .
(2)选择第二种作答方案,甲在第一轮中至少正确作答2道题的概率
,
乙在第二轮中至少正确作答2道题的概率 .
采用第二种作答方案,两轮都挑战成功的概率 .
结合(1)(ii)知 ,
则 ,
所以选择第二种作答方案该小组获得“强国小能手”称号的可能性更大.
5.(2025·湖南永州·模拟预测)箱子里有四张卡片,分别写有数字1,2,3,4,每次从箱子中随机抽取一
张卡片,各卡片被抽到的概率均为 ,记录卡片上的数字,然后将卡片放回箱子.重复这个操作,直到满足
下列条件之一结束:
(a)第一次抽取的卡片上写的数字是4;
(b)设n为大于等于2的整数,第n次抽取的卡片上写的数字大于第 次抽取的卡片上写的数字.例如,
当记录的数字依次为3,2,2,4时,这个操作在第4次结束.
(1)若操作进行了4次仍未结束,求前四次抽取的情况总数;
(2)求操作在第n次结束的概率.【解析】(1)由题意可得若操作进行了4次仍未结束,则前四次抽取的卡片数字可能为:
1111,2111,3111,2211,3211,3311,2221,3221,3321,3331,2222,3222,3322,3332,3333,共
有15种情况.
(2)设操作在第 次结束的概率为 ,操作在第 次未结束的概率为 .
则当 时, , ; 当 时, .
接下来我们讨论操作进行了 次,但是并没有结束的情形,抽取的数字结构如下所示:
分别设序列中的3,2,1的个数为 , , ,可知 .
利用隔板法,可以知道对应情形的数量,操作如下:
令 , , ,即 ,
一共有 种情形,
各情形概率均为 ,所以有 ,
当 时, .
经检验,其对 依然成立,所以 .
6.(2025·广东佛山·一模)ACE球是指在网球对局中,一方发球,球落在有效区内,但接球方却没有触及
到球而使发球方直接得分的发球.甲、乙两人进行发球训练,规则如下:每次由其中一人发球,若发出
ACE球,则换人发球,若未发出ACE球,则两人等可能地获得下一次发球权.设甲,乙发出ACE球的概
率均为 ,记 “第 次发球的人是甲”.
(1)证明: ;
(2)若 , ,求 和 .
【解析】(1)若第 次为甲发球的条件下第 次还是甲发球,则第 次甲没有发出ACE球,故此时 ,
若第 次不是甲发球的条件下第 次是甲发球,
(1)乙发ACE球,则第 次是甲发球;
(2)乙没有发出ACE球,则有 的概率第 次是甲发球;
故 ,
故 .
(2)
, ,
故 ,所以 即 ,
所以 ,
故
而 ,故 为等比数列,
故 即 .
7.(2025·陕西渭南·一模)第十五届全国运动会将于2025年在广东、香港、澳门三地举办.为了普及全
运知识.某中学举办了一次全运知识闯关比赛.比赛分为初赛与复赛.初赛胜利后才能进入复赛.初赛规
定:三人组队参赛.每次只派一个人.且每人只派一次:如果一个人闯关失败.再派下一个人重新闯关:
三人中只要有人闯关成功即视作初赛胜利.无需继续闯关.现有甲、乙、丙三人组队参加初赛.他们各自
闯关成功的概率分别为 .假定 互不相等.且每人能否闯关成功相互独立.
(1)若计划依次派甲、乙、丙进行初赛闯关. .求该小组初赛胜利的概率:(2)已知 .现有两种初赛人员派出方案:
方案一:依次派出甲乙丙:
方案二:依次派出丙乙甲
设方案一和方案二派出人员数目分别为随机变量 .求 .并比较它们的大小;
(3)初赛胜利小组的三名成员都可以进入复赛.复赛规定:单人参赛.每个人回答三道题.全部答对获得一
等奖:答对两道题获得二等奖:答对一道题获得三等奖:全部答错不获奖.已知某学生进入了复赛.该学
生在复赛中前两道题答对的概率均为 .第三道题答对的概率为 .若该学生获得一等奖的概率为 ,设
该学生获得二等奖的概率为 .求 的最小值.
【解析】(1)设事件A表示该小组获胜.则 .
所以该小组初赛胜利的概率为 .
(2) 的可能取值为1, 2,3.
则 .
此时
的可能取值为1,2,3.
则 .
此时 .
所以
因为 .
所以 .所以 .(3)由题意可得 , .
则 .
令 .
则 .令 .
所以当 时, , 为减函数.
当 时. , 为增函数.
所以 .
所以 的最小值为 .
8.(2024·上海青浦·一模)第七届中国国际进口博览会于 2024 年 11 月 5 日至 10 日在上海举办,某
公司生产的 、 三款产品在博览会上亮相,每一种产品均有普通装和精品装两种款式,该公司每
天产量如下表: (单位:个)
产品
产品 产品
普通装 180 400
精品装 300 420 600
现采用分层抽样的方法在某一天生产的产品中抽取 100 个,其中 款产品有30 个.
(1)求 的值;
(2)用分层抽样的方法在 款产品中抽取一个容量为5的样本,从样本中任取 2 个产品,求其中至少有一
个精品装产品的概率;
(3)对抽取到的 款产品样本中某种指标进行统计,普通装产品的平均数为10,方差为2, 精品装产品
的平均数为12,方差为1.8,试估计这天生产的 款产品的某种指标的总体方差 (精确到 0.01 ).
【解析】(1)由题意可知,该工厂一天所生产的产品数为
现采用分层抽样的方法在这一天生产的产品中抽取100个,其中B款产品有30个,则 ,解得 .
(2)设所抽取的样本中有 个精品装产品,则 ,解得
所以容量为5的样本中,有3个精品装产品,2个普通装产品.
因此从样本中任取 2 个产品,至少有1个精品装产品的概率为
(3)由题意,某项指标总体的平均数为 ,
所以由分层抽样的总体方差公式可得
9.(2025·广东肇庆·二模)购买盲盒成为当下年轻人的潮流之一、其最吸引人的地方是因为盒子上没有标
注物品具体信息,买家只有打开才会知道自己买到了什么.某商店推出 种款式不同的盲盒,购买规则及
概率如下:每次购买一个,且买到任意一种款式的盲盒是等可能的.小刘特别喜欢 种款式中的一种.
(1)若 种款式的盲盒各有一个.
(i)求小刘第二次才抽到特别喜欢的款式的概率.
(ii)设小刘抽到特别喜欢的款式所需次数为 ,求 的数学期望 .
(2)若每种款式的盲盒数量足够多,每次盲盒被买后老板都会补充被买走的款式.商店为了满足客户的需求,
引进了保底机制:在抽取前指定一个款式,若前 次未抽出指定款式,则第 次必定抽出指定款式.设 为
小刘抽到某指定款式所需的次数,求 的数学期望 (参考数据: ,结果保留整数).
【解析】(1)(i)设小刘第 次抽到特别喜欢的款式为事件 .
则小刘第二次才抽到特别喜欢的款式的概率为 .
(也可以用 )
(ii) 的可能取值为 ,则 ,
所以 的分布列为
1 2 19 20
则 .
(2)记 的可能取值为 .
因为前9次(包含第9次)没有保底,
则 ,其中 ,
,
所以 的分布列为
1 2 9 10
则 .
记 ,
则 ,
两式相减,得 ,
所以 .
10.(2025·辽宁沈阳·一模)泊松分布是一种统计与概率学里常见的离散型分布,特别适合用于描述单位
时间(或单位空间)内随机事件发生的次数,例如:某一服务设施在一定时间内到达的人数,电话交换机
接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一个产品上的缺陷数,
显微镜下单位分区内的细菌分布数等,因此,在管理科学、运筹学以及自然科学的某些问题中都占有重要
的地位.若随机变量 服从参数为 的泊松分布(记作 ),则其概率分布为, ,其中 为自然对数的底数.
(1)当 时,泊松分布可以用正态分布来近似;当 时,泊松分布基本上就等于正态分布,此时可
认为 .若 ,求 的值(保留三位小数);
(2)某公司制造微型芯片,次品率为 ,各芯片是否为次品相互独立,以 记产品中的次品数.
①若 ,求在 个产品中至少有 个次品的概率;
②若 ,求在 个产品中至少有 个次品的概率.通过比较计算结果,你发现了什么规律?
(3)若 ,且 ,求 的最大值(保留一位小数).
参考数据:若 ,则一有 , ,
; , , .
【解析】(1)因为当 ,且 时,可近似地认为 ,即 ,
这里 , ,
所以,
.
(2)①若 ,则
;
②若 ,其中 ,
则 .
比较计算结果,可以发现利用二项分布计算的结果与利用泊松分布计算的结果是相等的,说明某些特定情
形下,可以用泊松分布来计算二项分布.(3)由于 ,所以, ,
由泊松分布的概率公式可得 , ,
所以, ,
因为 ,即 ,
构造函数 ,则 ,
所以,函数 在 上单调递减,
由于 , ,所以, ,
又因为 ,需要比较 与 的大小,
而 ,所以,相当于比较 与 的大小,
构造函数 ,
所以, 对任意的 恒成立,
所以,函数 在 上单调递减,且 ,
所以, ,所以, ,
即 ,
且 ,需要比较 与 的大小关系,而 ,
所以相当于比较 与 的大小,
构造函数 ,其中 ,且 ,
,当 时, ,所以,函数 在 上单调递增,
即 ,即 ,即 ,
因此, 的最大值为 .