文档内容
专题 26 统计、概率与分布列大题归类
目录
题型一: 非线性回归型
题型二:数据调整型
题型三:残差型
题型四:相关系数型
题型五:二项分布型
题型六:超几何分布
题型七:正态分布型
题型八:下棋与比赛型分布列
题型九:数列递推型:马尔科夫链
题型十:数列递推型:传球模式
题型十一:多线程多人比赛型
题型十二:跳棋模式分布列
题型十三:分布列导数计算求最值
题型十四:新高考分布列型第19题
题型十五:分布列综合
题型一: 非线性回归型
1.(24-25高三上·四川眉山·阶段练习)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出
的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费
(单位:百万元)和年销售量 (单位:百万辆)关系如图所示:令 ,数据经过初
步处理得:
44 4.8 10 40.3 1.612 19.5 8.06
现有① 和② 两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,
b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出 关于 的回归方程,并预测年
广告费为6(百万元)时,产品的年销售量是多少?
【答案】(1)模型②的拟合程度更好(2) ,13(百万辆)【分析】(1)分别求出两种模型的相关系数,再根据相关系数的几何意义即可得出结论;
(2)先利用最小二乘法求出 关于 的回归方程,再令 ,即可得解.
【详解】(1)设模型①和②的相关系数分别为 , ,
由题意可得: ,
,
所以 ,由相关系数的相关性质可得,模型②的拟合程度更好;
(2)因为 ,又由 , ,
得 ,所以 ,即回归方程为 .
当 时, ,因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
2.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的
方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为
一个周期)与产品销售额y(千元)的数据统计如下:
直播周期数x 1 2 3 4 5
1
产品销售额y(千元) 3 7 30 40
5
根据数据特点,甲认为样本点分布在指数型曲线 的周围,据此他对数据进行了一些初步处理.如
下表:
3.
55 382 65 978 101
7
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线 的周围,并计算得回归方程为 ,以及该回归模型的相
关指数 ,试比较甲、乙两人所建立的模型,谁的拟合效果更好?( 精确到0.01)
附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为
,相关指数: .
【答案】(1) ;(2)乙建立的回归模型拟合效果更好.
【分析】(1)对 两边取对数得 ,令 ,利用最小二乘法可求得
,由此可得回归方程;
(2)根据公式计算可得相关指数 ,由此可得结论;
【详解】(1)将 两边取对数得: ,令 ,则 ,因为 ,所以根据最小二乘估计可知: ,
所以 ,所以回归方程为 ,即 .
(2)甲建立的回归模型的 .
所以乙建立的回归模型拟合效果更好.
3.(24-25高三上·福建泉州·阶段练习)一只药用昆虫的产卵数 与一定范围内的温度 有关,现收集了
该种药用昆虫的6组观测数据如下表:
2 2
温度 21 24 29 32
3 7
产卵数 1 2
6 20 57 77
个 1 7
经计算得: 线性
回归模型的残差平方和 ,其中 分别为观测数据中的温差和产卵数,
.
(1)若用线性回归方程,求 关于 的回归方程 (精确到0.1);
(2)若用非线性回归模型求得 关于 回归方程为 ,且相关指数 0.9522.
(i)试与(1)中的回归模型相比,用 说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为 时该种药用昆虫的产卵数(结果取整数).
附:一组数据 ,其回归直线 的斜率和截距的最小二乘估计为
;相关指数 .
【答案】(1) (2)(i)非线性回归模型拟合效果更好;(ii) ;
【分析】(1)求出 、 后代入公式直接计算得 、 ,即可得解;
(2)(i)求出线性回归模型的相关指数,与 比较即可得解;
(ii)直接把 代入 ,计算即可得解.
【详解】(1)由题意 ,则 , , ,
,y关于x的线性回归方程为 .
(2)(i)对于线性回归模型, , ,
相关指数为 ,因为 ,所以用非线性回归模
型拟合效果更好.
(ii)当 ,时 (个)
所以温度为 时,该种药用昆虫的产卵数估计为190个.
4.(2023·四川·模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量
(L):
日期代码x 1 2 3 4 5 6 7 8
1
生成的气体y(L) 4 8 31 51 71 97 122
6
为了分析该气体生成量变化趋势、工厂分别用两种模型:① ,② 对变量x和y的关
系进行拟合,得到相应的回归方程并进行残差分析,残差图如下:
注:残差 :经计算得 , , ,
,其中 ,
(1)根据残差图、比较模型①,模型②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量
是多少?(精确到个位)
附:回归直线的斜率和截距的最小二乘估计公式分别为: , .
【答案】(1)选择模型①,理由见解析;(2) ;(3)157L.
【分析】(1)根据残差意义分析即可;
(2)求出 ,结合已知数据代入公式计算即可;
(3)将 代入回归方程即可得到预测值.
【详解】(1)选择模型①,理由如下:
根据残差图可以看出:模型①的残差点分布在x轴附近,模型②的残差点距离x轴较远,
所以,模型②的残差明显比模型①大,所以模型①的拟合效果相对较好;
(2)由(1)可知y关于x的回归方程为 ,令 ,则 ,
由所给的数据可得 ,
,
,则 ,
所以y关于x的回归方程为 .
(3)将 代入回归方程,可得 ,所以预测该气体第9天的生成量
约为157L.
题型二:数据调整型1.(24-25高二上·陕西·开学考试)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的
身
高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标价(单位:cm),
计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序 1 2 3 4 5 6 7 8 9 10
15 15 15
身高 158 156 160 161 162 169 163
5 7 9
记抽取的第i个女生的身高为 ( ,2,3,…,10),样本平均数 ,方差 .
参考数据: , , .
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生
身高在 范围内的人数;
(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数 和标准差 ,求 , 的值;
(3)如果女生样本数据在 之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高
的平均数与方差.
【答案】(1)40;(2) ;(3)平均数为159,方差为 .
【分析】(1)根据样本数据在 范围内的占比易求得女生总体在此范围内的人数;
(2)先利用加权平均数公式求出总样本的平均数 ,再利用混合样本的方差公式计算 ,最后对 ,
进行估计即可;
(3)先判断169为离群值,再由平均数公式计算剩余9人的身高平均数,利用方差公式求出
,再由公式 计算出方差.
【详解】(1)因女生样本中,身高在 范围内的占比为 ,
故该校高一女生身高在 范围内的人数估计为 ;
(2)记总样本的平均数为 ,标准差为 ,
由题意,设男生样本(20人)的身高平均数为 ,方差为 ,
女生样本(10人)的身高平均数为 ,方差 ,则 ,
,故 ;
(3)因 , ,则 ,即 ,
约为 ,由样本数据知, ,为离群值,
剔除169后,女生样本(9人)的身高平均数为: ;
由 可得, ,
则剔除169后,女生样本(9人)的身高的方差为:
.
2.(23-24高一下·福建南平·期末)某校高一年级有男生200人,女生100人.为了解该校全体高一学生
的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:
cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 15 158 156 15 160 161 15 162 169 1635 7 9
记抽取的第i个女生的身高为 ,样本平均数 ,方差
.
参考数据: , , .
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生
身高在 范围内的人数;
(2)如果女生样本数据在 之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高
的平均数与方差;
(3)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数 和标准差 ,求 , 的值.
【答案】(1) ;(2)剩余女生样本身高的平均数与方差分别为 , ;(3) , .
【分析】(1)先求得抽取的女生身高在[160,165]之内的频率,进而可求解;
(2)求得 ,从而可知 为离群值,进而可求得平均数和方差;
(3)先推导 ,代入数据即可求解.
【详解】(1)因为抽取的女生身高在[160,165]之内的频率为 ,
所以估计该校女生身高在[160,165]之内的人数为 ;
(2)因为 ,所以 ,
故 ,则 为离群值.则剔除离群值剩下数据的平均数为: ,
故剩余女生样本身高的平均数为159,又 ,
则剔除169,剩余女生样本身高的方差为: ;
(3)采用分层抽样的方法抽取一个容量为30的样本,则男生20个,女生10个,
男生身高样本记为 ,均值 ,方差 ,女生身高样本为 ,均值
,方差 则总样本均值 ,
又因为 ,所以 ,同理可得
,故总样本方差
,
所以,估计学生总体身高的平均数 ,标准差 .
3.(22-23高二·全国·课后作业)为了监控某种零件的一条生产线的生产过程,检验员每隔 从该生
产线上随机抽取一个零件,并测量其尺寸(单位: )做好记录.下表是检验员在一天内依次抽取的
个零件的尺寸:
抽取次序
零件尺寸( )抽取次序 9 10 11 12 13 14 15 16
零件尺寸( )
经计算得 , , ,
,其中 为抽取的第 个零件的尺寸( ).
(1)求 的相关系数 ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行
而系统地变大或变小(若 ,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的零件中,如果出现了尺寸在 之外的零件,就认为这条生产线在这一天的生
产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在 之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值
与标准差.(精确到 )
【答案】(1) ;可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小
(2)①需对当天的生产过程进行检查;②均值的估计值为 ,标准差的估计值为 .
【分析】(1)将样本数据代入相关系数公式可求得 ,根据 可得结论;
(2)①计算出 对应数据,对比样本数据即可得到结论;
②剔除出数据后,重新计算出平均数和方差,由方差和标准差关系可得标准差.
【详解】(1)由样本数据得相关系数: .
, 可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)① , , , ,
抽取的第13个零件的尺寸在 以外, 需对当天的生产过程进行检查.
②剔除离群值,即第 个数据,剩下数据的平均数为 ,
即这条生产线当天生产的零件尺寸的均值的估计值为 ;
由 得: ,剔除第 个数据,剩下数据的样本方差为
, 样本标准差为 ,
即这条生产线当天生产的零件尺寸的标准差的估计值为 .
4.(20-21高二上·山东德州·期末)某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,
得到数据如下表:
企业
满意度 (%) 21 33 24 20 25 21 24 23 25 12
投资额 (万
79 86 89 78 76 72 65 62 59 44
元)
(1)求投资额 关于满意度 的相关系数(精确到 );
(2)约定:投资额 关于满意度 的相关系数 的绝对值在 以上(含 )是线性相关性较强,否
则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那
一所企业,求关闭此企业后投资额 关于满意度 的线性回归方程(精确到 ).参考数据: , , , , ,
, .
附:对于一组数据 , ,…, ,其回归直线 的斜率和截距的最小二乘估计
公
式分别为: , .线性相关系数 .
【答案】(1) ;(2) .
【分析】(1)代入公式即可得出结果.
(2)由(1)可知,因为 ,所以投资额 关于满意度 没有达到较强线性相关,所以要关闭 企
业.重新计算,代入公式即可求出结果.
【详解】(1)由题意,根据相关系数的公式,可得
(2)由(1)可知,因为 ,所以投资额 关于满意度 没有达到较强线性相关,所以要关闭 企
业.
重新计算得 , ,
,
.所以 ,
.所以所求线性回归方程为 .
题型三:残差型
1.(23-24高三上·湖南衡阳·阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高
科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,
其中年份代码1 10分别对应年份2013 2022.
∼ ∼
根据散点图,分别用模型① ,② 作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些
统计量的值:
75 2.25 82.5 4.5 120 28.35
表中 , .
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的
经验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润 (单位:亿元)和年研发投入y(单位:亿元)满足 (
且 ),问该科技公司哪一年的年利润最大?
附:对于一组数据 , ,…, ,其经验回归直线 的斜率和截距的最小二乘估
计分别为 , .
【答案】(1)选择模型②更适宜,理由见解析(2)(i) ;(ii)该公司2028年的年利润最
大
【分析】(1)根据残差图确定;
(2)根据最小二乘法求非线性回归方程即可求解;
【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;
模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)(i)设 ,所以 ,
所以 , ,
所以 关于 的经验回归方程为
(ii)由题设可得 ,
当取对称轴即 ,即 时,年利润L有最大值,
故该公司2028年的年利润最大.
2.(22-23高三下·广西防城港·阶段练习)某互联网公司为了确定下季度的前期广告投人计划,收集了近
6个月广告投入量 (单位:万元)和收益 (单位:万元)的数据如表:
月份 1 2 3 4 5 6
广告投入
2 4 6 8 10 12
量
37.8
收益 14.21 20.31 31.8 31.18 44.67
3
他们用两种模型① ,② 分别进行拟合,得到相应的回归方程并进行残差分析,得到如
图所示的残差图及一些统计量的值.3
7 1464.24 364
0
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量 时,(1)中所选模型收益的预报值是多少?
附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别
为:
【答案】(1)选择模型①,理由见解析(2)(i) ;(ii)62.04万元
【分析】(1)根据残差图的分布比较可得结论;
(2)(i)求出剔除异常数据后的平均数,即可求得 和 ,即得回归方程;(ii)将 代入回归直线
方程,即可得答案.
【详解】(1)选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,
且模型①的带状区域比模型②的带状区域窄,
所以模型①的拟合精度高,回归方程的预报精度高.
(2)(i)剔除异常数据,即组号为3的数据,剩下数据的平均数为
;
,
. .
所选模型的回归方程为 ;
(ⅱ)若广告投入量 时,该模型收益的预报值是 万元.
∴
3.(20-21高二下·湖北孝感·期末)“金山银山不如绿水青山;绿水青山就是金山银山”.复兴村借力“乡村
振兴”国策,依托得天独厚的自然资源开展乡村旅游.乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年
的游客人数,见下表.
年份 2013年 2014年 2015年 2016年 2017年 2018年 2019年 2020年
年份代码 1 2 3 4 5 6 7 8
游客人数 (百人) 4 8 16 32 51 71 97 122
为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量 和 进行拟合,得到了相应
的回归方程,绘制了残差图.残差图如下(注:残差 ):模型① ;模型② .
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)根据(2)问求出的回归方程来预测2021年的游客人数.
参考数据见下表:其中: ,
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,
【答案】(1)模型①,理由见解析;(2) ;(3)157百万人.
【分析】(1)由残差的相对大小进行选择即可;
(2)由(1)可得 关于 的回归方程为 ,令 ,则 ,然后根据表中的数据利用
最小二乘法求回归方程即可;
(3)把 代入回归方程中计算即可
【详解】解:(1)选择模型①
理由如下:根据残差图可以看出,
模型①的估计值和真实值相对比较接近
模型②的残差相对比较大,所以模型①的拟合效果相对较好;
(2)由(1)可知 关于 的回归方程为 令 ,则 , ,
又
所以 关于 的回归方程为 ;(3)将 代入回归方程,可得
则2021年游客人数大约为157百万人.
4.(2023全国·模拟)(本小题满分12分)
为了研究黏虫孵化的平均温度 (单位: )与孵化天数 之间的关系,某课外兴趣小组通过试验得到
如下6组数据:
组号 1 2 3 4 5 6
平均温度 15.3 16.8 17.4 18 19.5 21
孵化天数 16.7 14.8 13.9 13.5 8.4 6.2
他们分别用两种模型① ,② 分别进行拟合,得到相应的回归方程并进行残差分析,得
到如图所示的残差图:经计算得 ,
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(2)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立 关于 的线
性回归方程.(精确到0.1)
,.
【答案】(1)应该选择模型①;(2)
【详解】试题分析:(1)第(1)问,由于模型①的残差带比较窄,在x轴附近,所以说明拟合效果好,故
选模型①.
(2)第(2)问,先计算出最小二乘法公式的各个基本量,再代入公式计算,得到y关于x的线性回归方
程.
试题解析:
(1)应该选择模型①.
(2)剔除异常数据,即组号为4的数据,剩下数据的平均数 = (18×6-18)=18;
(12.25×6-13.5)=12. =1283.01-18×13.5=1040.01; =1964.34-182 =
1640.34.
, 12+1.97×18≈47.5,
所以y关于x的线性回归方程为: =-2.0x+47.5.
题型四:相关系数型
1.(2023·重庆沙坪坝·模拟预测)党的二十大报告提出:“必须坚持科技是第一生产力、人才是第一资源、
创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势.”某数字化公司为加快推进企业数字化进程,决定对其核心系统DAP,采取逐年
增加研发人员的办法以提升企业整体研发和创新能力.现对2018~2022年的研发人数作了相关统计(年份
代码1~5分别对应2018~2022年)如下折线图:
(1)根据折线统计图中数据,计算该公司研发人数 与年份代码 的相关系数 ,并由此判断其相关性的强
弱;
(2)试求出 关于 的线性回归方程,并预测2023年该公司的研发人数(结果取整数).
参考数据: 当 认为两个变量间的相关性较强
参考公式 相关系数 ,
回归方程 中的斜率和截距的最小二乘法估计公式分别为 , .
【答案】(1)相关系数为0.988,相关变量 有较强的相关性(2) ,540人
【分析】(1)将数据代入公式计算即可求解;
(2)结合(1)和题中的数据,代入公式计算即可求解.
【详解】(1)由题知
因为 ,所以认为相关变量 有较强的相关性.
(2)由(1)得
回归方程为 当 时 ,即2023年该公司投入研发人数约540人.
2.(22-23高三上·河南·期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具
以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化
需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场
并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数
作了相关统计,如下图:
2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)(1)根据条形统计图中数据,计算该公司研发人数 与年份代码 的相关系数 ,并由此判断其相关性的强
弱;
(2)试求出 关于 的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)
参考数据: , .参考公式:相关系数 .线性回
归方程的斜率 ,截距 .附:
相关
弱 一般 强
性
【答案】(1) , 与 具有很强的线性相关关系
(2) ,预测2023年该公司的研发人数约为613人
【分析】(1)首先求 ,根据参考公式求值,代入相关系数公式,即可求解;
(2)根据参考公式求 和 ,即可求得回归直线方程,并代入 求预报值.
【详解】(1)由条形统计图,得 , ,
所以
,
.
所以 .
因为相关系数 ,所以 与 具有很强的线性相关关系,且为正相关.
(2) ,所以 ,
所以 .由题意知,2023年对应的年份代码 ,
当 时, ,故预测2023年该公司的研发人数约为613人.3.(2021·云南·模拟预测)西尼罗河病毒(WNV)是一种脑炎病毒,WNV通常是由鸟类携带,经蚊子传
播给人类.1999年8-10月,美国纽约首次爆发了WNV脑炎流行.在治疗上目前尚未有什么特效药可用,
感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV的复制,
抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集
了5组实验数据,得到利巴韦林的投入量x(千克)和利巴韦林含片产量y(百盒)的统计数据如下:
投入量x(千克) 1 2 3 4 5
1
产量y(百盒) 20 23 25 26
6
由相关系数 可以反映两个变量相关性的强弱, ,认为变量相关性很强; ,认
为变量相关性一般; ,认为变量相关性较弱.
(1)计算相关系数r,并判断变量x、y相关性强弱;
(2)根据上表中的数据,建立y关于x的线性回归方程 ;为了使某组利巴韦林含片产量达到
150百盒,估计该组应投入多少利巴韦林?
参考数据: .
参考公式:相关系数 ,线性回归方程 中,
.
【答案】(1) ,x与y具有很强的相关性;(2)54.2千克.
【解析】(1)根据题中数据分别计算出 、 、 、 、 代入题中
公式可得 的值,可得答案;
(2)由题中数据计算出 ,可得y关于x的线性回归方程,可得当 (百盒)时,x的值,可得答
案.
【详解】解:(1) , ,
,
,
,则
所以x与y具有很强的相关性.
(2)由(1)得, , ,
所以y关于x的线性回归方程为 .当 (百盒)时, (千克)故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林.
4.(2022高二·全国·专题练习)某数学小组从气象局和医院分别获得了 年 月至 年 月每月
日的昼夜温差 (单位: , )和患感冒人数 的数据,并根据所得数据画出如图所示的折线图.
℃
(1)求 与 之间的相关系数 ,并判断 与 的相关性的强弱( 时,认为 与 高度相关,即认
为 与 的相关性很强);
(2)建立 关于 的回归直线方程(回归系数的结果精确到 ),并预测昼夜温差为 时患感冒的人
数.
参考数据: , , , .
参考公式:相关系数 .在回归直线方程 , ,
.
【答案】(1) ; 与 的相关性很强(2) ;昼夜温差为 时患感冒的人数约为
【分析】(1)利用图中给的数据,计算出 和 ,代入相关系数 的公式中计算,可得答案;
(2)利用公式求出回归直线方程,将 代入计算即可.
【详解】(1)由已知得 ,
,
. , 与 高度相关,即 与 的相关性很强.
∴ ∵ ∴
(2)由已知得 , ,
,
关于 的回归直线方程为 .当 时, .
昼夜温差为 时患感冒的人数约为 .
∴
题型五:二项分布型
∴1.(24-25高三上·云南昆明·期中)一项没有平局的对抗赛分为两个阶段,参赛者在第一阶段中共参加2
场比赛,若至少有一场获胜,则进入第二阶段比赛,否则被淘汰,比赛结束;进入第二阶段比赛的参赛者
共参加3场比赛.在两个阶段的每场比赛中,获胜方记1分,负方记0分,参赛者参赛总分是两个阶段得
分的总和,若甲在第一阶段比赛中每场获胜的概率都为 ,在第二阶段比赛中每场获胜的概率
都为 ,每场比赛是否获胜相互独立.已知甲参赛总分为2分的概率为 .(1)求 ;
(2)求甲参赛总分X的分布列和数学期望.
【答案】(1) (2)分布列见解析,数学期望为 .
【分析】(1)利用独立事件概率的乘法公式来求解,要根据甲参赛总分为 分的情况进行分析,求 的
值,
(2)需要考虑 所有可能的取值,再分别计算每个取值的概率,最后根据分布列求数学期望.
【详解】(1)甲参赛总分为 分有两种情况:
第一种情况是在第一阶段两场比赛一胜一负(概率为 ),然后在第二阶段三场比赛一胜两负
(概率为 ).第二种情况是在第一阶段两场比赛全胜(概率为 ),然后在第二阶段三场
比赛全负(概率为 ).根据甲参赛总分为 分的概率为 ,可列出方程:
先计算组合数 , .
方程变为 .化简得 .即 .
因式分解得 .解得 或 ,因为 ,所以 .
(2)甲参赛总分 的可能取值为 , , , , , . 包括:在第一阶段两场全输,概率为
. 包括:在第一阶段一胜一负(概率为 ),
然后在第二阶段三场全输(概率为 ),所以 . :前面已求出为 .
包括:在第一阶段两场全胜(概率为 ),然后在第二阶段一胜两负(概率为
),此时 .也包括在第一阶段一胜一负(概率为
),
然后在第二阶段两胜一负(概率为 ).此时 .则 .
包括:在第一阶段两场全胜(概率为 ),在第二阶段两胜一负(概率为
),此时 .也包括在第一阶段一胜一负(概率为 ),然后在第二阶段三场全胜(概率为 ),此时 .则 .
包括:在第一阶段两场全胜(概率为 ),然后在第二阶段三场全胜(概率为 ),所
以 .所以 的分布列为:
1 2 3 4 5
根据数学期望公式,
2.(中学生标准学术能力诊断性测试2024-2025学年高三上学期10月测试数学试卷)乒乓球比赛有两种
赛制,其中就有“5局3胜制”和“7局4胜制”,“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜
制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,若采用5局3胜制,比赛结束算一场比赛,甲获胜的概率为0.8;若采用
7局4胜制,比赛结束算一场比赛,甲获胜的概率为0.9.已知甲、乙两人共进行了 场比赛,请
根据小概率值 的 独立性检验,来推断赛制是否对甲获胜的场数有影响.
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为p,没有平局.记事件“甲只要取得3局比
赛的胜利比赛结束且甲获胜”为A,事件“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”为B,试证
明: .
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是 ,没有平局.若采用“赛满 局,胜
方至少取得n局胜利”的赛制,甲获胜的概率记为 .若采用“赛满 局,胜方至少取得 局胜
利”的赛制,甲获胜的概率记为 ,试比较 与 的大小.
附: ,其中 .
0.05 0.025 0.010
3.841 5.024 6.635
【答案】(1)答案见解析;(2)证明见解析;(3) .
【分析】(1)根据题设写出列联表,应用卡方公式得 ,讨论参数结合独立检验基本思想即得答
案;
(2)根据题设,应用独立乘法公式及互斥事件加法得到 ,并化简,即可证;
(3)考虑赛满 局的情况,以赛完 局为第一阶段,第二阶段为最后2局,设“赛满 局甲获
胜”为事件 ,第一阶段甲获胜,记为 ;第一阶段乙获胜,且甲恰好胜了 局,记为 ,根据题意分
析得到 ,进而分情况写出关于参数p的概率公式,即可比较大小.
【详解】(1)由题设,赛制与甲获胜情况列联表如下,
甲获胜场数 乙获胜场数
5局3胜
7局4胜
所以 ,若 ,当 时,根据小概率值 的 独立性检验,推断赛制对甲获胜的场数有影响.
当 时,根据小概率值 的 独立性检验,没有证据认为推断赛制对甲获胜的场数有影
响.
(2)由题意,
,
,
综上, ,得证.
(3)考虑赛满 局的情况,以赛完 局为第一阶段,第二阶段为最后2局,
设“赛满 局甲获胜”为事件 ,结合第一阶段结果,要使事件 发生,有两种情况:
第一阶段甲获胜,记为 ;第一阶段乙获胜,且甲恰好胜了 局,记为 ,
则 ,得 ,
若第一阶段甲获胜,即赛满 局甲至少胜 局,有甲至少胜 局和甲恰好胜 局两种情况,
甲至少胜 局时,无论第二阶段的2局结果如何,最终甲获胜;
甲恰好胜 局时,有可能甲不能获胜,此时第二阶段的2局比赛甲均失败,概率为
,
所以 ,
若第一阶段乙获胜,且甲恰好胜了 局,那么要使甲最终获胜,第二阶段的2局甲全胜,得
,所以
,则
,
由 ,所以 ,得 .
3.(2024·广东广州·模拟预测)在某地区进行高中学生每周户外运动调查,随机调查了 名高中学生
户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
(1)求 的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)
(2)为进一步了解这 名高中学生户外运动的时间分配,在 , 两组内的学生中,采用分层
抽样的方法抽取了 人,现从这 人中随机抽取 人进行访谈,记在 内的人数为 ,求 的分布
列和期望;
(3)以频率估计概率,从该地区的高中学生中随机抽取 名学生,用“ ”表示这 名学生中恰有 名学生
户外运动时间在 内的概率,当 最大时,求 的值.
【答案】(1) ,平均时间为 小时(2)分布列见解析,期望 (3)
【分析】(1)根据频率和为 ,可得 ,再根据平均数公式直接计算平均数即可;
(2)分别计算时间在 , 的频数,结合分层抽样可得两组分别抽取人,根据超几何分布的
概率公式分别计算概率,可得分布列与期望;
(3)根据频率分布直方图可知运动时间在 内的频率,根据二项分布的概率公式可得 ,根据最
值可列不等式,解不等式即可.【详解】(1)由已知 ,解得 ,
所以平均数为 .
(2)这 名高中学生户外运动的时间分配,
在 , 两组内的学生分别有 人,和 人;
所以根据分层抽样可知 人中在 的人数为 人,在 内的人数为 人,
所以随机变量 的可能取值有 , ,所以 , ,
则分布列为
期望 ;
(3)由频率分布直方图可知运动时间在 内的频率为 ,
则 ,若 为最大值,则 ,
即 ,即 ,解得 ,
又 ,且 ,则 .
4.(24-25高二上·黑龙江哈尔滨·阶段练习)如图,在研究某种粒子的实验装置中,粒子从 腔室出发,
到达 腔室,粒子从 室经过 号门进入 室后,等可能的变为上旋或下旋状态,粒子从 室经过 号门
进入 室后,粒子的旋转状态发生改变的概率为 .粒子间的旋转状态相互独立.现有两个粒子从 室出发.
(1)求两粒子进入 室都为上旋状态的概率;
(2)若实验装置出现故障,两个粒子进入 室后,共裂变为 个粒子,裂变后的每个粒子再经过 号门返
回 室的概率为 ,各粒子返回 室相互独立.
① 时,写出返回 室的粒子个数 的分布列、期望、方差;
② 时,记有 个粒子返回 室的概率为 ,则 为何值时, 取最大值.
【答案】(1) (2)①分布列见详解,期望 ,方差 ;②
【分析】(1)根据全概率公式以及条件概率计算公式求得正确答案;
(2)①根据独立事件概率计算求得的分布列,并求得数学期望和方差;
②根据二项式定理即可求得最大项.
【详解】(1)设 “两个粒子通过 号门后处于上旋状态粒子个数为 个”, ,
“两个粒子通过 号门后进入 室都为上旋状态”,
则 , ,则 .
(2)①返回 室的粒子个数 的可能性为 , , , , 服从二项分布 :
, , ,
, ,
所以期望 ,方差 ;
② 的可能取值为 ,此时 , 个粒子返回 室的概率为
,
则
,所以
,
当 时, 取最大值.
题型六:超几何分布
1.(24-25高二下·全国·课后作业)第十四届全国人民代表大会第一次会议于2023年3月5日上午召开.
某社区为了调查社区居民对该会议的关注度,随机抽取了60名社区居民进行调查,并将结果绘制成如图
所示的频率分布直方图.(1)以频率估计概率,若社区计划从60名社区居民中,再次随机抽取三人进行回访,求至少有两人的年龄
在区间 内的概率;
(2)若 和 年龄段的所有居民对该会议的关注度都很高,社区准备从中抽取3人谈谈对该会议
的感受,设 表示年龄段在 的人数,求 .
【答案】(1) (2)
【分析】(1)根据频率分布直方图应用面积和得出概率即可;
(2)应用超几何分布先写出概率,再列出分布列,最后求出数学期望结合性质求出方差即可.
【详解】(1)根据频率分布直方图可知,在区间 的频率为 ,
所以随机抽取三人,至少有两人的年龄在区间 内的概率为 .
(2)因为社区居民年龄在 内的人数为 ,在 内的人数为6.
所以 的可能取值为 .
则 ,
,
所以 的分布列为:
0 1 2 3
所以 ,
所以 ,所以 .
2.(22-23高三下·山东济宁·开学考试)某市为进行学科能力竞赛表彰,其中数学组、物理组获奖情况如
下表,组委会为使活动有序进行,活跃会场气氛,活动中穿插抽奖活动.并用分层抽样的方法从两个学科
组抽取15人在前排就座,其中物理组有5人.
数学组 物理组
男生 30 20
女生 30
(1)求数学组中女生的人数;
(2)若从前排就座的物理组5人中任选2人上台领奖,设女生的人数为 ,求女生人数 的分布列和数学
期望.
【答案】(1)70(2)分布列见详解;
【分析】(1)根据题意结合分层抽样求数学组人数,进而可得结果;
(2)分析可知物理组5人中男生有2人,女生有3人, 的可能取值有:0,1,2,结合超几何分别求分
布列和期望.【详解】(1)由题意可知:物理组共有50人,每人被抽到的可能性为 ,
则数学组共有 人,其中女生的人数为 .
(2)因为前排就座的物理组5人中男生有 人,女生有 人,
可知抽到女生的人数为 的可能取值有:0,1,2,则有:
,
可得女生人数 的分布列为
0 1 2
所以女生人数 的期望 .
3.(24-25高二下·全国·课后作业)某校为了了解学情,对各学科的学习兴趣作了问卷调查,经过数据整
理得到下表:
语文兴 物理兴
数学兴趣 英语兴趣 化学兴趣 生物兴趣
趣 趣
答卷份数 350 470 380 400 300 500
兴趣良好频率 0.7 0.95 0.8 0.75 0.85 0.86
假设每份调查问卷只调查一科,各类调查是否达到良好的标准相互独立.
(1)从收集的答卷中随机选取一份,求这份试卷的调查结果是英语兴趣良好的概率;
(2)从该校任选一位同学,试估计他在语文兴趣良好、数学兴趣良好、生物兴趣良好方面,至少具有两科
兴趣良好的概率;
(3)按分层抽样的方法从参与物理兴趣和化学兴趣调查的同学中抽取7人,再从这7人中抽取3人,记3人
中来自化学兴趣的人数为 ,求 的分布列和期望.
【答案】(1) (2) (3)分布列见解析,
【分析】(1)计算出所有答卷的总数,再求得英语兴趣良好的答卷份数即可得出结果;
(2)根据互斥事件概率的加法公式计算可得结果;
(3)由分层抽样比得出每层抽取的人数,再利用超几何分布公式计算得出分布列和期望值.
【详解】(1)设“这份试卷的调查结果是英语兴趣良好”为事件 ,
答卷总份数为 ,其中英语兴趣良好有 ,
故 .
(2)设“语文兴趣良好”“数学兴趣良好”“生物兴趣良好”分别为事件 ,
,则所求的概率为:
.
(3)从参与物理兴趣和化学兴趣调查的700人中按分层抽样的方法抽取7人,
其中参与物理兴趣调查的抽取4人,参与化学兴趣调查的抽取3人,
再从中选取3人,则 的所有取值为 . ,
,则 的分布列为
0 1 2 3故 .
4.(24-25高三上·四川成都·阶段练习)2024年7月26日,第33届夏季奥林匹克运动会在法国巴黎正式
开幕.人们在观看奥运比赛的同时,开始投入健身的行列.某兴趣小组为了解成都市不同年龄段的市民每周
锻炼时长情况,随机从抽取200人进行调查,得到如下列联表:
周平均锻炼时长
年
合计
龄
周平均锻炼时间少于4小时 周平均锻炼时间不少于4小时
4
50岁以下 60 100
0
2
50岁以上(含50) 75 100
5
6
合计 135 200
5
(1)试根据 的 独立性检验,分析周平均锻炼时长是否与年龄有关? 精确到0.001 ;
(2)现从50岁以下的样本中按周平均锻炼时间是否少于4小时,用分层随机抽样法抽取5人做进一步访
谈,再从这5人中随机抽取3人填写调查问卷.记抽取3人中周平均锻炼时间不少于4小时的人数为 ,
求 的分布列和数学期望.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
参考公式及数据: ,其中 .
【答案】(1)有关联(2)分布列见解析,
【分析】(1)根据二联表中数据,求解卡方,即可与临界值比较作答,
(2)根据抽样比可得抽取的5人中,周平均锻炼时长少于4小时的有2人,不少于4小时的有3人,即可
利用超几何分布的概率公式求解.
【详解】(1)零假设 :周平均锻炼时长与年龄无关联.
由 列联表中的数据,可得 ,
.
根据小概率值 的独立性检验,我们推断 不成立,
即认为周平均锻炼时长与年龄有关联,此推断犯错误的概率不大于 .
所以50岁以下和50岁以上(含50)周平均锻炼时长有差异.
(2)抽取的5人中,周平均锻炼时长少于4小时的有 人,不少于4小时的有 人,
所以 所有可能的取值为 ,
所以 , , ,
所以随机变量 的分布列为:
1 2 3随机变量 的数学期望
题型七:正态分布型
1.(2024·山西长治·模拟预测)某汽车公司最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了
单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测
试.现对测试数据进行整理,得到如下的频率分布直方图:
(1)估计这100辆汽车的单次最大续航里程的平均值 (同一组中的数据用该组区间的中点值代表);
(2)由频率分布直方图计算得样本标准差s的近似值为49.75.根据大量的汽车测试数据,可以认为这款汽车
的单次最大续航里程X近似地服从正态分布 ,其中μ近似为样本平均数 ,σ近似为样本标准差
S.
(ⅰ)利用该正态分布,求 ;
(ⅱ)假设某企业从该汽车公司购买了20辆该款新能源汽车,记Z表示这20辆新能源汽车中单次最大续
航里程位于区间(250.25,399.5)的车辆数,求E(Z);
参考数据:若随机变量ξ服从正态分布 ,则 ,
.
(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在x轴上从原点O出发向右运动,已知硬币出现正、反面的概率都 ,客户
每掷一次硬币,遥控车向右移动一次,若掷出正面,则遥控车向移动一个单位,若掷出反面,则遥控车向
右移动两个单位,直到遥控车移到点(59,0)(胜利大本营)或点(60,0)(失败大本营)时,游戏结
束,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.设遥控车移到点 的概率为
,试证明数列 是等比数列 ,求出数列 的通项公式,并比较 和
的大小.
【答案】(1)300(2)(ⅰ) ;(ⅱ) (3)证明见解析, ,
【分析】(1)根据平均数的求法求得正确答案.
(2)(ⅰ)根据正态分布的对称性求得正确答案.
(ⅱ)根据二项分布的知识求得正确答案.
(3)根据已知条件构造等比数列,然后利用累加法求得 ,利用差比较法比较 和 的大小.
【详解】(1) .
(2)(ⅰ) .
(ⅱ)) Z服从二项分布 , .
∵ ∴
(3)当 时, , .
是以 为首项, 为公比的等比数列, .
∴
.累加得:
.
, .
∴ ∵ ∴
注:比较 和 的另一个过程: .
2.(24-25高三上·广西贵港·开学考试)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学
的100名学生,整理得到如下列联表:
女学
男学生 合计
生
喜欢跳绳 35 35 70
不喜欢跳绳 10 20 30
合计 45 55 100
(1)依据 的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联?
(2)已知该校学生每分钟的跳绳个数 ,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个
数在 内的人数(结果精确到整数).
附: ,其中 .
0.1 0.05 0.01
2.706 3.841 6.635
若 ,则 ,
.
【答案】(1)不能(2) 人
【分析】(1)首先假设 ,再计算 ,并和参考数据比较,即可作出判断;
(2)转化为训练前 的人数估计.由题意得 的值,则 即 ,利用正态曲
线的对称性与区间的概率参考数据
【详解】(1) :学生的性别和是否喜欢运动无关. ,
所以根据 的独立性检验,不能认为学生的性别与是否喜欢跳绳有关.
(2)训练前该校学生每人每分钟的跳绳个数 ,
则 , , ,
即训练前学生每分钟的跳绳个数在 , , ,
,由 (人)
估计训练前该校每分钟的跳绳个数在 内的人数为 .
即预估经过训练后该校每分钟的跳绳个数在 内的人数为 .
3.(2024·辽宁·模拟预测)某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行
测试,对其生产的第一批零件的内径进行测量,统计绘制了如下图所示的频率分布直方图.
(1)求a的值以及这批零件内径的平均值 和方差 (同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间 内的零件个数为 ,求 的
分布列以及数学期望;
(3)已知这批零件的内径 (单位:mm)服从正态分布 ,现以频率分布直方图中的平均数 作
为 的估计值,频率分布直方图中的标准差 作为 的估计值,则在这批零件中随机抽取200个,记内径
在区间 上的零件个数为 ,求 的方差.
参考数据: ,若 ,则 ,
, .
【答案】(1) , , (2) 的分布列见解析, (3)
【分析】(1)根据频率分布直方图中所有小矩形的面积之和为1,及频率分布直方图中均值和方差的计算公式,求出相应的值即可;
(2)确定 的可能取值,求出不同 的值对应的概率,得到 的分布列,再根据离散型随机变量数学期
望的计算公式求出 的数学期望即可;
(3)由根据正态分布的概率求法,求出 的概率,再根据二项分布的定义判定
,
最后根据二项分布方差的计算公式求出 的方差.
【详解】(1)由 ,则 ,
这批零件内径的平均值:
, ,
这批零件内径的方差:
,
(2)由题意知, 的可能取值为0,1,2,3,4,则 ,
, ,
, ,因此可得 的分布列:
0 1 2 3 4
0.409 0.153
0.4096 0.0256 0.0016
6 6
则 的数学期望 .
(3)由题意知, , ,又 , ,
则 ,
由二项分布的定义知 ,由二项分布的方差公式知, .
4.(2024·福建龙岩·三模)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五
个层级,分别对应如下五组质量指标值: .根据长期检测结果,得到
芯片的质量指标值 服从正态分布 ,并把质量指标值不小于80的产品称为 等品,其它产品称
为 等品. 现从该品牌芯片的生产线中随机抽取100件作为样本,统计得到如图所示的频率分布直方图.
(1)根据长期检测结果,该芯片质量指标值的标准差 的近似值为11,用样本平均数 作为 的近似值,用
样本标准差 作为 的估计值. 若从生产线中任取一件芯片,试估计该芯片为 等品的概率(保留小数点后
面两位有效数字);
(①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量 服从正态分布 ,则
, . )
(2)(i)从样本的质量指标值在 和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的
芯片件数为 ,求 的分布列和数学期望;(ii)该企业为节省检测成本,采用随机混装的方式将所有的芯片按100件一箱包装. 已知一件 等品芯片
的利润是 元,一件 等品芯片的利润是 元,根据(1)的计算结果,试求 的值,使
得每箱产品的利润最大.
【答案】(1) (2)(i)分布列见解析, ;(ii)
【分析】(1)根据频率分布直方图求得样本平均数,然后利用正态分布的对称性求解概率.
(2)(i)先求出 的取值,然后求出对应的概率,即可求出分布列,代入期望公式求解即可;
(ii)先根据二项分布的期望求出 ,然后构造函数
,利用导数求出最大值时的 即可.
【详解】(1)由题意,估计从该品牌芯片的生产线中随机抽取100件的平均数为:
.
即 , ,所以 ,因为质量指标值 近似服从正态分布 ,
所以 ,
所以从生产线中任取一件芯片,该芯片为 等品的概率约为 .
(2)(i) ,所以所取样本的个数为20件,
质量指标值在 的芯片件数为10件,故 可能取的值为0,1,2,3,
相应的概率为: , , ,
,
随机变量 的分布列为:
0 1 2 3
所以 的数学期望 .
(ii)设每箱产品中A等品有 件,则每箱产品中 等品有 件,设每箱产品的利润为 元,
由题意知: ,
由(1)知:每箱零件中A等品的概率为 ,所以 ,所以 ,
所以
.
令 ,由 得, ,
又 , , 单调递增, , , 单调递减,
所以当 时, 取得最大值.所以当 时,每箱产品利润最大.
题型八:下棋与比赛型分布列1.(22-23·湖南邵阳·模拟)第19届亚运会将于2023年9月23日至10月8日举办,本届亚运会共设40
个竞赛大项.其中首次增设了电子竞技项目.与传统的淘汰赛不同,近年来一个新型的赛制“双败赛制”赢
得了许多赛事的青睐.传统的淘汰赛失败一场就丧失了冠军争夺的权利,而在双败赛制下,每人或者每个
队伍只有失败了两场才会淘汰出局,因此更有容错率.假设最终进入到半决赛有四支队伍,淘汰赛制下会
将他们四支队伍两两分组进行比赛,胜者进入到总决赛,总决赛的胜者即为最终的冠军.双败赛制下,两
两分
组,胜者进入到胜者组,败者进入到败者组,胜者组两个队伍对决的胜者将进入到总决赛,败者进入到败
者组.之前进入到败者组的两个队伍对决的败者将直接淘汰,胜者将跟胜者组的败者对决,其中的胜者进
入总决赛,最后总决赛的胜者即为冠军,双败赛制下会发现一个有意思的事情,在胜者组中的胜者只要输
一场比赛即总决赛就无法拿到冠军,但是其它的队伍却有一次失败的机会,近年来从败者组杀上来拿到冠
军的不在少数,因此很多人戏谑这个赛制对强者不公平,是否真的如此呢?
这里我们简单研究一下两个赛制,假设四支队伍分别为A、B、C、D,其中A对阵其他三个队伍获胜概率
均为p,另外三支队伍彼此之间对阵时获胜概率均为 .最初分组时AB同组,CD同组.
(1)若 ,在淘汰赛赛制下,A、C获得冠军的概率分别为多少?
(2)分别计算两种赛制下A获得冠军的概率(用 表示),并据此简单分析一下双败赛制下对队伍的影
响,是否如很多人质疑的“对强者不公平”?
【答案】(1) 获得冠军的概率分别为 , ;
(2)淘汰赛赛制下 获得冠军的概率为 ,“双败赛制”赛制下 获得冠军的概率为 ,双败赛制下
对强者更有利.
【分析】(1)利用独立事件乘法、互斥事件加法公式求 获得冠军的概率;
(2)分别求出不同赛制下 获得冠军的概率,研究 哪种赛制下 获得冠军的概率更大,即可得
结论.
【详解】(1) 获得冠军: 组 获胜,再由 与 组胜者决赛并胜出,
获得冠军的概率为 ,
获得冠军: 组 获胜,再由 与 组胜者决赛并胜出,
获得冠军的概率为 .
(2)淘汰赛赛制下, 获得冠军的概率为 ,
“双败赛制”赛制下,讨论A进入胜者组、败者组两种情况,
当A进入胜者组,若在胜者组A失败,后两局都胜,方可得冠军;
若在胜者组A胜利,后一局(与败者组胜者比赛)胜,方可得冠军;
当A进入败者组,后三局都胜,方可得冠军;
综上, 获得冠军的概率 .
令 ,若 为强队,则 ,故 ,
所以,双败赛制下对强者更有利.
2.(2021·河北石家庄·一模)“T2钻石联赛”是世界乒联推出一种新型乒乓球赛事,其赛制如下:采用七
局四胜制,比赛过程中可能出现两种模式:“常规模式”和“FAST5模式”.在前24分钟内进行的常规模式中,
每小局比赛均为11分制,率先拿满11分的选手赢得该局;如果两名球员在24分钟内都没有人赢得4局
比赛,那么将进入“FAST5”模式,“FAST5”模式为5分制的小局比赛,率先拿满5分的选手赢得该局.24分钟计时后开始的所有小局均采用“FAST5”模式.某位选手率先在7局比赛中拿下4局,比赛结束.现有甲、乙
两位选手进行比赛,经统计分析甲、乙之间以往比赛数据发现,24分钟内甲、乙可以完整打满2局或3
局,且在11
分制比赛中,每局甲获胜的概率为 ,乙获胜的概率为 ;在“FAST5”模式,每局比赛双方获胜的概率都
为 ,每局比赛结果相互独立.
(Ⅰ)求4局比赛决出胜负的概率;
(Ⅱ)设在24分钟内,甲、乙比赛了3局,比赛结束时,甲乙总共进行的局数记为 ,求 的分布列及
数学期望.
【答案】(Ⅰ) ;(Ⅱ)分布列见解析, .
【分析】(Ⅰ)设前24分钟比赛甲胜出分别为 ,乙胜出分别为 ,在“FAST5”模式
每局比赛甲获胜为 ,4局比赛决出胜负记为事件 ,分类即可求解;
(Ⅱ) 的可能取值为4、5、6、7,分别求得其相应概率,列出分布列,再求期望.
【详解】(Ⅰ)设前24分钟比赛甲胜出分别为 ,乙胜出分别为 ,在“FAST5”模式
每局比赛甲获胜为 ,4局比赛决出胜负记为事件 .
若24分钟内甲、乙打满2局,则 ;
若24分钟内甲、乙打满3局,则
;
(Ⅱ) 的可能取值为4、5、6、7. ;
;
;
;
所以,随机变量 的概率分别列为:
4 5 6 7
的数学期望为 .
3.(23-24高三下·浙江·开学考试)甲、乙、丙三位同学进行乒乓球比赛,约定赛制如下:每场比赛胜者积
2分,负者积0分;比赛前根据相关规则决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进
行下一场比赛,负者下一场轮空;积分首先累计到4分者获得比赛胜利,比赛结束.已知甲与乙比赛时,
甲获胜的概率为 ,甲与丙比赛时,甲获胜的概率为 ,乙与丙比赛时,乙获胜的概率为 .
(1)若 ,求比赛结束时,三人总积分 的分布列与期望;
(2)若 ,假设乙获得了指定首次比赛选手的权利,为获得比赛的胜利,试分析乙的最优指定策略.【答案】(1)分布列见详解, .(2)让乙和丙打第一局
【分析】(1)求出 的取值及对应的概率,得到分布列,求出数学期望;
(2)分别计算出“第一局乙对丙最终乙获胜”,“第一局乙对甲最终乙获胜”,“第一局甲对丙而最终乙获
胜”三种策略下的概率,作差法比较出大小,得到答案.
【详解】(1)由题意可知,两场比赛后结束,也即第一局的其中1人连续获得两场胜利,有两种情况,
此时 , ,当三场比赛后结束,即第一局比赛的2人均未获胜,轮空者获
胜,共有两种情况,此时 , ;
当四场比赛后结束,前三局比赛,甲乙丙三人各赢1场,进行第四场比赛,共有2种情况,
此时 , ;所以三人总积分 的分布列为
4 6 8
0.5 0.25 0.25
所以 .
(2)设事件 为“第一局乙对丙最终乙获胜”, 为“第一局乙对甲最终乙获胜”, 为“第一局甲对丙而最
终乙获胜”,则有:
已知甲与乙比赛时,甲获胜的概率为 ,甲与丙比赛时,甲获胜的概率为 ,乙与丙比赛时,乙获胜的
概率为 .其中 包含三种情况,第一,第一局乙获胜,第二局乙获胜;
第二,第一局乙获胜,第二局甲获胜,第三局丙获胜,第四局乙获胜;
第三,第一局丙获胜,第二局甲获胜,第三局乙获胜,第四局乙获胜,
故 ;
同理可得 ;
;
显然 ,故 ,
,
由于 ,故 ,
所以 ;故乙的最优指定策略是让乙和丙打第一局.
4.(20-21高三下·安徽·阶段练习)“博弈”原指下棋,出自我国《论语·阳货》篇,现在多指一种决策行
为,即一些个人、团队或组织,在一定规则约束下,同时或先后,一次或多次,在各自允许选择的策略下
进行选择和实施,并从中各自取得相应结果或收益的过程.生活中有很多游戏都蕴含着博弈,比如现在有
两个人玩“亮”硬币的游戏,甲、乙约定若同时亮出正面,则甲付给乙3元,若同时亮出反面,则甲付给乙1
元,若亮出结果是一正一反,则乙付给甲2元.
(1)若两人各自随机“亮”出正反面,求乙收益的期望.
(2)因为各自“亮”出正反面,而不是抛出正反面,所以可以控制“亮”出正面或反面的频率(假设进行多次
游戏,频率可以代替概率),因此双方就面临竞争策略的博弈.甲、乙可以根据对手出正面的概率调整自己
出正面的概率,进而增加自己赢得收益的期望,以收益的期望为决策依据,甲、乙各自应该如何选
择“亮”出正面的概率,才能让结果对自己最有利?并分析游戏规则是否公平.
【答案】(1) ;(2)答案见解析.
【分析】(1)根据题意可得随机变量 的可能取值为 ,1,3,列出分布列,求出数学期望即可.
(2)设甲以 的概率“亮”出正面,乙以 的概率“亮”出正面,分别求出甲的收益分布
列以及乙的收益分布列,求出数学期望,讨论 的取值,分析甲、乙的数学期望即可得出结果.
【详解】解析(1)因为是各自随机“亮”出正反面,所以甲、乙“亮”出正面的概率均可认为是 ,
设乙在此游戏中的收益为随机变量 ,则 的可能取值为 ,1,3,所以可得乙的收益的分布列为
-2 1 3.
(2)假设甲以 的概率“亮”出正面,乙以 的概率“亮”出正面,
甲收益的随机变量为 ,乙收益的随机变量为 ,此时甲的收益分布列为
2 -1 -3
所以甲的收益期望为 .
同理可得乙的收益分布列为
-2 1 3
所以乙的收益期望为 .
根据甲的收益期望,可知乙的最优策略是“亮”出正面的概率为 ,
否则若 ,有 ,甲的收益期望 ,
甲可以选择都“亮”出反面的策略,即 ,达到预期收益最大,此时 .
若 ,则甲选择都“亮”出正面的策略,即 ,达到预期收益最大, .
同理,可知甲的最优策略是“亮”出正面的概率为 ,
所以最终两人的决策为保持“亮”出正面的概率都为 .
而当 时, , ,所以此时游戏结果对两人都是最有利,但是规则不公平.
题型九:数列递推型:马尔科夫链
1.(24-25高三上·江西·开学考试)马尔科夫链是概率统计中的一个重要模型,其过程具备“无记忆”的性
质:下一状态的概率分布只能由当前状态决定,即第n+1次状态的概率分布只与第n次的状态有关,与
第 ,…次的状态无关,即 .已知甲盒中装有1个白
球和2个黑球,乙盒中装有2个白球,现从甲、乙两个盒中各任取1个球交换放入对方的盒中,重复n次
( )这样的操作,记此时甲盒中白球的个数为 ,甲盒中恰有2个白球的概率为 ,恰有1个白
球的概率为 .
(1)求 和 .
(2)证明: 为等比数列.(3)求 的数学期望(用n表示).
【答案】(1) , , ;(2)证明见解析;(3) .
【分析】(1)利用古典概率计算即得;按第1次交换球的结果分类讨论,结合相互独立事件的概率、互
斥事件的概率求出 .
(2)按第 次交换球的结果分类讨论,结合相互独立事件的概率、互斥事件的概率用 表示
即可推理得证.
(3)利用(2)的结论,求出随机变量 的分布列,再求出数学期望.
【详解】(1)若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1
黑,概率 ;若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2
白,概率 ,研究第2次交换球时的概率,根据第1次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为 ,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为 ;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为
;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为
;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为
,
②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为 ,
此时,若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,概率
为 若甲盒取白球,乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概
率为 ,综上, .
(2)依题意,经过 次这样的操作,甲盒中恰有2个白球的概率为 ,
恰有1个白球的概率为 ,则甲盒中恰有3个白球的概率为 ,
研究第 次交换球时的概率,根据第 次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为 ,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为 ;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为
;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为
;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为
,②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为 ,此时,若甲盒取黑球、乙盒取白
球,
互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,概率为 ;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率为
,
③当甲盒中的球为3白,乙盒中的球为2黑时,对应概率为 ,
此时,甲盒只能取白球、乙盒只能取黑球,互换,则甲盒中的球变为2白1黑,
乙盒中的球变为1白1黑,概率为 ,
综上,
则 ,
整理得 ,又 ,
所以数列 是公比为 的等比数列.
(3)由(2)知 ,则 ,
随机变量 的分布列为
1 2 3
所以 .
2.(23-24高二下·辽宁·阶段练习)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能
的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义
为:假设我们的序列状态是…… ,…,那么 时刻的状态的条件概率仅依赖前一状态
,即 .
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为 ,且每局赌赢可以赢得1元,每
一局赌徒赌输的概率为 ,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束
赌博游戏:记赌徒的本金为 一种是赌金达到预期的B元,赌徒停止赌博;另一种是赌徒
输光本金后,赌徒可以向赌场借钱,最多借A元,再次输光后赌场不再借钱给赌徒.赌博过程如图的数轴
所示.
当赌徒手中有n元 时,最终欠债A元(可以记为该赌徒手中有 元)概率为 ,请
回答下列问题:
(1)请直接写出 与 的数值.
(2)证明 是一个等差数列,并写出公差d.
(3)当 时,分别计算 时, 的数值,论述当B持续增大时, 的统计含义.
【答案】(1) , ;(2)证明见解析, ;(3)当 时, ,当
时, ;论述见解析.【分析】(1)按照游戏约定,易得 , ;
(2)由全概率公式得出数列 的递推公式,根据等差数列的定义易得 为等差数列,运用累加
法和 , 的值即可求得公差;
(3)根据(2)求得的概率通项式 ,代入 和 ,整理即得
,逐一代入 值,即可求出 的值,分析即得结论.
【详解】(1)当 时,赌徒已经欠债 元,因此 .
当 时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率 ;
(2)记 赌徒有n元最后输光的事件, 赌徒有n元上一场赢的事件,
,即 ,
所以 ,所以 是一个等差数列,
设 ,则 ,
累加得 ,故 ,得 ;
(3) ,由(2) ,代入 可得 ,即
,当 时, ,当 时, ,
当B增大时, 也会增大,即输光欠债的可能性越大,因此可知久赌无赢家,
即便是一个这样看似公平的游戏,只要赌徒一直玩下去就会 的概率输光并负债.
3.(24-25高三上·广东·开学考试)马尔科夫链因俄国数学家安德烈・马尔科夫得名,其过程具备“无记
忆”的性质,即第 次状态的概率分布只跟第 次的状态有关,与第 次状态无关.马尔
科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金
融领域、天气预测等方面都有着极其广泛的应用.现有 两个盒子,各装有2个黑球和1个红球,现从
两个盒子中各任取一个球交换放入另一个盒子,重复进行 次这样的操作后,记 盒子中红
球的个数为 ,恰有1个红球的概率为 .
(1)求 的值;
(2)求 的值(用 表示);
(3)求证: 的数学期望 为定值.
【答案】(1) , (2) (3)证明见解析
【分析】(1)根据古典概型运算公式,结合组合的定义进行求解即可;
(2)根据古典概型运算公式,可以得到含 的代数式表示 ,运用构造法,结合等比数列的定义进行
求解即可;
(3)根据古典概型运算公式,结合题意得到 、 、 、 之间的关系,结合数学期望的运算公式
进行求解即可.
【详解】(1)设第 次操作后 盒子中恰有2个红球的概率为 ,则没有红球的概率为
.
由题意知 ,
(2)因为 .所以 .又因为 ,所以 是以 为首项, 为公比的等比数列.
所以 ,
(3)因为 ,
①
②
所以①一②,得 .
又因为 ,所以 ,所以 . 的可能取值是 ,
所以 的概率分布列为
0 1 2
所以 .所以 的数学期望 为定值1.
4.(2024高三·全国·专题练习)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的
基石,为状态空间中经过从一个状态到另一个状态的转换的随机过程.该过程要求具备“无记忆”的性质:
下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关.甲、乙两口袋中各装
有1个黑球和2个白球,现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复进行 次这
样的操作,记口袋甲中黑球的个数为 ,恰有1个黑球的概率为 .
(1)求 的值;
(2)求 的值(用 表示);
(3)求证: 的数学期望 为定值.
【答案】(1) , (2) (3)证明见解析
【分析】(1)由题意根据组合数公式、古典概型概率计算公式先求得 ,再结合全概率公式可得 .
(2)由全概率公式得递推公式,构造等比数列即可求解.
(3)由题意得 ,结合 ,由此可得 、分布列以及数
学期望.
【详解】(1)设恰有2个黑球的概率为 ,则恰有0个黑球的概率为 .
由题意知 , ,所以
.
(2)因为 ,所以
.
又因为 ,所以 是以 为首项, 为公比的等比数列.
所以 , .(3)因为 ①,
②.
所以① ②,得 .又因为 ,所以 .所以
.
所以 的概率分布列为:
0 1 2
p
所以 .所以 的数学期望 为定值1.
题型十:数列递推型:传球模式
1.(2024·山东泰安·模拟预测)在足球比赛中,有时需通过点球决定胜负.
(1)扑点球的难度一般比较大,假设罚点球的球员会等可能地随机选择球门的左、中、右三个方向射门,
门将(也称为守门员)也会等可能地随机选择球门的左、中、右三个方向来扑点球,而且门将即使方向判断
正确也有 的可能性扑不到球.不考虑其它因素,在一次点球大战中,求门将在前三次扑到点球的个数
的分布列和期望;
(2)好成绩的取得离不开平时的努力训练,甲、乙、丙三名前锋队员在某次传接球的训练中,球从甲脚下开
始,等可能地随机传向另外 人中的 人,接球者接到球后再等可能地随机传向另外 人中的 人,如此
不停地传下去,假设传出的球都能接住.记第 次传球之前球在甲脚下的概率为 ,易知 .
① 试证明: 为等比数列;
② 设第 次传球之前球在乙脚下的概率为 ,比较 与 的大小.
【答案】(1)分布列见解析,数学期望为 ;(2)①证明见解析;② .
【分析】(1)解法一:由题意可得 ,然后根据二项分布的概率公式求解概率,从而可求出分布列和期望;
解法二: 的所有可能取值为 ,且在一次扑球中,扑到点球的概率 ,然后分别求出各自对应的概率,从而
可求出分布列和期望;
(2)①由题意可得第 次传球之前球在甲脚下的概率为 ,第 次传球之前球不在甲脚下的概率为 ,则
,化简变形后可证得结论;②分别表示出 ,化简后与 比较大小可得结论.
【详解】(1)解法一:依题意可得,门将每次可以扑到点球的概率为 ,门将在前三次扑到点球的个数 可能的取值为 易知 ,
所以 故 的分布列为:
0 1 2 3
所以 的数学期望 .
解法二: 的所有可能取值为 在一次扑球中,扑到点球的概率 ,
所以
所以 的分布列如下:
0 1 2 3
所以的 数学期望:
(2)①第 次传球之前球在甲脚下的概率为 ,
则当 时,第 次传球之前球在甲脚下的概率为 ,
第 次传球之前球不在甲脚下的概率为 , 则
即 ,又 ,
所以 是以 为首项,公比为 的等比数列.
②由①可知 ,所以 ,
所以 ,故 .
2.(2023·河北·模拟预测)某排球教练带领甲、乙两名排球主力运动员训练排球的接球与传球,首先由
教练第一次传球给甲、乙中的某位运动员,然后该运动员再传回教练.每次教练接球后按下列规律传球:
若教练上一次是传给某运动员,则这次有 的概率再传给该运动员,有 的概率传给另一位运动员.已知
教练第一次传给了甲运动员,且教练第 次传球传给甲运动员的概率为 .
(1)求 , ;
(2)求 的表达式;
(3)设 ,证明: .
【答案】(1) , (2) (3)证明见解析
【分析】(1)根据题意,结合互斥事件和独立事件概率公式进行求解即可;
(2)根据互斥事件和独立事件概率公式,结合等比数列的定义和通项公式进行求解即可;(3)利用构造函数法,结合导数与函数单调性的关系、等比数列的前 项和公式进行证明即可.
【详解】(1) , , ;
(2)由已知 , ,即 ,
∴
是以 为公比的等比数列, , .
∴ ∴ ∴
(3) .设 , , , 在 上单调
∴ ∴
递增,显然 ,则 , ,则 ,
∴
即 ,
∴
.
3.(23-24高三上·山东青岛·开学考试)某篮球赛事采取四人制形式.在一次战术训练中,甲、乙、丙、丁
四名队员进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三人中的任
何一人. 次传球后,记事件“乙、丙、丁三人均接过传出来的球”发生的概率为 .
(1)求 ;
(2)当 时,记乙、丙、丁三人中接过传出来的球的人数为 ,求随机变量 的分布列及数学期望;
(3)当 时,证明: .
【答案】(1) (2)分布列见解析, (3)证明见解析
【分析】(1)根据相互独立事件概率计算求得 .
(2) 的可能取值为 ,根据相互独立事件概率计算求得分布列并求得数学期望.
(3)根据第 次传球后,接过他人传球的人数进行分类讨论,由此证得结论成立.
【详解】(1)乙、丙、丁三人每次接到传球的概率均为 ,3次传球后,
事件“乙、两、丁三人均接过传出来的球”发生的概率为 .
(2)由题意知, 的可能取值为1,2,3, , ,
, 的分布列如下:
1 2 3
.
(3) 次传球后乙、丙、丁三人均接过他人传球,有两种情况,
其一为: 次传球后乙、丙、丁三人均接过他人传球,这种情况的概率为 ;
其二是为: 次传球后乙、两、丁中只有两人接过他人传球,
第 次传球时将球传给剩余一人,这种情况的概率为 .所以,当 时, 所以 .
4.(22-23高三上·广东·阶段练习)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战将在2022年11
月21日打响,决赛定于12月18日晚进行,全程为期28天.
(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到2 2列联
表如下:
喜爱足球运
不喜爱足球运动 合计
动
男性 60 40 100
女性 20 80 100
合计 80 120 200
依据小概率值a=0.001的独立性检验,能否认为喜爱足球运动与性别有关?
(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都
等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传
球的人为第1次触球者,第 次触球者是甲的概率记为 ,即 .
(i)求 (直接写出结果即可);(ii)证明:数列 为等比数列,并判断第19次与第20次触球
者是甲的概率的大小.
【答案】(1)喜爱足球运动与性别有关
(2)(i) ;(ii)证明见解析,甲的概率大
【分析】(1)计算出卡方,与10.828比较得到结论;
(2)(i)根据传球的等可能性推出 ,(ii)推导出 ,构造出等比数列,
求出 ,得到 ,比较出大小.
【详解】(1)假设 :喜爱足球运动与性别独立,即喜爱足球运动与性别无关.根据列联表数据,经计
算得
根据小概率值 的独立性检验,我们推断 不成立,
即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001.
(2)(i)由题意得:第二次触球者为乙,丙,丁中的一个,第二次触球者传给包括甲的三人中的一人,
故传给甲的概率为 ,故 .
(ii)第 次触球者是甲的概率记为 ,则当 时,第 次触球者是甲的概率为 ,
第 次触球者不是甲的概率为 ,则 ,
从而 ,又 , 是以 为首项,公比为 的等比数列.
则 , , ,
,故第19次触球者是甲的概率大
∴
题型十一:多线程多人比赛型1.(2024·安徽·模拟预测)“友谊杯”围棋擂台赛采取淘汰制,现有 名选手报名参加比赛(含甲、乙两
名选手),规则如下:第一轮将所有报名选手任意两两配对对弈,输者淘汰出局,然后将剩下的 名胜
者再任意两两配对对弈,同样输者淘汰出局……如此下去,直至第 轮比赛决出一名冠军.假定每名选手
在各轮比赛中获胜的概率均为0.5.
(1)当 时,求甲、乙两人相遇对弈的概率 ;
(2)当 时,求甲、乙两人相遇对弈的概率 ;
(3)已知当擂台赛报名选手人数分别为 时,甲、乙两人相遇对弈的次数依次是 ,
记 ,若随机变量 服从两点分布,且 , ,求 .
【答案】(1) (2) (3)
【分析】(1)记甲、乙两人在第一轮和第二轮中相遇对弈的事件分别为 和 ,则
,分别求 和 ,代入即得;
(2)设报名选手人数为 时,甲、乙两人相遇对弈的概率为 ,当 时,
,分别求 和 ,代入即得 ;可得 ;
(3)先求 ,再由公式 ,利用等比数列的前 项和公式计算即得.
【详解】(1)当 时,报名选手只有4人,其中包含甲、乙.记甲、乙两人在第一轮和第二轮中相遇
对弈的事件分别为 和 ,则 .
甲、乙两人相遇对弈的情况分为两种:
①甲、乙两人在第一轮中配对,由于4人两两配对的方式共有 (种),故 ;
②甲、乙两人在第一轮中没有配对,那么他们只有在第一轮中都胜出进入第二轮才有可能配对,
而第二轮只有两人比赛,所以他们必相遇对弈,此时 .
所以 .
(2)设报名选手人数为 时,甲、乙两人相遇对弈的概率为 .
考虑 的情况,仍用 和 分别表示甲、乙两人在第一轮比赛和后续比赛中相遇对弈的事件,
则甲、乙两人相遇对弈的概率 .
同样甲、乙两人相遇对弈的情况分为两种:
①甲、乙两人在第一轮中配对,因为 个人两两配对的方式共有
种,其中甲、乙两人配对的方式有 种,所以 ;
②甲、乙两人在第一轮中没有配对,那么他们要想在后续的比赛中相遇对弈,只有他们两人在第一轮中
都胜出,
同其余 名胜者进入下一轮比赛,从这时起变成 名选手按照原来的比赛规则进行比赛,
所以只要甲、乙两人都能进入后续的比赛,那么他们在后续的比赛中相遇对弈的概率就是 ,则
.所以
,
所以当 时,甲、乙两人相遇对弈的概率 .
(3)因为 ,所以 ,
所以当 时, .
2.(2024·浙江杭州·模拟预测)现有 个编号为 的小球,随机将它们分成甲、乙
两组,每组 个. 设甲组中小球的最小编号为 ,最大编号为 ;乙组中小球的最小编号为 ,最大编号为
记 ,
(1)当 时,求 的分布列和数学期望;
(2)令 表示“事件 与 的取值恰好相等”.
①求事件 发生的概率 ;
②证明:
【答案】(1)答案见解析.(2)答案见解析.
【分析】(1)当 时,将6个正整数平均分成甲、乙两组,不同的分组方法共有 种, 所有可能值
为2,3,4,5.对应组数分别为4,6,6,4,对应概率求出来,得出分布列,求出期望即可.
(2)① 和 恰好相等的所有可能值为 当 和 恰好相等且等于 时,不同的分组
方法有2种;当 和 恰好相等且等于 时,不同的分组方法有2种;当 和 恰好相等且等于 时,不同
的分组方法有2 种;当 和 恰好相等且等于 时,不同的分组方法有2 种;以此类推,归纳出
.
②可以用数列当中的知识,运用数学归纳法解决.
【详解】(1)当n=3时,将6个正整数平均分成甲、乙两组, 编号为1,2,3,4,5,6. 的所有可能取值为
2,3,4,5.不同的分组方法共有 种,
当 ,表示甲组取球编号最大最小差2,甲组取得球 4种组合,此时
当 ,表示甲组取球编号最大最小差3,甲组取得球 6种组合,
此时
当 ,表示甲组取球编号最大最小差4,甲组取得球 6种组合,此时
当 ,表示甲组取球编号最大最小差5,甲组取得球 4种组合,此时
则为所以 的分布列为:
3 4 5
E( )=2× +3× +4× +5× = .
(2)① 和 恰好相等的所有可能值为
和 恰好相等且等于 时,不同的分组方法有2种;
和 恰好相等且等于 时,不同的分组方法有2种;
和 恰好相等且等于 时,不同的分组方法有 种;
所以当 时, 当 时
②数学归纳法进行证明.由①知,当 时, ,原式成立.
当 时,
当 时, ,显然成立.假设 时原式成立,
.
那么,当 时,
,则 .
综上所得, 成立.
3.(2024·全国·模拟预测)中国女排是中国各体育团队中成绩突出的体育团队之一,曾是世界上第一
个“五连冠”得主,并十度成为世界冠军,2023年在杭州第19届亚运会上女排再度获得冠军.她们那种团
结协作、顽强拼搏的精神极大地激发了中国人的自豪、自尊和自信,为我们在新征程上奋进提供了强大的
精神力量.如今,女排精神广为传颂,家喻户晓,各行各业的人们在女排精神的激励下,为中华民族的腾
飞顽强拼搏.某中学也因此掀起了排球运动的热潮,在一次排球训练课上,体育老师安排4人一组进行传
接球训练,其中甲、乙、丙、丁四人刚好围成一个矩形(如图),已知当某人控球时,传给其相邻同学的
概率为 ,传给对角线上的同学的概率为 ,由甲开始传球.
(1)求第3次传球是由乙传给甲的概率;(2)求第 次传球后排球传到丙手中的概率;
(3)若随机变量 服从两点分布,且 , , ,…, ,则
,记前 次(即从第1次到第 次传球)中排球传到乙手中的次数为 ,求 .
【答案】(1) (2) (3)
【分析】(1)设第 次传球后排球在甲、乙、丙、丁手中的概率分别为 ,得到
,求出 ,从而得到第3次传球是由乙传给甲的概率;
(2)求出 之间的关系式,联立后得到 , ,进而得到
是以 为首项,公比为 的等比数列,求出
;
(3)在(2)的基础上求出 ,求出 ,利用等比数列求和公式得到答
案.
【详解】(1)设第 次传球后排球在甲、乙、丙、丁手中的概率分别为 ,
则 .
第2次传球到乙手中的概率 ,
所以第3次传球是由乙传给甲的概率为 .
(2)根据已知条件可得,当 时, 联立则有 ,
所以 是首项为 ,公比为 的等比数列,故 .因为 ,所以 ,
代入①②式得 ,将⑤代入⑥得 ,
,则 ,
其中 ,故 ,
,,……, ,
由累加法可得 ,
所以 ,所以 是以 为首
项,公比为 的等比数列,所以 ,
故第 次传球后排球传到丙手中的概率为 .
(3)随机变量 服从两点分布,设第i次未传到乙手中的概率为 ,
则排球第i次传到乙手中的概率为 ,
则 .由(2)知
,
其中 ,
所以 .
4.(2024·黑龙江·二模)一座小桥自左向右全长100米,桥头到桥尾对应数轴上的坐标为0至100,桥上
有若干士兵,一阵爆炸声后士兵们发生混乱,每个士兵爬起来后都有一个初始方向(向左或向右),所有
士兵的速度都为1米每秒,中途不会主动改变方向,但小桥十分狭窄,只能容纳1人通过,假如两个士兵
面对面相遇,他们无法绕过对方,此时士兵则分别转身后继续前进(不计转身时间).
(1)在坐标为10,40,80处各有一个士兵,计算初始方向不同的所有情况中,3个士兵全部离开桥面的最
长时间(提示:两个士兵面对面相遇并转身等价于两个士兵互相穿过且编号互换);
(2)在坐标为10、20、30、……、90处各有一个士兵,初始方向向右的概率为 ,设最后一个士兵离开独木
桥的时间为 秒,求 的分布列和期望;
(3)若初始状态共 个士兵 ,初始方向向右的概率为 ,计算自左向右的第 个士兵(命名为
指挥官)从他的初始方向离开小桥的概率 ,以及当 取得最大值时 取值.
【答案】(1)90秒(2)分布列见解析;期望 秒(3) ,当 取得最大值时 的取值为
1
【分析】(1)先优化假设,将士兵相遇时的转身改为互相穿过,然后计算单个士兵可能走的最远路程,
再求得时间;
(2)列出T的所有可能取值并计算概率,然后列出分布列,根据期望公式计算;
(3)先优化假设,假设指挥官以外的士兵之间不会碰撞,并且初始背对指挥官的士兵一开始就直接消
失,而初始面对指挥官的士兵在与指挥官相撞后也会消失;然后将问题转化为二项分布相关的问题,求出
概率 ;再研究 的单调性即可得出 最大时 的取值.
【详解】(1)由于两个士兵面对面相遇并转身等价于两个士兵互相穿过且编号互换,所以在最长时间
下,坐标为10处的士兵必须向右,最长时间为 秒,
所以3个士兵全部离开桥面的最长时间为90秒.
(2)T的可能取值为50,60,70,80,90,,
所以T的分布列
T 50 60 70 80 90
P
期望 秒
(3)本小问的解答将分为4步进行. 第1步我们将把问题优化假设为以下情况:初始背对指挥官的士兵在
一开始就消失,而初始面对指挥官的士兵在和指挥官相撞时也会消失;第2步我们将说明,在此种假设
下,指挥官从初始面对的方向离开的充要条件是,初始状态下他前方的士兵中面对他的士兵数量 ,不
超过初始状态下他后方的士兵中面对他的士兵数量 ;第3步我们利用 服从二项分布,求出
;第4步我们说明 是递减数列,从而当 取到最大值时, .
第1步:根据题意,我们知道指挥官左边有 个士兵,右边有 个士兵.
由于两个士兵面对面相遇并转身等价于两个士兵互相穿过且编号互换,但我们只需要研究指挥官离开桥面
的方式,无需考虑其它士兵的编号,所以我们不妨设除指挥官外的士兵两两之间不会碰撞,而是相遇后互
相穿过对方. 不过,我们依然要考虑指挥官和士兵之间的碰撞.
在作出了除指挥官外的士兵两两之间不会碰撞的假设下,我们又有以下结论:
①在指挥官左(右)边的,初始方向朝左(右)的士兵(也就是初始时背对指挥官的士兵)永远不会和
指挥官相撞,因为这样的士兵和指挥官都在桥上时,他们之间的距离永远不会减少;
②士兵一旦和指挥官相撞一次,就不会再次相撞,因为和指挥官相撞后的士兵将进入背对指挥官的状
态,如①中所述,他们不可能再次相撞.
从而,我们还可以不妨假设:
①在指挥官左(右)边的,初始方向朝左(右)的士兵(也就是初始时背对指挥官的士兵)在开始的一
瞬间就消失;
②而剩下的那些士兵(也就是初始面对指挥官的士兵)一旦和指挥官相撞,就会在相撞的瞬间消失(从
而他们消失之前,始终面对指挥官).
第2步:
设 表示指挥官初始面向的那些士兵中,一开始面向指挥官的士兵数量; 表示指挥官初始背对的那些
士兵中,一开始面向指挥官的士兵数量.
根据之前的假设,一开始背对指挥官的士兵会直接消失,因此初始状态下,指挥官前方有 个士兵,且
都面朝指挥官;指挥官后方有 个士兵,且也都面朝指挥官.
然后,我们考虑指挥官开始移动后发生的事情.
指挥官会先和他前面的一个士兵碰撞,然后转向,和他相撞的士兵随即消失,此时指挥官初始朝向和初始
背向的士兵数量分别是 和 .
然后指挥官又会先和他前面(也就是初始背对)的一个士兵发生碰撞,然后转向,和他相撞的士兵随即消
失,此时指挥官初始朝向和初始背向的士兵数量分别是 和 ;
以此类推……直至某一刻,指挥官行进的方向上没有士兵,这时指挥官会从行进的方向离开桥.
这表明,为判断指挥官最终离开桥的方向,我们只需要轮流给 和 减1,直至这两个数中的某一个数达
到0,在试图减1时无法再减少. 若 最终无法再减少,则指挥官会从初始面向的方向离开桥;若 最终
无法再减少,则指挥官会从初始面向的方向离开桥.
所以,指挥官从他的初始方向离开桥,当且仅当 .
第3步:
由于每个士兵的初始方向是独立的,且一开始面朝指挥官和背对指挥官各自的概率都是 ,所以一方面我
们知道 和 独立,且都服从二项分布 ;另一方面我们知道除指挥官外的一切士兵中,初始面对
指
挥官的士兵数量 同样服从二项分布 .故
.
.至此,我们得到了 .
第4步:最后我们考虑什么时候 取到最大.
由于 ,故 ,
这表明 .
所以 是递减数列,从而当 取到最大值时, .
综合上述论证,所求概率 ;而当 取到最大值时, .
题型十二:跳棋模式分布列
1.(2020·河北张家口·二模)某校为了解该校学生“停课不停学”的网络学习效率,随机抽查了高一年级
100位学生的某次数学成绩(单位:分),得到如下所示的频率分布直方图:
(1)估计这100位学生的数学成绩的平均值 ;(同一组中的数据用该组区间的中点值代表)
(2)根据整个年级的数学成绩可以认为学生的数学成绩 近似地服从正态分布 ,经计算,(1)
中样本的标准差s的近似值为10,用样本平均数 作为 的近似值,用样本标准差s作为 的估计值,现
任抽取一位学生,求他的数学成绩恰在64分到94分之间的概率;(若随机变量 ,则
, , )
(3)该年级1班的数学老师为了能每天督促学生的网络学习,提高学生每天的作业质量及学习数学的积极
性,
特意在微信上设计了一个每日作业小程序,每当学生提交的作业获得优秀时,就有机会参与一次小程序
中”玩游戏,得奖励积分”的活动,开学后可根据获得积分的多少向老师领取相应的小奖品.小程序页面上
有一列方格,共15格,刚开始有只小兔子在第1格,每点一下游戏的开始按钮,小兔子就沿着方格跳一下,每次跳1格或跳2格,概率均为 ,依次点击游戏的开始按钮,直到小兔子跳到第14格(奖励0
分)或第15格(奖励5分)时,游戏结束,每天的积分自动累加,设小兔子跳到第 格的概率
为 ,试证明 是等比数列,并求小兔子获胜的概率.
【答案】(1) (2) (3)证明见解析,
【分析】(1)根据频率分布直方图直接结算即可;
(2)由 可知 ,根据参考数据,即可得出 的概率;
(3)根据分类加法计数原理可知 ,构造等比数列可得 ,利用累加法求
出 ,即可求解.
【详解】(1)
(2)由 ,所以 ,
.
(3)小兔子开始在第1格,为必然事件, ,
点一下开始按钮,小兔子跳1格即移到第2格的概率为 ,即 ,
小兔子移到第 格的情况是下列两种,而且也只有两种情况.
①小兔子先跳到第 格,又点一下开始按钮跳了2格,其概率为 ;
②小兔了先跳到第 格,乂点一下开始按钮跳了1格,其概率为 ;
因为 ,所以 .所以当 时,
数列 是以 为首项,以 为公比的等比数列,
所以 ,
.所以 ,所以小兔子获胜的概率
.
2.(23-24高二下·湖北武汉·期末)Catalan数列(卡特兰数列)最早由我国清代数学家明安图(1692-
1765)在研究三角函数幂级数的推导过程中发现,成果发表于1774年出版的《割圜密率捷法》中,后由
比利时数学家卡特兰(Catalan,1814-1894)的名字来命名,该数列的通项被称为第 个Catalan数,其通
项公式为 .在组合数学中,有如下结论:由 个 和 个 构成的所有数
列 , 中,满足“对任意 ,都有 ”的数列的个数等于 .
已知在数轴上,有一个粒子从原点出发,每秒向左或向右移动一个单位,且向左移动和向右移动的概率均为 .(1)设粒子第3秒末所处的位置为随机变量 (若粒子第一秒末向左移一个单位,则位置为 ;若粒
子第一秒末向右移一个单位,则位置为1),求 的分布列和数学期望 ;
(2)记第 秒末粒子回到原点的概率为 .
(i)求 及 ;
(ii)设粒子在第 秒末第一次回到原点的概率为 ,求 .
【答案】(1)分布列见解析,0(2)(i) , ;(ii)
【分析】(1)根据二项分布的概率公式求解概率,即可求解分布列以及期望,
(2)(i)根据相互独立事件的乘法概率公式即可求解(i),
(ii)设事件A:粒子在第2n秒末第一次回到原点,事件B:粒子第1秒末向右移动一个单位,
根据 ,结合 的定义,即可求解.
【详解】(1)依题可知, 的可能取值为 , ,
,
, , 的分布列如下:
-3 -1 1 3
.
(2)(i) , ,
(ii)设事件 :粒子在第 秒末第一次回到原点,
事件 :粒子第1秒末向右移动一个单位.
,
记粒子往左移动一个单位为 ,粒子往右移动一个单位为 ,
以下仅考虑事件 .
设第 秒末粒子的运动方式为 ,其中 ;沿用(1)中对粒子位置的假设 ,
则粒子运动方式可用数列 表示,
如: 表示粒子在前4秒按照右、右、左、左的方式运动.
由粒子在第 秒末第一次回到原点,可知
数列 的前 项中有 个1和 个 .
, ,
粒子在余下 秒中运动的位置满足 ,
即 ,
粒子在余下 秒中运动方式的总数为 ,
,又 ,
.
3.(2024·山东济南·二模)随机游走在空气中的烟雾扩散、股票市场的价格波动等动态随机现象中有重
要应用.在平面直角坐标系中,粒子从原点出发,每秒向左、向右、向上或向下移动一个单位,且向四个
方向移动的概率均为 例如在1秒末,粒子会等可能地出现在 四点处.
(1)设粒子在第2秒末移动到点 ,记 的取值为随机变量 ,求 的分布列和数学期望
;
(2)记第 秒末粒子回到原点的概率为 .
(i)已知 求 以及 ;
(ii)令 ,记 为数列 的前 项和,若对任意实数 ,存在 ,使得 ,则称粒
子是常返的.已知 证明:该粒子是常返的.
【答案】(1)见解析(2)(i) ; ; (ii)见解析
【分析】(1)求出求 的可能取值及其对应的概率,即可求出 分布列,再由数学期望公式求出
;
(2)(i)粒子奇数秒不可能回到原点,故 ;粒子在第4秒回到原点,分两种情况考虑,再由古典
概率公式求解即可;第 秒末粒子要回到原点,则必定向左移动 步,向右移动 步,向上移动
步,向下移动 步,表示出 ,由组合数公式化简即可得出答案;(ii)利用题目条件可证明
,再令 可证得 ,进一步可得
,即可得出答案.
【详解】(1)粒子在第 秒可能运动到点 或 或
的位置, 的可能取值为: , , , ,所以
的分布列为:
.
(2)(i)粒子奇数秒不可能回到原点,故 ,粒子在第4秒回到原点,分两种情况考虑:
每一步分别是四个不同方向的排列,例如“上下左右”,共有 种情形;
每一步分别是两个相反方向的排列,例如“左左右右、上上下下”,共有 种情形;
于是 ,第 秒末粒子要回到原点,则必定向左移动 步,向右移动 步,向上移动
步,
向下移动 步,故
.
故 .(ii)利用 可知: ,
于是 ,令 , ,
故 在 上单调递增,则 ,于是 ,
从而有: ,
即 为不超过 的最大整数,则对任意常数 ,当 时,
,于是 ,综上所述,当 时, 成立,因此该粒子是常返的.
【点睛】关键点睛:本题第二问(ii)的关键点在于利用 可得
,再令 可证得 ,进一步可得
,即可得出答案.
4.(22-23高三下·江苏苏州·开学考试)设数轴上有一只兔子,从坐标 开始,每秒以 的概
率向正方向跳一个单位,以 的概率向反方向跳一个单位,记兔子第n秒时的位置为 .
(1)证明: ;
(2)记 是表达式 的最大值,证明: .
【答案】(1)证明见解析(2)证明见解析
【分析】(1)若n次跳动中一共向右跳了k次,则 .得到
,若n次跳动中一共向左跳了k次,则 .得到
,再利用 ,讨
论 或 即可得证;
(2)先计算 ,再利用 ,
, 进行放缩可以得证.
【详解】(1)若n次跳动中一共向右跳了k次,则 .
因此 , ,1,2,…,n.
若n次跳动中一共向左跳了k次,则 .
故 , ,1,2,…,n.
于是 ,当 时, ;
当 时, .故 ,
即 .
(2)
因此 .
【点睛】关键点点睛:
第一问中借助 ,
从而讨论 或 即可得证;
第二问中借助 , , 多次放缩才得证.
题型十三:分布列导数计算求最值
1.(20-21高三上·重庆沙坪坝·阶段练习)某制药公司研制了一款针对某种病毒的新疫苗.该病毒一般通过
病鼠与白鼠之间的接触传染,现有 只白鼠,每只白鼠在接触病鼠后被感染的概率为 ,被感染的白鼠数
用随机变量 表示,假设每只白鼠是否被感染之间相互独立.(1)若 ,求数学期望 ;
(2)接种疫苗后的白鼠被病鼠感染的概率为 ,现有两个不同的研究团队理论研究发现概率 与参数
的取值有关.团队 提出函数模型为 ,团队 提出函数模型为
.现将白鼠分成10组,每组10只,进行实验,随机变量 表示第 组被感染的白鼠数,现
将随机变量 的实验结果 绘制成频数分布图,如图所示.假设每组白鼠是否
被感染之间相互独立.
①试写出事件“ ”发生的概率表达式(用 表示,组合数不必计算);
②在统计学中,若参数 时使得概率 最大,称 是 的最大似然估
计.根据这一原理和团队 , 提出的函数模型,判断哪个团队的函数模型可以求出 的最大似然估
计,并求出估计值.
参考数据: .
【答案】(1) ;(2)① ;②答案见解析, .
【分析】(1)易知随机变量 服从二项分布,由 ,得 ,数学期望 即可
求解;
(2)①设 ,依题意得
化简即可;②记
,求导分析单调性可得最大值,分别在团体A,B中
提出函数模型即可得答案.
【详解】解:(1)由题知,随机变量 服从二项分布, ,
由 ,得 , .
(2)① ,
,
.
②记 ,则 ,
当 时, , 单增;
当 时, , 单减;
当 时, 取得最大值,即 取得最大值.
在团体 提出的函数模型 中,
记函数 , ,
当 时, , 单增;
当 时, , 单减.
当 时, 取得最大值 ,则 不可以估计.
在团体 提出的函数模型 中,记函数 , 单调递增,
令 ,解得 ,
则 是 的最大似然估计.
2.(2021·全国·模拟预测)某中医药研究所研制出一种新型抗过敏药物,服用后需要检验血液抗体是否
为阳性,现有n(n N*)份血液样本,每个样本取到的可能性均等,有以下两种检验方式:①逐份检
验,需要检验n次;②混合检验,将其中k(k N*,2≤k≤n)份血液样本分别取样混合在一起检验,若结
果为阴性,则这k份∈的血液全为阴性,因而这k份血液样本只需检验一次就够了,若检验结果为阳性,为
了明确这k份血液究竟哪份为阳性,就需要对这∈k份再逐份检验,此时这k份血液的检验次数总共为k+1
次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是
阳性的概率为p(0<p<1).
(1)假设有5份血液样本,其中只有两份样本为阳性,若采取逐份检验的方式,求恰好经过3次检验就
能把阳性样本全部检验出来的概率.
(2)现取其中的k(k N*,2≤k≤n)份血液样本,采用逐份检验的方式,样本需要检验的次数记为ξ1 ;采
用混合检验的方式,样本需要检验的总次数记为ξ2.
∈
(i)若k=4,且 ,试运用概率与统计的知识,求p的值;
(ii)若 ,证明: .
【答案】(1) ;(2)(i) ;(ii)证明见解析.
【分析】(1)设恰好经过3次检验就能把阳性样本全部检验出来为事件A,由古典概型概率计算公式可
得答案;
(2)(i)由已知 , 可能取值分别为1, ,求解概率然后求期望推出 关于 的关系式;
(ii)由 ,计算出 ,再由 ,构造函数
,利用导数判断函数的最值可得答案..
【详解】(1)设恰好经过3次检验就能把阳性样本全部检验出来为事件A,
所以前2次检验中有一阳性有一阴性样本第三次为阳性样本,或者前3次均为阴性样本,
则 .
(2)(i) ,所以 , 可能取值分别为1, ,
,
,因为 得 ,因为
,
所以 , .
(ii)因为 ,由(i)知 ,所以 ,
设 , ,
所以 在 单调递增,所以
由于 ,所以 ,即 ,得证.
3.(2020·河南开封·二模)某中医药研究所研制出一种新型抗癌药物,服用后需要检验血液是否为阳性,现有 份血液样本每个样本取到的可能性均等,有以下两种检验方式:(1)逐份检验,则需
要检验 次;(2)混合检验,将其中 份血液样本分别取样混合在一起检验,若结果为
阴性,则这 份的血液全为阴性,因而这 份血液样本只需检验一次就够了;若检验结果为阳性,为了明
确这 份血液究竟哪份为阳性,就需要对这 份再逐份检验,此时这 份血液的检验次数总共为 次假
设在接受检验的血液样本中,每份样本的检验结果总阳性还是阴性都是相互独立的,且每份样本是阳性的
概率为 .
(1)假设有6份血液样本,其中只有两份样本为阳性,若采取逐份检验的方式,求恰好经过两次检验就
能把阳性样本全部检验出来的概率.
(2)现取其中的 份血液样本,记采用逐份检验的方式,样本需要检验的次数为 ;采
用混合检验的方式,样本简要检验的总次数为 ;
(ⅰ)若 ,试运用概率与统计的知识,求 关于 的函数关系 ,
(ⅱ)若 ,采用混合检验的方式需要检验的总次数的期望比逐份检验的总次数的期望少,求
的最大值( , , , , , )
【答案】(1) (2)(ⅰ) .(ⅱ)8
【分析】(1)利用古典概型的概率求出恰好经过两次检验就能把阳性样本全部检验出来的概率;
(2)(ⅰ)先求出 ,再化简 即得解;(ⅱ)由 ,得到 ,再利用导
数解不等式得解.
【详解】(1)设“恰好经过两次检验就能把阳性样本全部检验出来”为事件 ,则
,
即恰好经过两次检验就能把阳性样本全部检验出来的事件的概率为 .
(2)(ⅰ)由题意知 , 取值的可能有1, , ,
,
所以 ,
由 ,得 ,即 ,所以 ,
所以 关于 的函数关系 .
(ⅱ)由题意知, ,所以 ,即 ,
所以 ,又 ,所以 ,两边同时取对数,得 ,即 ,
设 ,则 ,易知函数 在 上单调递减,
, ,
所以 的最大值为8.
4.(21-22高二下·安徽芜湖·期中)某单位为患病员工集体筛查新型流感病毒,需要去某医院检验血液是
否为阳性,现有 份血液样本,有以下两种检验方案,方案一:逐份检验,则需要检验k
次;方案二:混合检验,将k份血液样本分别取样混合在一起检验一次,若检验结果为阴性,则k份血液
样本均为阴性,若检验结果为阳性,为了确定k份血液中的阳性血液样本,则对k份血液样本再逐一检验逐份检验和混合检验中的每一次检验费用都是 元,且k份血液样本混合检验一次需要额外收
元的材料费和服务费.假设在接受检验的血液样本中,每份样本是否为阳性是相互独立的,且据统计每份
血液样本是阳性的概率为 .
(1)假设有5份血液样本,其中只有2份样本为阳性,若采用逐份检验的方式,求恰好经过3次检验就能把
阳性样本全部检验出来的概率.
(2)若 份血液样本采用混合检验方案,需要检验的总次数为X,求X分布列及数学期望;
(3)①若 ,以检验总费用为决策依据,试说明该单位选择方案二的合理性;
②若 ,采用方案二总费用的数学期望低于方案一,求k的最大值.
参考数据:
【答案】(1) (2)分布列见解析, (3)11
【分析】(1)恰好经过3次检验就能把阳性样本全部检验出来,说明3次检测可能是阴阴阴,阴阳阳,阳
阴阴,分类求解.
(2)要么一次,要么 次.即可求解.
(3)①求出方案一和二的费用,进行比较大小,即可求解
②由①可知两种方案的费用,代入次数10,即可得到费用差的式子,构造成一个连续函数,利用导数处
理单调性,进而代入次数值逐一验证得最大次数.
【详解】(1)记恰好经过3次检验就能把阳性样本全部检验出来为A事件,则
.
(2)X的可能值为1和 , ,
所以随机变量X的分布列为:
X 1
P
所以
(3)①设方案二的总费用的数学期望为 ,方案一总费用为Z,
所以方案二总费用的数学期望为:
,又 ,所以
,又方案一的总费用为 ,
所以 ,当 时. ,
,又 ,所以 ,所以该单位选择方案二合理.
②由①知方案二总费用的数学期望 ,
当 时, ,又方案一的总费用为 ,
令 得: ,所以 ,即 ,
即 ,所以 ,设 ,所以 ,令 得 得 ,
所以 在区间 上单调递增,在区间 上单调递减,
,
,
, ,
,
,
所以k的最大值为11.
题型十四:新高考分布列型第 19 题
1.(2020·山东德州·一模)医院为筛查某种疾病,需要血检,现有 份血液样本,有以下两种检
验方式:
方式一:逐份检验,需要检验 次;
方式二:混合检验,把每个人的血样分成两份,取 个人的血样各一份混在一起进行检验,如果结
果是阴性,那么对这 个人只作一次检验就够了;如果结果是阳性,那么再对这 个人的另一份血样逐份
检验,此时这 份血液的检验次数总共为 次.
(1)假设有6份血液样本,其中只有2份样本为阳性,若采用逐份检验的方式,求恰好经过3次检验就
能把阳性样本全部检验出来的概率;
(2)假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本
是阳性结果的概率为 .现取其中 ( 且 )份血液样本,记采用逐份检验方式,样本
需要检验的总次数为 ,采用混合检验方式,样本需要检验的总次数为 .
①运用概率统计的知识,若 ,试求 关于 的函数关系式 ;
②若 ,且采用混合检验方式可以使得样本需要检验的总次数的期望值比逐份检验的总次数期望
值更少,求 的最大值.
参考数据: , , .【答案】(1) (2)① ② 的最大值为12.
【解析】(1)记恰好经过3次检验就能把阳性样本全部检验出来为 事件,计算概率得到答案.
(2)①计算 , ,根据 ,计算得到答案.
② ,所以 ,设 ,求导得到单调区间,计算得到最值.
【详解】(1)记恰好经过3次检验就能把阳性样本全部检验出来为 事件,
则 .
(2)① 的取值为 , ,所以 ,
的取值为1, ,计算 , ,
所以 ,
由 ,得 ,所以 .
② , ,所以 ,即 .
设 , , ,
当 时, , 在 上单调递增;
当 时, , 在 上单调递减.
且 , ,所以 的最大值为12.
2.(2020·湖南湘潭·三模)冠状病毒是一个大型病毒家族,已知可引起感冒以及中东呼吸综合征
和严重急性呼吸综合征 等较严重疾病.而今年初出现并在全球蔓延的新型冠状病毒
是以前从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳
嗽、气促和呼吸困难等.在较严重病例中感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.
某药物研究所为筛查该种病毒,需要检验血液是否为阳性,现有 ( ,且 )份血液样本,每个
样本取到的可能性相等,有以下两种检验方式:
方式一:逐份检验则需要检验 次;
方式二:混合检验,将 份血液样本分别取样混合在一起检验,若检验结果为阴性,则这 份的血液全为
阴性,因而这 份血液样本只要检验一次就够了;如果检验结果为阳性,为了明确这 份血液究竟哪几份
为阳性,就要对这 份再逐份检验,此时这 份血液的检验次数总共为 次.假设在接受检验的血液样
本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为 .
(1)假设有6份血液样本,其中只有2份样本为阳性,从中任取3份样本进行医学研究,求至少有1份
为阳性样本的概率;
(2)假设将 ( 且 )份血液样本进行检验,记采用逐份检验方式,样本需要检验的总次数为
,采用混合检验方式,样本需要检验的总次数为 ;
①运用概率统计的知识,若 ,试求 关于 的函数关系式 ;
②若 与干扰素计量 相关,其中数列 满足 ,当 时,试讨论采用何种检
验方式更好?
参考数据: .
【答案】(1) (2)① ( 且 ).②当 时采用混合检验方式,
且 时采用逐份检验方式.
【分析】(1)利用古典概型的概率求至少有1份为阳性样本的概率;(2)①由题得 ,根据 得到 ;②先求出 ,当
时,得到不等式 的解,即得当 时采用混合检验方式, 且 时
采用逐份检验方式.
【详解】(1)由古典概型的概率公式得 .
(2)①由已知,得 ; 的所有可能取值为1, ,
.
.
若 ,则 , .
类于 的函数关系式为 ( 且 ).
②由已知得 ,数列 是等比数列,且
,当 时,有 ,
得 .设 ,
当 时, ,即 在 上单调减.又 ;
∴
当 时, 且 时
.当 时采用混合检验方式, 且 时采用逐份检验方式.
3.(2024·湖北·模拟预测)如图:一张 的棋盘,横行编号 :竖排编号 .一颗棋子目前位于
棋盘的 处,它的移动规则是:每次移动到与自身所在格不相邻的异色格中.例如该棋子第一次移动可
以从 移动到 或 .棋子每次移动到不同目的地间的概率均为 .
(1)①列举两次移动后,该棋子所有可能的位置.
②假设棋子两次移动后,最终停留到第1,2,3行时,分别能获得 分,设得分为 ,求 的分布列
和数学期望.
(2)现在于棋盘左下角 处加入一颗棋子,他们运动规则相同,并且每次移动同时行动.移动 次后,两
棋子位于同一格的概率为 ,求 的通项公式.
【答案】(1)① , , ;②分布列见解析; .(2)【分析】(1)列出所有两次移动的路径,求出其概率,根据得分规则,可得 的分布列,并求期望.
(2)先探讨棋子的运动轨迹,记两棋子之间的距离为 ,明确 的值,求出对应的概率,设 “ 回合
后, 的概率”, “ 回合后, 的概率”, “ 回合后, 的概率”,列出 , , 之
间的关系,可求 .
【详解】(1)①两次移动的所有路径可能如下:
; ; ; .
所以两次移动后,该棋子所有可能的位置有: , , .
②棋子两次移动后,最终停留在 时,得1分,对应概率为: ;
棋子两次移动后,最终停留在 时,得1分,对应概率为: ;
棋子两次移动后,最终停留在 时,得3分,对应概率为: .
所以 , .所以最终得分 的分布列为:
1 3
所以 .
(2)将棋盘按如图所示编号:
将棋子可以去的区域用箭头连接起来,若从3可以连接到4或8,记做 ;从8可以连接3或1,记
做 ;然后将它们串联起来: .依次类推,可以串联处环状回路:
,如下图所示:
则棋子等价于在这个环状回路中运动.
问题(2)可以转化为将两个棋子放在环状回路中的3号、7号位置,每回合3号、7号棋子有四种运动模
式:(顺,顺),(顺,逆),(逆,顺),(逆,逆),发生概率均为 .
为了转化问题,现规定: “两棋子之间的最短节点数”,例如:特别规定两棋子重合时, .并统计四种运动模式下 会如何变化.
假设3号棋子顺时针走过 个节点可以与7号棋子重合;或逆时针走过 个节点也可以与之重合.
为了简化问题,不妨假设 ,于是有下表:
(逆,
(顺,顺) (顺,逆) (逆,逆)
顺)
设 “ 回合后, 的概率”, “ 回合后, 的概率”, “ 回合后, 的概率”,
则有: ,所以 ,
显然: , ,所以 ,所以 .
4.(2024·江西新余·模拟预测)生命的诞生与流逝是一个永恒的话题,就某种细胞而言,由该种细胞的
一个个体进行分裂,分裂后成为新细胞而原细胞不复存在,多次分裂后,由该个细胞繁殖而来的全部细胞
均死亡,我们称该细胞“灭绝”.现已知某种细胞有 的概率分裂为 个细胞(即死亡),...,有 的概率
分裂为 个细胞.记事件 :细胞最终灭绝, :细胞第一次分裂为 个细胞.记该细胞第一次分裂后有
个个体(分裂后的细胞互不影响),在概率论中,我们用 的数学期望 作为衡量生物灭绝可能性的依
据,如果 ,则在理论上细胞就不会灭绝;相反,如果 ,则理论上我们认为细胞在足够多代
的繁殖后会灭绝,而这两种情况在生物界中都是普遍存在的.
(1)直接写出 的数学期望 .
(2)用只含 和 的概率式表示 并证明该细胞灭绝的概率为关于 方程: 的最小正实根.
(3)若某种细胞发生基因突变,当 时 .
(ⅰ)若当其分裂为两个细胞后,有一个细胞具有与原细胞相同的活力,而另一细胞则在此后丧失分裂为
两个的能力(即只有可能分裂成 个或 个),求证:该细胞的灭绝是必然事件.
(ⅱ)受某种辐射污染,若当其分裂为两个细胞后分裂生成的两个细胞此后均丧失分裂为 个的能力,并
等可能分裂为 个或 个细胞.我们称为“泛滥型细胞”,已知: ,求出一个该种泛滥型
细胞经过 次分裂,得到 个细胞的概率 .
【答案】(1) (2), ,证明见解析(3)(ⅰ)证明见解析;(ⅱ)
【分析】(1)对于求随机变量的数学期望,根据数学期望的定义,是各个取值与其对应概率乘积的和.
(2)在求事件A的概率表示时,需要用到全概率公式.对于证明灭绝概率是方程的根,要根据条件逐步推
导.
(3)对于证明细胞灭绝是必然事件,要根据新的分裂规则求出新的数学期望并判断.求经过n次分裂得到
3个细胞的概率,需要根据分裂规则建立递推关系求解.
【详解】(1) .
(2) ,
则: ,
,由于分裂后细胞相互独立,
. ,
所以: .
若 能取到 中的所有数,则令: ,有: ,
为该方程的一个实根, . ,
由于 的每一项在 上均单调递增,故 单调递增, .
由于 ,则:①当 时, 单调递减, , ,故在
, 只有唯一零点 ,
这是原方程的最小正实根,符合 的实际意义;
②当 时, ,故 唯一 使 ,
此时 在 单调递减,在 单调递增且 .
所以在 有两个零点 与 ,其中: .由于 ,
故 ,故 ,此时也取到原方程的最小正实根,符合 的实际意义.
综上:该细胞灭绝的概率为关于 方程: 的最小正实根.
(3)(ⅰ)由(2)可知:若一个细胞失去分裂为两个的能力,则灭绝概率
,
故对该细胞母体: ,
,解得: ,该细胞的灭绝是必然事件.
(ⅱ)由条件: ,
,
.
题型十五:分布列综合
1.(24-25高三上·云南昆明·阶段练习)设 ,数对 按如下方式生成: ,抛掷一
枚均匀的硬币,当硬币的正面朝上时,若 ,则 ,否则;当硬币的反面朝上时,若 ,则 ,否则
.抛掷n次硬币
后,记 的概率为 .
(1)写出 的所有可能情况,并求 ;
(2)证明: 是等比数列,并求 ;
(3)设抛掷n次硬币后 的期望为 ,求 .
【答案】(1)答案见详解;(2)证明见详解, ;(3)
【分析】(1)列出所有 和 的情况,再利用古典概型公式计算即可;
(2)构造得 ,再利用等比数列公式即可;
(3)由(2)得 ,再分 , 和 讨论即可.
【详解】(1)当抛掷一次硬币结果为正时, ;
当抛掷一次硬币结果为反时, .
当抛掷两次硬币结果为(正,正)时, ;
当抛掷两次硬币结果为(正,反)时, ;
当抛掷两次硬币结果为(反,正)时, ;
当抛掷两次硬币结果为(反,反)时, .
所以, .
(2)由题知, ,
当 ,且掷出反面时,有 ,此时 ,
当 ,且掷出正面时,有 ,此时 ,
所以 ,
所以 ,所以 是以 为首项, 为公比的等比数列,
所以 ,所以 .
(3)设 与 的概率均为 ,由(2)知,
显然, .若 ,则 ,当下次投掷硬币为正面朝上时, ,当下
次投掷硬币为反面朝上时, ;
若 ,则当下次投掷硬币为正面朝上时, ,当下次投掷硬币为反面朝上时, ;
若 ,则 ,
当下次投掷硬币为正面朝上时, ,当下次投掷硬币为反面朝上时, .
所以 时,期望不变,概率为 ;时,期望加1,概率为 .
所以 .
故
.经检验,当 时也成立. .
2.(24-25高三上·福建福州·开学考试)有2n朵花围绕在一个圆形花圃周围,现要将其两两配对绑上缎带
作为装饰,缎带之间互不交叉,例如: 时,共有4朵花,以1、2、3、4表示,绑上缎带的两朵用一
条线连接,共有2种方式,如图1、2所示.
(1)当 时,求满足要求的绑缎带方法总数;
(2)已知满足要求的每一种绑法出现的概率都相等,如 时,出现图1和图2所示方法的概率均为 .
记一次绑法中,共有Y对相邻的两朵花绑在一起,
(i)当 时,求Y的分布列和期望;
(ii)已知:对任意随机变量 ( ,2,…,m, ),有 .记满足条件的绑
缎带方法总数为 ,Y的期望为 .求 (用n和 表示).
【答案】(1)5(2)答案见解析
【分析】(1)给6朵花合适代号,再分三类讨论即可;
(2)(i)分类讨论出所有合适情况,再按步骤列出其分布列计算其期望即可;
(ii)分 和 讨论即可.
【详解】(1)当 时,有6朵花围绕在一个圆形花圃周围. 以1、2、3、4、5、6表示,
由题意可知,满足要求的绑缎带方法,任意一条缎带绑后,其同侧不能剩余奇数个点,故1必不与奇数
3、5配对.
按花朵1的配对情况,分为三类:
①1与2配对:另4朵3、4、5、6的配对情况,同 时共有4朵花的配对方法数相同,
故有2种方法;
②1与6配对:由对称性可知同1与2配对的方法数,故有2种方法;
③1与4配对:2必与3配对,6必与5配对,故只有1种方法.
综上,完成这件事的方法数共有 种方法,
列举如下:
(12)(34)(56);(12)(36)(45);(16)(23)(45);(16)(25)(34);(14)
(23)(56).
即满足要求的绑缎带方法总数为5.
(2)(i)当 时,有8朵花围绕在一个圆形花圃周围. 以1、2、3、4、5、6、7、8表示,由题意可知,满足要求的绑缎带方法,任意一条缎带绑后,其同侧不能剩余奇数个点,故1不能与3、
5、7
配对.故按花朵1的配对情况,可分为两类:
①12或18配对:
若12配对,则另6朵3、4、5、6、7、8的配对情况,
同 时共有6朵花的配对方法数相同,故有5种方法;
若18配对,由对称性可知与12配对方法相同,故也有5种方法;
故有 种方法;
②14或16配对:由对称性,这两类配对方法也相同.
不妨设14配对,由题意,23必配对.而另外5、6、7、8的配对情况,即同 时共有4朵花的配对方法
数,有2种方法;故有 种方法;
综上,完成这件事的方法数共有 种方法.已知满足要求的每一种绑法出现的概率都相等,则每一
种方法的概率均为 ,记一次绑法中,共有Y对相邻的两朵花绑在一起,14种方法中 的有
种方法; 的有 种; 的有 种;
则Y的所有可能值为 , ; ; .
故Y的分布列为:
2 3 4
,故Y的期望为 .
(ii)当 时,显然有 ,此时 ,
当 时,若第 朵花与相邻花相连,记随机变量 ,则
若第 朵花不与相邻花相连,记随机变量 ,则由于有 对相邻的两朵花,则 则
综上所述, .
3.(23-24高二下·湖南郴州·期末)材料一:在伯努利试验中,记每次试验中事件 发生的概率为 ,试
验进行到事件 第一次发生时停止,此时所进行的试验次数为 ,其分布列为
,我们称 服从几何分布,记为 .
材料二:求无穷数列的所有项的和,如求 ,没有办法把所有项真的加完,
可以先求数列前 项和 ,再求 时 的极限:
根据以上材料,我们重复抛掷一颗均匀的骰子,直到第一次出现“6点”时停止.设停止时抛掷骰子的次数为
随机变量 .
(1)证明: ;
(2)求随机变量 的数学期望 ;
(3)求随机变量 的方差 .
【答案】(1)证明见解析(2) (3)
【分析】(1)依题意可得 ,根据等比数列求和公式求出 ,再取极限即可;
(2)设 ,利用错位相减法求出 ,再取极限即可;
(3)依题意可得 ,再利用错位相减法求出
,即可得解.
【详解】(1)可知 ,且 ,
所以 ,
则 .
(2)设 ,所以 ,
两式相减的 ,
所以 ,
则随机变量 的数学期望 ;
(3)因为
,
而 ,
,
两式相减:
,从而 ,
那么 .
4.(2024·湖北武汉·模拟预测)泊松分布是一种重要的离散型分布,用于描述稀有事件的发生情况.如果
随机变量 的所有可能取值为0,1,2…,且 , 其中 ,则称 服从泊
松分布,记作 .
(1)设 ,且 ,求 ;
(2)已知当 , 时,可以用泊松分布 近似二项分布 ,即对于 ,
,当 不太大时,有 .
(ⅰ)已知甲地区共有100000户居民,每户居民每天有0.00010的概率需要一名水电工.试估计某天需要
至少2名水电工的概率;
(ⅱ)在(ⅰ)的基础上,已知乙地区共有200000户居民,每户居民每天有0.00004的概率需要一名水
电工.试估计某天两个地区一起至少需要3名水电工的概率.
【答案】(1) (2)(ⅰ) ;(ⅱ) .
【分析】(1)理解概率公式,就能用待定系数法先求出 ,再求出指定概率;(2)(ⅰ)理解泊松分布中的 ,从而再运用公式计算对应事件概率,转化为对立事件来研究即
可;
(ⅱ)先了解两个独立事件,同时发生总共需要水电工人数,运用积事件求和:即
,这里运用到二项式展开式定理,最后再用对立事件即可解得.
【详解】(1)由 得 ,且 ,解得 .
故 .
(2)(ⅰ)设 为甲地区某天需要的水电工数目,则 ,且 .
因为 , , ,
所以 .那么,某天至少需要2名水电工的概率约为
(ⅱ)设 为乙地区某天需要的水电工数目,则 ,且 .
因为 , , ,
所以 .于是
.
那么,某天两个地区一起至少需要3名水电工的概率约为
.