文档内容
重难点突破 03 高等背景下概率论新定义
目录
01 方法技巧与总结...............................................................................................................................2
02 题型归纳与总结...............................................................................................................................2
题型一:切比雪夫不等式....................................................................................................................2
题型二:马尔科夫链............................................................................................................................6
题型三:卡特兰数..............................................................................................................................12
题型四:概率密度函数......................................................................................................................17
题型五:二维离散型随机变量..........................................................................................................20
题型六:多项式拟合函数..................................................................................................................26
题型七:最大似然估算与大数定律..................................................................................................29
03 过关测试.........................................................................................................................................35在高等背景下,概率论的新定义涉及更复杂的数学模型和理论框架。方法技巧上,需深入理解随机变
量及其分布、多维随机变量及其相关性,以及大数定律和中心极限定理等核心概念。同时,掌握切比雪夫
不等式、马尔科夫链、卡特兰数等高级概率工具也至关重要。
技巧上,要善于运用概率论知识简化复杂问题的求解过程,如利用概率分布特性减少计算量,或通过
构建概率模型直观理解问题。此外,结合实际问题背景,灵活运用条件概率、贝叶斯公式等也是解题的关
键。
总结来说,高等背景下概率论的新定义强调理论深度与应用广度,要求学习者不仅掌握基础知识,还
需具备灵活运用高级概率工具解决复杂问题的能力。通过不断学习与实践,可以逐步深化对概率论的理解,
提升解题技巧与效率。
题型一:切比雪夫不等式
【典例1-1】(2024·辽宁沈阳·模拟预测)切比雪夫不等式是19世纪俄国数学家切比雪夫
(1821.5~1894.12)在研究统计规律时发现的,其内容是:对于任一随机变量 ,若其数学期望 和方
差 均存在,则对任意正实数 ,有 .根据该不等式可以对事件
的概率作出估计.在数字通信中,信号是由数字“0”和“1”组成的序列,现连续发射信号 次,
每次发射信号“0”和“1”是等可能的.记发射信号“1”的次数为随机变量 ,为了至少有 的把握使发射
信号“1”的频率在区间 内,估计信号发射次数 的值至少为 .
【答案】1250
【解析】由题意知 ,所以 , ,
若 ,则 ,
即 ,即 ,
由切比雪夫不等式 知,要使得至少有98%的把握使发射信号“1”的频率在区间 内,
则 ,解 ,
所以估计信号发射次数n的最小值为1250.
故答案为:1250
【典例1-2】19世纪俄国数学家切比雪夫在研究统计的规律中,论证并用标准差表达了一个不等式,该不
等式被称为切比雪夫不等式,它可以使人们在随机变量 的分布未知的情况下,对事件 做出估
计.若随机变量 具有数学期望 ,方差 ,则切比雪夫定理可以概括为:对任意正数 ,不
等式 成立.已知在某通信设备中,信号是由密文“ ”和“ ”组成的序列,现连续
发射信号 次,记发射信号“ ”的次数为 .
(1)若每次发射信号“ ”和“ ”的可能性是相等的,
①当 时,求 ;
②为了至少有 的把握使发射信号“ ”的频率在 与 之间,试估计信号发射次数 的最小值;
(2)若每次发射信号“ ”和“ ”的可能性是 ,已知在2024次发射中,信号“ ”发射 次的概率最
大,求 的值.
【解析】(1)①由题意 ,
所以 .
;
②由题意 ,则 , ,
若 ,则 ,
所以 ,
又 ,解得 ,即发射次数至少为 次.
(2)依题意 ,
则 ,
,,解得 ,
,解得 ,
又 ,所以当 时, 最大.
【变式1-1】(2024·吉林长春·模拟预测)概率论中有很多经典的不等式,其中最著名的两个当属由两位俄
国数学家马尔科夫和切比雪夫分别提出的马尔科夫(Markov)不等式和切比雪夫(Chebyshev)不等式.
马尔科夫不等式的形式如下:
设 为一个非负随机变量,其数学期望为 ,则对任意 ,均有 ,
马尔科夫不等式给出了随机变量取值不小于某正数的概率上界,阐释了随机变量尾部取值概率与其数学期
望间的关系.当 为非负离散型随机变量时,马尔科夫不等式的证明如下:
设 的分布列为 其中 ,则对任意
, ,其中符号 表示对所有满足 的
指标 所对应的 求和.
切比雪夫不等式的形式如下:
设随机变量 的期望为 ,方差为 ,则对任意 ,均有
(1)根据以上参考资料,证明切比雪夫不等式对离散型随机变量 成立.
(2)某药企研制出一种新药,宣称对治疗某种疾病的有效率为 .现随机选择了100名患者,经过使用该
药治疗后,治愈的人数为60人,请结合切比雪夫不等式通过计算说明药厂的宣传内容是否真实可信.
【解析】(1)法一:对非负离散型随机变量 及正数 使用马尔科夫不等式,
有 .
法二:设 的分布列为其中 ,记 ,则对任意 ,
.
(2)设在100名患者中治愈的人数为 .假设药企关于此新药有效率的宣传内容是客观真实的,
那么在此假设下, .
由切比雪夫不等式,有 .
即在假设下,100名患者中治愈人数不超过60人的概率不超过0.04,此概率很小,
据此我们有理由推断药厂的宣传内容不可信.
【变式1-2】(2024·浙江·二模)某工厂生产某种元件,其质量按测试指标划分为:指标大于或等于82为
合格品,小于82为次品,现抽取这种元件100件进行检测,检测结果统计如下表:
测试指标
元件数
12 18 36 30 4
(件)
(1)现从这100件样品中随机抽取2件,若其中一件为合格品,求另一件也为合格品的概率;
(2)关于随机变量,俄国数学家切比雪夫提出切比雪夫不等式:
若随机变量X具有数学期望 ,方差 ,则对任意正数 ,均有 成立.
(i)若 ,证明: ;
(ii)利用该结论表示即使分布未知,随机变量的取值范围落在期望左右的一定范围内的概率是有界的.若
该工厂声称本厂元件合格率为90%,那么根据所给样本数据,请结合“切比雪夫不等式”说明该工厂所提
供的合格率是否可信?(注:当随机事件A发生的概率小于0.05时,可称事件A为小概率事件)
【解析】(1)记事件 为抽到一件合格品,事件 为抽到两个合格品,
(2)(i)由题:若 ,则
又
所以 或由切比雪夫不等式可知,
所以 ;
(ii)设随机抽取100件产品中合格品的件数为 ,
假设厂家关于产品合格率为 的说法成立,则 ,
所以 ,
由切比雪夫不等式知, ,
即在假设下100个元件中合格品为70个的概率不超过0.0225,此概率极小,由小概率原理可知,一般来说
在一次试验中是不会发生的,据此我们有理由推断工厂的合格率不可信.
题型二:马尔科夫链
【典例2-1】(2024·高三·广东·开学考试)马尔科夫链因俄国数学家安德烈・马尔科夫得名,其过程具备
“无记忆”的性质,即第 次状态的概率分布只跟第 次的状态有关,与第 次状态无
关.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处
理、金融领域、天气预测等方面都有着极其广泛的应用.现有 两个盒子,各装有2个黑球和1个红球,
现从 两个盒子中各任取一个球交换放入另一个盒子,重复进行 次这样的操作后,记 盒子中
红球的个数为 ,恰有1个红球的概率为 .
(1)求 的值;
(2)求 的值(用 表示);
(3)求证: 的数学期望 为定值.
【解析】(1)设第 次操作后 盒子中恰有2个红球的概率为 ,则没有红球的概率为 .
由题意知 ,
(2)因为 .所以 .
又因为 ,所以 是以 为首项, 为公比的等比数列.
所以 ,
(3)因为 ,①
②
所以①一②,得 .
又因为 ,所以 ,所以 .
的可能取值是 ,
所以 的概率分布列为
0 1 2
所以 .
所以 的数学期望 为定值1.
【典例2-2】马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、
自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态
是…… ,…,那么 时刻的状态的条件概率仅依赖前一状态 ,即
.
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为 ,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为 ,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束
赌博游戏:记赌徒的本金为 一种是赌金达到预期的B元,赌徒停止赌博;另一种是赌徒输
光本金后,赌徒可以向赌场借钱,最多借A元,再次输光后赌场不再借钱给赌徒.赌博过程如图的数轴所
示.
当赌徒手中有n元 时,最终欠债A元(可以记为该赌徒手中有 元)概率为 ,请
回答下列问题:
(1)请直接写出 与 的数值.
(2)证明 是一个等差数列,并写出公差d.
(3)当 时,分别计算 时, 的数值,论述当B持续增大时, 的统计含义.
【解析】(1)当 时,赌徒已经欠债 元,因此 .
当 时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率 ;
(2)记 赌徒有n元最后输光的事件, 赌徒有n元上一场赢的事件,
,即 ,
所以 ,
所以 是一个等差数列,
设 ,则 ,
累加得 ,故 ,得 ;
(3) ,由(2) ,
代入 可得 ,即 ,
当 时, ,当 时, ,
当B增大时, 也会增大,即输光欠债的可能性越大,因此可知久赌无赢家,
即便是一个这样看似公平的游戏,只要赌徒一直玩下去就会 的概率输光并负债.
【变式2-1】马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,为状态空间中
经过从一个状态到另一个状态的转换的随机过程.该过程要求具备“无记忆”的性质:下一状态的概率分
布只能由当前状态决定,在时间序列中它前面的事件均与之无关.甲、乙两口袋中各装有1个黑球和2个
白球,现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复进行 次这样的操作,记口袋甲中黑球的个数为 ,恰有1个黑球的概率为 .
(1)求 的值;
(2)求 的值(用 表示);
(3)求证: 的数学期望 为定值.
【解析】(1)设恰有2个黑球的概率为 ,则恰有0个黑球的概率为 .
由题意知 , ,
所以 .
(2)因为 ,
所以 .
又因为 ,所以 是以 为首项, 为公比的等比数列.
所以 , .
(3)因为 ①,
②.
所以① ②,得 .
又因为 ,所以 .所以 .
所以 的概率分布列为:
0 1 2
p
所以 .
所以 的数学期望 为定值1.
【变式2-2】(2024·高三·江西·开学考试)马尔科夫链是概率统计中的一个重要模型,其过程具备“无记
忆”的性质:下一状态的概率分布只能由当前状态决定,即第n+1次状态的概率分布只与第n次的状态有关,与第 ,…次的状态无关,即 .已知甲盒中装有1
个白球和2个黑球,乙盒中装有2个白球,现从甲、乙两个盒中各任取1个球交换放入对方的盒中,重复n
次( )这样的操作,记此时甲盒中白球的个数为 ,甲盒中恰有2个白球的概率为 ,恰有1个
白球的概率为 .
(1)求 和 .
(2)证明: 为等比数列.
(3)求 的数学期望(用n表示).
【解析】(1)若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,
概率 ;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率 ,
研究第2次交换球时的概率,根据第1次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为 ,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为 ;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为 ;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为
;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为
,
②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为 ,
此时,若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,
乙盒中的球变为1白1黑,概率为
若甲盒取白球,乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率为
,
综上, .(2)依题意,经过 次这样的操作,甲盒中恰有2个白球的概率为 ,
恰有1个白球的概率为 ,则甲盒中恰有3个白球的概率为 ,
研究第 次交换球时的概率,根据第 次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为 ,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为 ;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为
;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为
;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为
,
②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为 ,
此时,若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,概率
为 ;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率为
,
③当甲盒中的球为3白,乙盒中的球为2黑时,对应概率为 ,
此时,甲盒只能取白球、乙盒只能取黑球,互换,则甲盒中的球变为2白1黑,
乙盒中的球变为1白1黑,概率为 ,
综上,
则 ,
整理得 ,又 ,
所以数列 是公比为 的等比数列.
(3)由(2)知 ,则 ,随机变量 的分布列为
1 2 3
所以 .
题型三:卡特兰数
【典例3-1】清代数学家明安图所著《割圆密率捷法》中比西方更早提到了“卡特兰数”(以比利时数学
家欧仁・查理・卡特兰的名字命名).有如下问题:在 的格子中,从左下角出发走到右上角,每一步只能
往上或往右走一格,且走的过程中只能在左下角与右上角的连线的右下方(不能穿过,但可以到达该连
线),则共有多少种不同的走法?此问题的结果即卡特兰数 .如图,现有 的格子,每一步只
能往上或往右走一格,则从左下角 走到右上角 共有 种不同的走法;若要求从左下角 走到右上角
的过程中只能在直线 的右下方,但可以到达直线 ,则有 种不同的走法.
【答案】 35 14
【解析】
从左下角 走到右上角 共需要7步,其中3步向上,4步向右,
故只需确定哪3步向上走即可,共有 种不同的走法;
若要求从左下角 走到右上角 的过程中只能在直线 的右下方(不能穿过,但可以到达该连线),
则由卡特兰数可知共有 种不同的走法,
又到达右上角 必须最后经过 ,所以满足题目条件的走法种数也是14.
故答案为:35;14
【典例3-2】(2024·湖北·二模)五一小长假到来,多地迎来旅游高峰期,各大旅游景点都推出了种种新奇活动以吸引游客,小明去成都某熊猫基地游玩时,发现了一个趣味游戏,游戏规则为:在一个足够长的直
线轨道的中心处有一个会走路的机器人,游客可以设定机器人总共行走的步数,机器人每一步会随机选择
向前行走或向后行走,且每一步的距离均相等,若机器人走完这些步数后,恰好回到初始位置,则视为胜
利.
(1)若小明设定机器人一共行走4步,记机器人的最终位置与初始位置的距离为 步,求 的分布列和期
望;
(2)记 为设定机器人一共行走 步时游戏胜利的概率,求 ,并判断当 为何值时,游戏胜利的
概率最大;
(3)该基地临时修改了游戏规则,要求机器人走完设定的步数后,恰好第一次回到初始位置,才视为胜利.小
明发现,利用现有的知识无法推断设定多少步时获得胜利的概率最大,于是求助正在读大学的哥哥,哥哥
告诉他,“卡特兰数”可以帮助他解决上面的疑惑:将 个0和 个1排成一排,若对任意的 ,
在前 个数中,0的个数都不少于1的个数,则满足条件的排列方式共有 种,其中, 的
结果被称为卡特兰数.若记 为设定机器人行走 步时恰好第一次回到初始位置的概率,证明:对(2)中
的 ,有
【解析】(1)依题可知, 的可能取值为 .
, , ,
所以, 的分布列如下:
0 2 4
所以, .
(2)依题可知 , 时, ,所以 时胜利的概率最大.
(3)记事件 “机器人行走 步时恰好第一次回到初始位置”, “机器人第一步向前行走”,则
“机器人第一步向后行走”.
下面我们对事件 进行分析.
发生时,假设机器人第 步是向前行走,则之前的 步机器人向前走的步数比向后走少一步,而因
为机器人第一步为向前行走,
这说明存在 使得机器人走了 步时回到了初始位置,这与 的发生矛盾,所以假设不成立.
即机器人第 步为向后行走,
从而机器人第2步到第 步向前和向后行走的步数均为 ,且从第2步开始,到第 步的这步,任意时刻机器人向前走的步数均不少于向后走的步数(否则在这过程中机器人会回到初始位置).
根据卡特兰数,从第2步到第 步共有 种行走方式.通过上述分析知,
,
所以 .
由于 ,
,故等式成立.
【变式3-1】Catalan数列(卡特兰数列)最早由我国清代数学家明安图(1692-1765)在研究三角函数幂级
数的推导过程中发现,成果发表于1774年出版的《割圜密率捷法》中,后由比利时数学家卡特兰
(Catalan,1814-1894)的名字来命名,该数列的通项被称为第 个Catalan数,其通项公式为
.在组合数学中,有如下结论:由 个 和 个 构成的所有数列 ,
中,满足“对任意 ,都有 ”的数列的个数等于 .
已知在数轴上,有一个粒子从原点出发,每秒向左或向右移动一个单位,且向左移动和向右移动的概率均
为 .
(1)设粒子第3秒末所处的位置为随机变量 (若粒子第一秒末向左移一个单位,则位置为 ;若粒子第
一秒末向右移一个单位,则位置为1),求 的分布列和数学期望 ;
(2)记第 秒末粒子回到原点的概率为 .
(i)求 及 ;
(ii)设粒子在第 秒末第一次回到原点的概率为 ,求 .
【解析】(1)依题可知, 的可能取值为 ,
, ,
, ,
的分布列如下:
-3 -1 1 3.
(2)(i) , ,
(ii)设事件 :粒子在第 秒末第一次回到原点,
事件 :粒子第1秒末向右移动一个单位.
,
记粒子往左移动一个单位为 ,粒子往右移动一个单位为 ,
以下仅考虑事件 .
设第 秒末粒子的运动方式为 ,其中 ;沿用(1)中对粒子位置的假设 ,
则粒子运动方式可用数列{a }表示,
n
如: 表示粒子在前4秒按照右、右、左、左的方式运动.
由粒子在第 秒末第一次回到原点,可知
数列{a }的前 项中有 个1和 个 .
n
, ,
粒子在余下 秒中运动的位置满足 ,
即 ,
粒子在余下 秒中运动方式的总数为 ,
,又 ,
.
【变式3-2】(2024·辽宁大连·二模)大连育明高级中学高三学生在交流2016年全国新课标Ⅲ卷单选压轴
题时,各抒己见展示各自的解法.
题干:定义“规范01数列”{a }如下:{a }共有 项,其中 项为0, 项为1,且对任意 ,
n n
中0的个数不少于1的个数.若 ,则不同的“规范01数列”共有[14]个.
A同学发现数据较少,可以列出所有情况,得到14个;
B同学在组合数学中学过卡特兰数, ,所以此题是 的情况, .
在一次活动课上,甲、乙俩人设计了一个游戏,抛硬币一次,若正面向上加一分,反面向上减一分.若起始
分为零分,出现负分游戏立刻停止.
(1)求在一次游戏中,恰好在第十一次后结束,中途只出现过两次零分的概率;
(2)如果一个人在一次游戏中,连续抛了十次硬币,求此时积分 的分布列和期望;
(3)参与一次游戏,记总共抛硬币次数为 , 的期望为 ,求满足 的最小正整数 .【解析】(1)对题目中给出的卡特兰数 ,事实上我们有恒等式 ,
先不考虑第11次,考虑前10次.
前10次中我们设第一次零分出现在第 次,第二次零分出现在第10次, .
那么这种时候可能的情况有 种,
所以总共的情况有 种,
所以所求概率 .
(2)使得 的情况只有 种;
使得 的情况有 种(反面向上可以出现在除了第1次以外的任意一次);
使得 的情况有 种(反面向上不能出现在第1次,也不能同时出现在第2次和第3次);
使得 的情况有 种(反面向上不能出现在第1次,若出现在了第2次,
则剩下两次反面向上不能出现在第3次,也不能同时出现在第4次和第5次;
若未出现在第2次,则反面向上不能同时出现在第3次、第4次和第5次)
使得 的情况有 种;
使得 的情况有 种.
所以所求分布列为
且 .
(3)由于 的全部可能值为 ,而 ,
故 .
但我们有 ,
解得 .
用 替换 ,可得 ,再求导就得到 .
代入 可得 ,
所以 .
所以不存在满足条件的正整数 .
题型四:概率密度函数
【典例4-1】设随机变量 的概率密度函数为 (当 为离散型随机变量时, 为 的概
率),其中 为未知参数,极大似然法是求未知参数 的一种方法.在 次随机试验中,随机变量 的观测
值分别为 , ,…, ,定义 为似然函数.若 时, 取得最大
值,则称 为参数 的极大似然估计值.
(1)若随机变量 的分布列为
1 2 3
其中 .在3次随机试验中, 的观测值分别为1,2,1,求 的极大似然估计值 .
(2)某鱼池中有鱼 尾,从中捞取50尾,做好记号后放回鱼塘.现从中随机捞取20尾,观测到做记
号的有5尾,求 的极大似然估计值 .
(3)随机变量 的概率密度函数为 , .若 , ,…, 是 的一组观测值,
证明:参数 的极大似然估计值为 .
【解析】(1)依题意得: ,
所以 .
当 时, , 单调递增;
当 时, , 单调递减;
所以 时, 取得最大值,所以 的极大似然估计值为 .(2)依题意得: ,所以 .
令 ,得 ,令 ,得 ,
又 ,所以 …
所以 或200时, 取得最大值,所以 的极大似然估计值为 或200.
(3)依题意得:
所以
令 , ,
则 ,令 ,得 .
当 时, , 单调递增;
当 时, , 单调递减;
所以当 时, 取到最大值.
即 时, 取得最大值,即 取得最大值.
所以参数 的极大似然估计值为 .
【典例4-2】李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间
(样本数据),经数据分析得到如下结果:
坐公交车:平均用时30min,方差为36
骑自行车:平均用时34min,方差为4
(1)根据以上数据,李明平时选择哪种交通方式更稳妥?试说明理由.(2)分别用X和Y表示坐公交车和骑自行车上学所用的时间,X和Y的概率密度曲线如图(a)所示,如果某
天有38min可用,你应选择哪种交通方式?如果仅有34min可用,又应该选择哪种交通方式?试说明理由.
(提示:(2)中X和Y的概率密度曲线分别反映的是X和Y的取值落在某个区间的随机事件的概率,例如,
图(b)中阴影部分的面积表示的就是X取值不大于38min时的概率.)
【解析】(1)李明平时选择骑自行车更稳妥,
由已知得坐公交车平均用时30min,骑自行车平均用时34min,差距不大;但是坐公交车的方差为36,骑
自行车的方差为4,由于方差越小,取值越集中,稳定性越高,波动性越小,则坐公交车所花费的时间不
稳定,即李明平时选择骑自行车更稳妥.
(2)由图(a)中可知,X和Y的概率密度曲线可知
,
由此可知,如果某天有38min可用,那么李明坐公交车迟到的概率大于骑自行车迟到的概率,应选骑自行
车;
由图(a)中可知,X和Y的概率密度曲线可知
,
由此可知,如果某天有34min可用,那么李明坐公交车迟到的概率小于骑自行车迟到的概率,应选坐公交
车.
【变式4-1】设随机变量X的概率密度函数为 ,则 ,若对
X的进行三次独立的观测,事件 至少发生一次的概率为 ;
(1)对X做n次独立重复的观测,若使得事件A至少发生一次的概率超过95%,求n的最小值.(
, )
(2)为满足广大人民群众对接种疫苗的需求,某地区卫生防疫部门为所辖的甲、乙、丙三区提供了批号
分别为1、2、3、4、5的五批次新冠疫苗以供选择,要求每个区只能从中选择一个批号的疫苗接种.由于
某些原因甲区不能选择1、2、4号疫苗,且这三区所选批号互不影响.记“甲区选择3号疫苗”为事件
B,且 ;
①求三个区选择的疫苗批号互不相同的概率;
②记甲、乙、丙三个区选择的疫苗批号最大数为K,求K的分布列.
【解析】(1)
所以 解得 ,所以
用Y表示对X的n次独立重复观察中事件A发生的次数,则 ,,则 ,即
解得
, 对X至少做11次独立重复观测;
(2)①
记“三个区选择疫苗批号互不相同”为事件C,
②依题意 的可能取值为 ,
则 , ,
所以分布列如下:
K 3 4 5
P
题型五:二维离散型随机变量
【典例5-1】(2024·江苏常州·一模)设 是一个二维离散型随机变量,它们的一切可能取的值为
,其中 ,令 ,称 是二维离散型随机变量 的联合分布
列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;
现有 个球等可能的放入编号为 的三个盒子中,记落入第1号盒子中的球的个数为 ,落入
第2号盒子中的球的个数为 .
(1)当 时,求 的联合分布列,并写成分布表的形式;(2)设 且 ,求 的值.
(参考公式:若 ,则 )
【解析】(1)
若 , 的取值为0,1,2, 的取值为0,1,2,
则 ,
,
, ,
, ,
,
故 的联合分布列为
(2)当 时, ,
故
所以 ,由二项分布的期望公式可得 .
【典例5-2】(2024·高三·河北保定·开学考试)如果离散型随机变量 的取值为 ,离散型随
机变量 的取值为 , ,则称 为二维离散型随机变量.称 取
, 的概率 为的联合分布律.记 分别称
为 关于 和关于 的边缘分布律.用表格形式表示如下:
边缘分布律
边缘分布律 1
(1)现袋中有质地大小均相同的2只白球,3只黑球,现先后随机摸球两次,定义
分别求有放回和不放回取球下 的联合分布律和边
缘分布律(表格形式表示);
(2)若二维离散型随机变量 的联合分布律与边缘分布律满足
则称随机变量 与 相互独立.
(i)那么(1)中有放回和不放回取球下的( )是否相互独立并说明理由;
(ii)证明:若 与 相互独立,则分布律中任意两行(或任意两列)对应成比例.
【解析】(1)有放回取球下 的联合分布律和边缘分布律;
,
,
,
0 1 边缘分布律
0
1
边缘分布律 1不放回取球下 的联合分布律和边缘分布律;
,
,
,
0 1 边缘分布律
0.
0 0.3 0.6
3
0.
1 0.3 0.4
1
0.
边缘分布律 0.6 1
4
(2)(i)由(1)知有放回取球下 的联合分布律和边缘分布律中,
,
,
经检验,满足 .
所以 与 相互独立.
在不放回摸球联合分布律中,
,不满足满足 , ,则 与 不是相
互独立.
(ii)
边缘分布律
边缘分布律 1任取分布律中的一行为 ,
另一行为 ,其中
因为二维离散型随机变量 与 相互独立, 的联合分布律与边缘分布律满足
,
所以
因为
所以 ,则分布律中任意两行对应成比例.
同理可证分布律中任意两列也对应成比例.
【变式5-1】(2024·重庆·三模)已知 是二维离散型随机变量,其中X、Y是两个相互独立的离散型
随机变量, 的分布列用表格表示如下:
X 0 3 6
0
5
(1)求 和 ;
(2)“ ”表示在 条件下的 的取值,求“ ”的分布列;
(3) 为 的数学期望, 为“ ”的分布的期望,证明:
.
【解析】(1)由已知 .
(2)法一:“ ”可取的值为 ,
因为所以 ,
,
,
所以“ ”分布列为
0 3 6
法二:“ ”可取的值为 ,由已知,随机变量 相互独立,
故 ,其中 ,
由已知, ,
所以得“ ”分布列为
0 3 6
(3)法一:因为 ,所以 ,
因为 ,
所以 ,
又因为 ,
所以 ,
所以 .法二:
.
题型六:多项式拟合函数
【典例6-1】(2024·甘肃·一模)下表是2017年至2021年连续5年全国研究生在学人数的统计表:
年份序号 1 2 3 4 5
27 31
人数 (万人) 263 286 334
3 4
(1)现用模型 作为回归方程对变量 与 的关系进行拟合,发现该模型的拟合度很高.请计算
该模型所表示的回归方程( 与 精确到0.01);
(2)已知2021年全国硕士研究生在学人数约为267.2万人,某地区在学硕士研究生人数占该地在学研究生的
频率值与全国的数据近似.当年该地区要在本地区在学研究生中进行一项网络问卷调查,每位在学研究生均
可进行问卷填写.某天某时段内有4名在学研究生填写了问卷,X表示填写问卷的这4人中硕士研究生的人
数,求X的分布列及数学期望.
参考公式及数据:对于回归方程
【解析】(1)可令 ,则 与 成线性回归关系,则 的对应关系如下图:
4 9 16 25 36
263 273 286 314 334
根据公式可得 ,则 ,
,则
,
,
所以 , ,则 .
(2)可求得该地区硕士研究生在学生数占总在学研究生人数的频率值为 ,可知 ,因此随机
变量 的分布列如下:
0 1 2 3 4
(人).
【典例6-2】(2024·安徽·一模)碳中和,是指企业、团体或个人测算在一定时间内,直接或间接产生的温
室气体排放总量,通过植树造林、节能减排等形式,抵消自身产生的二氧化碳排放,实现二氧化碳的“零
排放”.碳达峰,是指碳排放进入平台期后,进入平稳下降阶段.简单地说就是让二氧化碳排放量“收支相
抵”.中国政府在第七十五届联合国大会上提出:“中国将提高国家自主贡献力度,采取更加有力的政策和
措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.”减少碳排放,实现碳中
和,人人都可出一份力.某中学数学教师组织开展了题为“家庭燃气灶旋钮的最佳角度”的数学建模活动.
实验假设:
①烧开一壶水有诸多因素,本建模的变量设定为燃气用量与旋钮的旋转角度,其他因素假设一样;
②由生活常识知,旋转角度很小或很大,一壶水甚至不能烧开或造成燃气浪费,因此旋转角度设定在10°
到90°间,建模实验中选取5个代表性数据:18°,36°,54°,72°,90°.
某支数学建模队收集了“烧开一壶水”的实验数据,如下表:
项目
旋转角 开始烧水时燃气表计数/dm3 水烧开时燃气表计数/dm3
度
18° 9080 9210
36° 8958 9080
54° 8819 8958
72° 8670 8819
90° 8498 8670以x表示旋转角度,y表示燃气用量.
(1)用列表法整理数据(x,y);
x(旋转角度:度) 18 36 54 72 90
y(燃气用量:dm3)
(2)假定x,y线性相关,试求回归直线方程 (注:计算结果精确到小数点后三位)
(3)有队员用二次函数进行模拟,得到的函数关系为 .求在该模型中,烧
开一壶水燃气用量最少时的旋转角度.请用相关指数R2分析二次函数模型与线性回归模型哪种拟合效果更
好?(注:计算结果精确到小数点后一位)
参考数据: , , , ,
线性回归模型 ,二次函数模型 .
参考公式: , , .
【解析】(1)整理数据如图:
x(旋转角度:度) 18 36 54 72 90
y(燃气用量:dm3) 130 122 139 149 172
(2) , , ,
,
故回归直线方程为 ;
(3) ,即旋转角约为38.7时,烧开一壶水燃气用量最少 .
回归直线与二次函数拟合两者关系时,相关指数分别为 , ,
则 , .
因为 ,所以二次函数拟合效果更好.题型七:最大似然估算与大数定律
【典例7-1】(2024·河北张家口·三模)在某项投资过程中,本金为 ,进行了 次投资后,资金
为 ,每次投资的比例均为x(投入资金与该次投入前资金比值),投资利润率为r(所得利润与
当次投入资金的比值,盈利为正,亏损为负)的概率为P,在实际问题中会有多种盈利可能(设有n种可
能),记利润率为 的概率为 (其中 ),其中 ,由大数定律可知,当N足够大
时,利润率是 的次数为 .
(1)假设第1次投资后的利润率为 ,投资后的资金记为 ,求 与 的关系式;
(2)当N足够大时,证明: (其中 );
(3)将该理论运用到非赢即输的游戏中,记赢了的概率为 ,其利润率为 ;输了的概率为 ,其利润率为
,求 最大时x的值(用含有 的代数式表达,其中 ).
【解析】(1)由题知,投入资金为 ,所获利润为 ,所以 .
(2)由题可知, ,即 ,
所以
.
(3)由(2)可得 , ,
其中 ,故 ,故 .
记 ,
则
,
根据实际意义知, ,
则 ,
令 ,解得 ,令 ,解得 ,
所以 在 上单调递增,在 单调递减,
所以当 时, 取得最大值,即 取得最大值.
【典例7-2】(2024·湖北孝感·模拟预测)为落实食品安全的“两个责任”,某市的食品药品监督管理部门
和卫生监督管理部门在市人民代表大会召开之际特别邀请相关代表建言献策.为保证政策制定的公平合理性,
两个部门将首先征求相关专家的意见和建议,已知专家库中共有5位成员,两个部门分别独立地发出批建
邀请的名单从专家库中随机产生,两个部门均邀请2位专家,收到食品药品监督管理部门或卫生监督管理
部门的邀请后,专家如约参加会议.
(1)设参加会议的专家代表共X名,求X的分布列与数学期望.
(2)为增强政策的普适性及可行性,在征求专家建议后,这两个部门从网络评选出的100位热心市民中抽取
部分市民作为群众代表开展座谈会,以便为政策提供支持和补充意见.已知这两个部门的邀请相互独立,邀
请的名单从这100名热心市民中随机产生,食品药品监督管理部门邀请了 名代表,
卫生监督管理部门邀请了 名代表,假设收到食品药品监督管理部门或卫生监督管理部
门的邀请后,群众代表如约参加座谈会,且 ,请利用最大似然估计法估计参加会议的群众代表
的人数.(备注:最大似然估计即最大概率估计,即当P(X=k)取值最大时,X的估计值为k)
【解析】(1)X的可能取值为2,3,4,则 ,
, ,
则X的分布列为
X 2 3 4
0.
P 0.6 0.3
1
(2)设食品药品监督管理部门邀请的代表记为集合A,人数为 ,卫生监督管理部门邀请的代
表为集合B,人数为 ,则收到两个部门邀请的代表的集合为A∪B.人数为Card(A∪B).
设参加会议的群众代表的人数为Y,则 .
若 ,则 ,
则 ,,
,
令 ,得 ,解得 ,
以 代替k,得 ,
令 ,得 ,解得 ,
所以 ,
若 为整数,则当
或 时, 取得最大值,
所以估计参加会议的群众代表的人数为 或 ,
若 不是整数,则当 时,
取得最大值,所以估计参加会议的群众代表的人数为 ,
其中, 表示不超过 的最大整数.
【变式7-1】(2024·浙江杭州·二模)在概率统计中,常常用频率估计概率.已知袋中有若干个红球和白球,
有放回地随机摸球 次,红球出现 次.假设每次摸出红球的概率为 ,根据频率估计概率的思想,则每
次摸出红球的概率 的估计值为 .
(1)若袋中这两种颜色球的个数之比为 ,不知道哪种颜色的球多.有放回地随机摸取3个球,设摸出的
球为红球的次数为 ,则 .
(注: 表示当每次摸出红球的概率为 时,摸出红球次数为 的概率)
(ⅰ)完成下表,并写出计算过程;
0 1 2 3(ⅱ)在统计理论中,把使得 的取值达到最大时的 ,作为 的估计值,记为 ,请写出 的值.
(2)把(1)中“使得 的取值达到最大时的 作为 的估计值 ”的思想称为最大似然原理.基于
最大似然原理的最大似然参数估计方法称为最大似然估计.具体步骤:先对参数 构建对数似然函数 ,
再对其关于参数 求导,得到似然方程 ,最后求解参数 的估计值.已知 的参数 的
对数似然函数为 ,其中 .求参数 的估计值,
并且说明频率估计概率的合理性.
【解析】(1)因为袋中这两种颜色球的个数之比为 ,且 ,所以 的值为 或 ;
(ⅰ)当 时, , ,
当 时, , ,
表格如下
0 1 2 3
(ⅱ)由上表可知 .
当 或1时,参数 的概率最大;当 或3时,参数 的概率最大.
所以 ;
(2)由 ,
则 ,
令 ,即 ,
故 ,即当 时, ,
当 时, ,
故 在 上单调递增,在 上单调递减,
即当 时, 取最大值,故 ,
因此,用最大似然估计的参数 与频率估计概率的 是一致的,故用频率估计概率是合理的.
【变式7-2】(2024·河南·模拟预测)为落实食品安全的“两个责任”,某市的食品药品监督管理部门和卫
生监督管理部门在市人民代表大会召开之际特别邀请相关代表建言献策.为保证政策制定的公平合理性,
两个部门将首先征求相关专家的意见和建议,已知专家库中共有4位成员,两个部门分别独立地发出邀请,
邀请的名单从专家库中随机产生,两个部门均邀请2位专家,收到食品药品监督管理部门或卫生监督管理
部门的邀请后,专家如约参加会议.
(1)用1,2,3,4代表专家库中的4位专家,甲、乙分别代表食品药品监督管理部门和卫生监督管理部门,
将两个部门邀请的专家及参会的专家人数的所有情况绘制成一个表格,请完成如下表格.
(2)最大似然估计即最大概率估计,即当 时,概率取得最大值,则X的估计值为k( , ,
,…, ),其中 为X所有可能取值的最大值.请用最大似然估计法估计参加会议的专家人数.
【解析】(1)完成的表格如下:(2)记X为参加会议的专家人数, ( ,3,4)的概率记为 .
由(1)中的表格可知 出现的次数为6, 出现的次数为24, 出现的次数为6,
则 , , ,
则 , ,
根据最大似然估计法,可以估计出参加会议的专家人数为3.
【变式7-3】统计与概率主要研究现实生活中的数据和客观世界中的随机现象,通过对数据的收集、整理、
分析、描述及对事件发生的可能性刻画,来帮助人们作出合理的决策.
(1)现有池塘甲,已知池塘甲里有50条鱼,其中A种鱼7条,若从池塘甲中捉了2条鱼.用 表示其中A种
鱼的条数,请写出 的分布列,并求 的数学期望 ;
(2)另有池塘乙,为估计池塘乙中的鱼数,某同学先从中捉了50条鱼,做好记号后放回池塘,再从中捉了
20条鱼,发现有记号的有5条.
(ⅰ)请从分层抽样的角度估计池塘乙中的鱼数.
(ⅱ)统计学中有一种重要而普遍的求估计量的方法─最大似然估计,其原理是使用概率模型寻找能够以
较高概率产生观察数据的系统发生树,即在什么情况下最有可能发生已知的事件.请从条件概率的角度,采
用最大似然估计法估计池塘乙中的鱼数.
【解析】(1) ,
故分布列为:
0 1 2.
(2)(i)设池塘乙中鱼数为 ,则 ,解得 ,故池塘乙中的鱼数为200.
(ii)设池塘乙中鱼数为 ,令事件 “再捉20条鱼,5条有记号”,事件 “池塘乙中鱼数为 ”
则 ,由最大似然估计法,即求 最大时 的值,其中 ,
当 时 ,
当 时 ,
当 时
所以池塘乙中的鱼数为199或200.
1.在概率论中,马尔可夫不等式给出了随机变量的函数不小于某正数的概率的上界,它以俄国数学家安
德雷·马尔可夫命名,由马尔可夫不等式知,若 是只取非负值的随机变量,则对 ,都有
.某市去年的人均年收入为10万元,记“从该市任意选取3名市民,则恰有1名市民去年
的年收入超过100万元”为事件A,其概率为 .则 的最大值为( )
A. B. C. D.
【答案】B
【解析】记该市去年人均收入为 万元,从该市任意选取3名市民,年收入超过100万元的人数为 .
设从该市任选1名市民,年收入超过100万元的概率为 ,
则根据马尔可夫不等式可得 ,,
因为 ,
所以 ,
令 ,则 ,
,即 ,
在 上单调递增.
,即 .
故选:B
2.在如图所示的正方形中随机投掷 个点,则落入由曲线 (曲线 为正态分布 的概率密度
曲线)与直线 、 及 所围成的封闭区域内的点的个数的估计值为( )
(附:若 ,则 , ,
A. B.
C. D.
【答案】D
【解析】由正态分布 原则可知,封闭区域的面积为
,
正方形的面积为 ,因此,落入封闭区域的点的个数的估计值为 .
故选:D.
3.把一正态曲线C 沿着横轴方向向右移动2个单位,得到一条新的曲线C ,下列说法不正确的是( )
1 2
A.曲线C 仍是正态曲线
2
B.曲线C 、C 的最高点的纵坐标相等
1 2C.以曲线C 为概率密度曲线的总体的方差比以曲线C 为概率密度曲线的总体的方差大2
2 1
D.以曲线C 为概率密度曲线的总体的期望比以曲线C 为概率密度曲线的总体的期望大2
2 1
【答案】C
【解析】由题意,曲线C 和C 的大小形状完全一样,只是在坐标系中的位置不同,
1 2
而对称轴是 ,形状决定方差 .
设正态曲线C 表示随机变量 ,正态曲线C 表示随机变量 ,
1 2
则 ,
,
,
故C错误,ABD正确.
故选:C.
4.(2024·安徽合肥·模拟预测)某大型电子商务平台每年都会举行“双11”商业促销狂欢活动,现统计了
该平台从2010年到2018年共9年“双11”当天的销售额(单位:亿元)并作出散点图,将销售额y看成以
年份序号x(2010年作为第1年)的函数.运用excel软件,分别选择回归直线和三次多项式回归曲线进行
拟合,效果如下图,则下列说法错误的是( )
A.销售额y与年份序号x呈正相关关系
B.根据三次多项式函数可以预测2019年“双11”当天的销售额约为2684.54亿元
C.三次多项式回归曲线的拟合效果好于回归直线的拟合效果
D.销售额y与年份序号x线性相关不显著
【答案】D
【解析】散点从左下到右上分布,所以销售额y与序号x呈正相关关系,故A正确;
令 ,由三次多项式函数得2684.54,
所以2019年“双11”当天的销售额约为2684.54亿元,故B正确;
用三次多项式曲线拟合的相关指数 ,而一次归直线拟合的相关指数 ,相关指数 越
大拟合效果越好,故C正确;因为相关系数 非常接近1,
故销售额y与年份序号x线性相关显著,故D错误,
故选:D.
5.(2024·广东肇庆·模拟预测)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基
石,为状态空间中经过从一个状态到另一个状态的转换的随机过程,该过程要求具备“无记忆”的性质:
下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关.甲口袋中各装有1个黑
球和2个白球,乙口袋中装有2个黑球和1个白球,现从甲、乙两口袋中各任取一个球交换放入另一口袋,
重复进行n( )次这样的操作,记口袋甲中黑球的个数为 ,恰有1个黑球的概率为 ,则 的值
是 ; 的数学期望 是 .
【答案】
【解析】考虑到乙袋中拿出的球可能是黑的也可能是白的,由全概率公式可得 ;
记 取0,1,2,3的概率分别为 , , , ,
推导 的分布列:
, , ,
则
,
则 ,
故
给合 ,可知 .
故答案为: ; .
6.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,为状态空间中经过从一
个状态到另一个状态的转换的随机过程.该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当
前状态决定,在时间序列中它前面的事件均与之无关.甲乙两个口袋中各装有1个黑球和2个白球,现从甲、
乙两口袋中各任取一个球交换放入另一口袋,重复进行 次这样的操作,记甲口袋中黑球个数为
,恰有1个黑球的概率为 ,则 ; .【答案】
【解析】由题意, ;
当 时,
,
整理得 , ,
故可知 是以 为首项,以 为公比的等比数列,所以 .
故答案为: ;
7.马尔科夫链是机器学习和人工智能的基石,其数学定义为:假设序列状态是..., ,那
么 时刻的状态的条件概率仅依赖前一状态 ,即 .著名的赌徒模型
就应用了马尔科夫链:假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率都为50%,每局
赌赢可以赢得1金币,赌输就要输掉1金币.赌徒自以为理智地决定,遇到如下两种情况就会结束赌博游戏:
一是输光了手中金币;二是手中金币达到预期的1000金币,出现这两种情况赌徒都会停止赌博.记赌徒的本
金为70金币,求赌徒输光所有金币的概率 .
【答案】 /
【解析】设当赌徒手中有 元 时,最终输光的概率为 ,
当 时,赌徒已经输光了,所以 ,
当 时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率为 ,
记 :赌徒有 元最后输光的事件, :赌徒有 元下一次赢的事件,
所以 ,
即 ,所以 ,
所以 为等差数列,设 ,
由于 ,所以 ,
所以 ,
故故答案为:
8.随机变量的概念是俄国数学家切比雪夫在十九世纪中叶建立和提倡使用的.切比雪夫在数论、概率论、函
数逼近论、积分学等方面均有所建树,他证明了如下以他名字命名的离散型切比雪夫不等式:设 为离散
型随机变量,则 ,其中 为任意大于0的实数.切比雪夫不等式可以使人们在随
机变量 的分布未知的情况下,对事件 的概率作出估计.
(1)证明离散型切比雪夫不等式;
(2)应用以上结论,回答下面问题:已知正整数 .在一次抽奖游戏中,有 个不透明的箱子依次编号为
,编号为 的箱子中装有编号为 的 个大小、质地均相同的小球.主持人邀请 位
嘉宾从每个箱子中随机抽取一个球,记从编号为 的箱子中抽取的小球号码为 ,并记 .对任意
的 ,是否总能保证 (假设嘉宾和箱子数能任意多)?并证明你的结论.
附:可能用到的公式(数学期望的线性性质):对于离散型随机变量 满足 ,则
有 .
【解析】(1)设 的所有可能取值为 取 的概率为 .
则 ,
(2)(2)由参考公式, .
,用到而 ,故 .
当 时, ,
因此,不能保证 .
9.(2024·广东茂名·二模)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的
性质,即第 次状态的概率分布只跟第 次的状态有关,与第 次状态是“没有任何关
系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任
取一个球交换,重复进行 次操作后,记甲盒子中黑球个数为 ,甲盒中恰有1个黑球的概率为
,恰有2个黑球的概率为 .
(1)求 的分布列;
(2)求数列 的通项公式;
(3)求 的期望.
【解析】(1)(1)由题可知, 的可能取值为0,1,2.由相互独立事件概率乘法公式可知:
; ; ,
故 的分布列如下表:
0 1 2
(2)由全概率公式可知:
,
即: ,所以 ,
所以 ,
又 ,
所以,数列 为以 为首项,以 为公比的等比数列,
所以 ,
即: .
(3)由全概率公式可得:
,
即: ,
又 ,
所以 ,
所以 ,
又 ,
所以 ,
所以 ,
所以 ,
所以 .10.(2024·全国·模拟预测)卡特兰数是组合数学中一个常在各种计数问题中出现的数列.以比利时的数
学家欧仁·查理·卡特兰(1814-1894)命名.历史上,清代数学家明安图(1692年-1763年)在其《割圜密
率捷法》最早用到“卡特兰数”,远远早于卡塔兰.有中国学者建议将此数命名为“明安图数”或“明安
图-卡特兰数”.卡特兰数是符合以下公式的一个数列: 且 .如果能把
公式化成上面这种形式的数,就是卡特兰数.卡特兰数是一个十分常见的数学规律,于是我们常常用各种
例子来理解卡特兰数.比如:在一个无穷网格上,你最开始在 上,你每个单位时间可以向上走一格,
或者向右走一格,在任意一个时刻,你往右走的次数都不能少于往上走的次数,问走到 ,0≤n有多少
种不同的合法路径.记合法路径的总数为
(1)证明 是卡特兰数;
(2)求 的通项公式.
【解析】(1)若先走到 则合法路径 ,
若先走到 且不走到 ,
相当于走到 后向右走到 再走到 ,
合法路径
若先走到 且不走到 ,
相当于走到 后再从 走到 ,
合法路径 ,
于是 ,即 为卡特兰数.
(2)记直线 ,则所有不合法路线都会与直线 有交点,
记第一个交点为 ,
将 之后的路径都沿着 对称,
那么这条不合法路径的终点成为了 ,
于是总路线为 ,不合法路线为 ,
合法路径为 ,即 .
11.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,为状态空间中经过从一
个状态到另一个状态的转换的随机过程.该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当
前状态决定,在时间序列中它前面的事件均与之无关.甲、乙两口袋中各装有1个黑球和2个白球,现从甲、
乙两口袋中各任取一个球交换放入另一口袋,重复进行 次这样的操作,记口袋甲中黑球的个数为
,恰有1个黑球的概率为 ,恰有2个黑球的概率为 ,恰有0个黑球的概率为 .
(1)求 的值;
(2)根据马尔科夫链的知识知道 ,其中 为常数,同时 ,
请求出 ;
(3)求证: 的数学期望 为定值.
【解析】(1)由题意恰有0个黑球的概率为 .
由题意知 ,
所以 .
(2)因为 ,
所以 .
又因为 ,所以 是以 为首项, 为公比的等比数列.
所以 .
(3)因为 ①,
②
所以①-②,得 .
又因为 ,所以 .所以 .
所以 的概率分布列为:0 1 2
所以 .
所以 的数学期望 为定值1.
12.(2024·云南·模拟预测)材料一:英国数学家贝叶斯 在概率论研究方面成就显著,创立
了贝叶斯统计理论,对于统计决策函数、统计推断等做出了重要贡献.贝叶斯公式就是他的重大发现,它用
来描述两个条件概率之间的关系.该公式为:设 是一组两两互斥的事件, ,
且 , ,则对任意的事件 ,有
, .
材料二:马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然
语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是 ,
,那么 时刻的状态的条件概率仅依赖前一状态 ,即
.
请根据以上材料,回答下列问题.
(1)已知德国电车市场中,有 的车电池性能很好. 公司出口的电动汽车,在德国汽车市场中占比 ,
其中有 的汽车电池性能很好.现有一名顾客在德国购买一辆电动汽车,已知他购买的汽车不是 公司
的,求该汽车电池性能很好的概率;(结果精确到0.001
(2)为迅速抢占市场, 公司计划进行电动汽车推广活动.活动规则如下:有11个排成一行的格子,编号从
左至右为 ,有一个小球在格子中运动,每次小球有 的概率向左移动一格;有 的概率向右移动
一格,规定小球移动到编号为0或者10的格子时,小球不再移动,一轮游戏结束.若小球最终停在10号格
子,则赢得6百欧元的购车代金券;若小球最终停留在0号格子,则客户获得一个纪念品.记 为以下事件
发生的概率:小球开始位于第 个格子,且最终停留在第10个格子.一名顾客在一次游戏中,小球开始位于
第5个格子,求他获得代金券的概率.
【解析】(1)记事件 为一辆德国市场的电车性能很好,事件 为一辆德国市场的车来自 公司.由全概
率公式知:
故: .(2)记事件 表示小球开始位于第 个格子,且最终停留在第10个格子,
事件 表示小球向右走一格.小球开始于第 格,此时的概率为 ,则下一步小球向左或向右移动,
当小球向右移动,即可理解为小球始于 ,当小球向左移动,即可理解为小球始于 ,
即 .由题知 ,
又 ,故 ,
所以 是以 为首项,3为公比的等比数列,
即: ,
即: ,
,
,
故 ,
,
则 ,
故这名顾客获得代金券的概率为 .
13.(2024·山东潍坊·一模)若 , 是样本空间 上的两个离散型随机变量,则称 是 上的二维离
散型随机变量或二维随机向量.设 的一切可能取值为 , ,记 表示 在 中
出现的概率,其中 .
(1)将三个相同的小球等可能地放入编号为1,2,3的三个盒子中,记1号盒子中的小球个数为 ,2号盒
子中的小球个数为 ,则 是一个二维随机变量.
①写出该二维离散型随机变量 的所有可能取值;
②若 是①中的值,求 (结果用 , 表示);
(2) 称为二维离散型随机变量 关于 的边缘分布律或边际分布律,求证: .
【解析】(1)①该二维离散型随机变量 的所有可能取值为:
.
②依题意, , ,显然 ,则 ,
所以 .
(2)由定义及全概率公式知,
.
14.(2024·高三·河北邯郸·开学考试)设 是二维离散型随机变量,它们的一切可能取值为 ,
其中 , ,则称 为二维随机变量 的联合分布
列.定义: ,称( , ,…)为 关于X的边际分布列,
,称( , ,…)为 关于Y的边际分布列;对于固定的j,称
( )为给定 条件下的离散型随机变量 的条件分布列,则
二维离散型随机变量 的联合分布列与边际分布列如表:
…
…
…
… … … … … …
…
… 1
(1)求证:对于 , ;
(2)若 的联合分布列与边际分布列如表:
1 2 3
1 0.3 0.1 0.1 0.52 0.05 0.1 0.15 0.3
3 0.05 0.1 0.05 0.2
0.4 0.3 0.3 1
求给定 条件下Y的条件分布列;
(3)把三个相同的小球等可能地放入编号为1,2,3的三个盒子中.记放入1号盒子的球的个数为 ,放入
2号盒子的球的个数为 ,则 是一个二维离散型随机变量.列出 的联合分布列与边际分布列.
【解析】(1)
(2)因为 ,所以用第二行 的值分别除以0.3,
可得给定 条件下Y的条件分布列:
1 2 3
P
(3)由题意可知X的可能取值为0,1,2,3,Y的可能取值为0,1,2,3,
设 , , , ,由概率的乘法公式知,
, , , ,
,
所以 , ,
当 时,显然 ,
所以(X,Y)的联合分布列与边际分布列如表:
(X,Y) 0 1 2 3
0
1 0
2 0 03 0 0 0
1
15.已知编号为 的三个袋子中装有除标号外完全相同的小球,其中1号袋子内装有两个1号球,一个
2号球和一个3号球;2号袋子内装有两个1号球,一个3号球;3号袋子内装有三个1号球,两个2号球
和一个3号球.现按照如下规则连续摸球两次;第一次先从1号袋子中随机摸出1个球,并将摸出的球放
入与球编号相同的袋子中,第二次从刚放入球的袋子中再随机摸出1个球.
(1)若第二次摸到的是3号球,计算此3号球在第二次摸球过程中分别来自 号袋子的概率;
(2)设 是样本空间 上的两个离散型随机变量,则称 是 上的二维离散型随机变量.设 的
一切可能取值为 ,记 表示 在 中出现的概率,其中
.若 表示第一次摸出的是 号球, 表示第二次摸出的是
号球.
①求 ;
②证明: .
【解析】(1)设第一次摸到 球的事件为 ,第二次摸到的是3号球的事件为 ,
第二次在第 号袋子里摸到的是3号球的事件为 , ,
,
于是 ,
所以第二次摸到的是3号球,它来自1号袋子的概率 ;
第二次摸到的是3号球,它来自2号袋子的概率 ;
第二次摸到的是3号球,它来自3号袋子的概率 .
(2)①依题意, ,即第一次摸出1号球,并放入1号袋子,第二次从该袋子摸出2号球的概率,
所以 .
②由定义及全概率公式知,
,
所以 .