文档内容
第七章 随机变量及其分布
知识点一 条件概率的概念
1.定义
设A、B为两个事件,且 P(A)0 ,在已知事件 A发生的条件下,事件B发生的概率叫做条件概
率。用符号 P(B| A) 表示。 P(B| A) 读作:A发生的条件下B发生的概率。
2.P(A|B)、P(AB)、P(B)的区别
P(A|B)是在事件B发生的条件下,事件A发生的概率。
P(AB)是事件A与事件B同时发生的概率,无附加条件。
P(B)是事件B发生的概率,无附加条件.
P(AB)
P(A|B)
P(B)
它们的联系是: .
知识点二、条件概率的公式
1.计算事件B发生的条件下事件A发生的条件概率,常有以下两种方式:
①利用定义计算.P(AB)
P(A|B)
P(B)
先分别计算概率P(AB)及P(B),然后借助于条件概率公式 求解.
②利用缩小样本空间的观点计算.
在这里,原来的样本空间缩小为已知的条件事件 B,原来的事件 A缩小为事件 AB,从而
AB包含的基本事件数 n(AB)
P(A|B) P(B| A)
B包含的基本事件数 n(A)
,即: ,此法常应用于古典概型中的条件概率
求解.
2.条件概率公式的变形.
P(AB)
P(A|B)
P(B)
公式 揭示了P(B)、P(A|B)、P(AB)的关系,常常用于知二求一,即要熟
练应用它的变形公式如,若P(B)>0,则P(AB)=P(B)·P(A|B),该式称为概率的乘法公式.
知识点三、相互独立事件
1.定义:
事件A(或B)是否发生对事件B(或A)发生的概率没有影响,即 P(B| A) P(B) ,这样的两个事
件叫做相互独立事件。
若A与B是相互独立事件,则A与B,A与B,A与B也相互独立。
2.相互独立事件同时发生的概率公式:
对于事件A和事件B,用AB表示事件A、B同时发生。
(1)若A与B是相互独立事件,则 P(AB) P(A)P(B) ;
(2)若事件 A 1 ,A 2 , ,A n相互独立,那么这 n 个事件同时发生的概率,等于每个事件发生的概率的积,
P(A A A )P(A)P(A ) P(A )
即: 1 2 n 1 2 n 。
3.相互独立事件与互斥事件的比较
互斥事件与相互独立事件是两个不同的概念,它们之间没有直接关系。
互斥事件是指两个事件不可能同时发生,而相互独立事件是指一个事件是否发生对另一个事件发生的
概率没有影响。
一般地,两个事件不可能既互斥又相互独立,因为互斥事件是不可能同时发生的,而相互独立事件是
以它们能够同时发生为前提的。相互独立事件同时发生的概率等于每个事件发生的概率的积,这一点与互斥
事件的概率和也是不同的。
4. 几种事件的概率公式的比较
已知两个事件A,B,它们发生的概率为P(A),P(B),将A,B中至少有一个发生记为事件A+B,都发生记为事件A·B,都不发生记为事件 ,恰有一个发生记为事件 AB AB,至多有一个发生记为
事件AB AB AB,则它们的概率间的关系如下表所示:
概率 A,B互斥 A,B相互独立
P(A+B) P(A)+P(B) 1P(A)P(B)
P(A·B) 0 P(A)·P(B)
P(AB) 1-[P(A)+P(B)] P(A)P(B)
P(AB AB) P(A)+P(B) P(A)P(B)P(A)P(B)
P(AB AB AB) 1 1-P(A)·P(B)
知识点四 全概率公式
1.全概率公式的定义
一般地,设 是一组两两互斥的事件, ,且 ,
,则对任意的事件 ,有
.
我们称上面的公式为全概率公式(total probability formula).全概率公式是概率论中最基本的公式之一.
2.贝叶斯公式
*贝叶斯公式:设 A ,A ,…,A 是一组两两互斥的事件,A ∪A ∪…∪A =Ω,且P(A)>0,i=
1 2 n 1 2 n i
1,2,…,n,则对任意的事件B⊆Ω,P(B)>0,有P(A|B)==,i=1,2,…,n.
i
贝叶斯公式的内含
(1)公式P(A |B)==反映了P(A B),P(A ),P(B),P(A |B),P(B|A )之间的互化关系.
1 1 1 1 1
(2)P(A )称为先验概率,P(A |B)称为后验概率,其反映了事情A 发生的可能在各种可能原因中的比重.
1 1 1
知识点五 随机变量和离散型随机变量
1. “随机试验”的概念
一般地,一个试验如果满足下列条件:
a.试验可以在相同的情形下重复进行.
B.试验的所有可能结果是明确可知的,并且不止一个.
c.每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定这次试验会出现哪一个结
果.
这种试验就是一个随机试验,为了方便起见,也简称试验.
2.随机变量的定义
一般地,如果随机试验的结果,可以用一个变量来表示,那么这样的变量叫做随机变量.
通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示。3.离散型随机变量的定义
如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。
离散型随机变量的例子很多.例如某人射击一次可能命中的环数 X 是一个离散型随机变量,它的所
有可能取值为0,1,…,10;某网页在24小时内被浏览的次数Y也是一个离散型随机变量,它的所有可
能取值为0, 1,2,….
4. 随机变量的分类
随机变量有以下两种:
(1) 离散型随机变量:
(2) 连续型随机变量: 如果随机变量可以取其一区间内的一切值,这样的随机变量叫做连续型随
机变量.
ab,
5. 若 是随机变量, 其中a,b是常数,则 也是随机变量,并且不改变其属性(离散型、
连续型)。
知识点六、离散性随机变量的分布列
1. 分布列定义:
设离散型随机变量 所有可能取得的值为 x ,x ,…,x ,…x ,若 取每一个值x(i=1,2,…,n)的概率为
1 2 3 n i
P( x ) P
i i,则称表
x x … x … x
1 2 i n
P P P … P … P
1 2 i n
为随机变量 的概率分布,简称 的分布列.
2.分布列的性质
离散型随机变量的分布列都具有下面两个性质:
(1)P≥0,i=1,2,…,n;
i
(2)P +P +…+P =1
1 2 n
3. 离散型随机变量函数及其分布列
一般地,若ξ是随机变量,f(x)是连续函数或单调函数,则f(ξ)也是随机变量,也就是说,随机变量的某
些函数也是随机变量。
f()
已知离散型随机变量的分布列,求离散型随机变量函数 的分布列:
①ξ与η一一对应时,ξ的每个取值的概率就对应着η的每个取值的概率;
②如果ξ有多个取值对应一个η的值,那么这个η值的概率就是这多个ξ值的概率的和。
知识点七 离散性随机变量的分布列的求法
1.求随机变量的概率分布有以下几步:
(1)要确定随机变量 的可能取值有哪些.明确取每个值所表示的意义;
(2)分清概率类型,计算 取得每一个值时的概率(取球、抽取产品等问题还要注意是放回抽样还是不
放回抽样);(3)列表对应,给出分布列,并用分布列的性质验证.
知识点八 n次独立重复试验
每次试验只考虑两种可能结果A与A,并且事件A发生的概率相同。在相同的条件下重复地做 n 次试
n
验,各次试验的结果相互独立,称为 次独立重复试验。
总之,独立重复试验,是在同样的条件下重复的,各次之间相互独立地进行的一种试验,在这种试验
中,每一次的试验结果只有两种,即某事件要么发生,要么不发生,并且任何一次试验中发生的概率都是
一样的。
知识点九 二项分布与超几何分布
1. 定义:
n
在一次随机试验中,事件A可能发生也可能不发生,在 次独立重复试验中事件A发生的次数 是一
p q 1 p
个离散型随机变量.如果在一次试验中事件A发生的概率是 ,则此事件不发生的概率为 ,那
n k
么在 次独立重复试验中事件A恰好发生 次的概率是
P (k) P (k)Ckpkqnk k 0,1,2,...,n
n n n ,( ).
于是得到离散型随机变量 的概率分布如下:
ξ 0 1 … k … n
P C0p0qn C1p1qn1 … Ck pkqnk … Cnpnq0
n n n n
由于表中第二行恰好是二项展开式
(q p)n C0p0qn C1p1qn1 Ck pkqnk Cnpnq0
n n n n 中各对应项的值,所以称这样的随
n p ~ B(n, p)
机变量 服从参数为 , 的二项分布,记作 .
2.如何求有关的二项分布
(1)分清楚在n次独立重复试验中,共进行了多少次重复试验,即先确定n的值,然后确定在一次试
验中某事件A发生的概率是多少,即确定p的值,最后再确定某事件A恰好发生了多少次,即确定k的值;
(2)准确算出每一种情况下,某事件A发生的概率;
(3)用表格形式列出随机变量的分布列。
3、几何分布:
独立重复试验中,若事件 A在每一次试验中发生的概率都为 p ,事件A第一次发生时所做的试验次数
P(k)(1 p)k1p k 0,1,2,3, ,n,
是随机变量,且 , ,称离散型随机变量 服从几何分布,记
~ P(k)g(k,P)
作: 。 ~ P(k)g(k,P),
若离散型随机变量 服从几何分布,且 则
1
E .
p
期望
1- p
D
p2
方差
4、超几何分布:
nM
E()
若离散型随机变量 服从参数为 N,M,n 的超几何分布,则期望 N
知识点十 离散型随机变量的期望
1.定义:
一般地,若离散型随机变量 的概率分布为
x x … x …
1 2 i
P p p … p …
1 2 i
E x p x p x p
则称 1 1 2 2 … n n … 为 的均值或数学期望,简称期望.
2.性质:
E() EE
① ;
ab E(ab) aEb
②若 (a、b是常数), 是随机变量,则 也是随机变量,有 ;
E(ab) aEb
的推导过程如下::
的分布列为
x x … x …
1 2 i
ax b ax b … ax b …
1 2 i
P P P … P …
1 2 i
E (ax b)p (ax b)p (ax b)p
于是 1 1 2 2 … i i …
a(x p x p x p b(p p p aEb
= 1 1 2 2 … i i …) 1 2 … i …)=E(ab) aEb
∴ 。
知识点十一:离散型随机变量的方差与标准差
1.一组数据的方差的概念:
x x x x x
已知一组数据 1, 2,…, n,它们的平均值为 ,那么各数据与 的差的平方的平均数
1
S2 [
n (x 1 x)2 + (x 2 x)2 +…+ (x n x)2] 叫做这组数据的方差。
2.离散型随机变量的方差:
一般地,若离散型随机变量 的概率分布为
x x … x …
1 2 i
P p p … p …
1 2 i
D (x E)2 p (x E)2 p (x E)2p
则称 = 1 1+ 2 2+…+ n i+…称为随机变量 的方差,式中
E
的 是随机变量 的期望.
D D
的算术平方根 叫做随机变量 的标准差,记作 .
3.期望和方差的关系:
D E(2)(E)2
4.方差的性质:
ab D D(ab)a2D
若 (a、b是常数), 是随机变量,则 也是随机变量, ;
知识点十二 正态分布
1.正态变量的概率密度函数
(x)2
1
(x) e 22 (xR)
,
2 0,
正态变量的概率密度函数表达式为: ,( )
其中x是随机变量的取值;μ为正态变量的期望; 是正态变量的标准差.
2.正态分布
(1)定义
b
P(a X b) (x)dx
如果对于任何实数 a,b(ab) 随机变量X 满足: a , ,X N(,2)
则称随机变量X 服从正态分布。记为 。
(2)正态分布的期望与方差
若 X N(,2) ,则X 的期望与方差分别为: EX , DX 2 。
3. 正态曲线
1
(x)2
f(x) e 22 (xR)
2
如果随机变量 X 的概率密度函数为 ,其中实数 和 为参数(
0, f(x)
),则称函数 的图象为正态分布密度曲线,简称正态曲线。
y y y
u=0
O x u=-1 O x O u=1 x
4.正态曲线的性质:
x x
①曲线位于 轴上方,与 轴不相交;
x
②曲线是单峰的,它关于直线 对称;
1
x 2
③曲线在 时达到峰值 ;
x x
④当 时,曲线上升;当 时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐
近线,向它无限靠近.
x
⑤曲线与 轴之间的面积为1;
⑥ 决定曲线的位置和对称性;
x
当 一定时,曲线的对称轴位置由 确定;如下图所示,曲线随着 的变化而沿 轴平移。
⑦ 确定曲线的形状;
当 一定时,曲线的形状由 确定。 越小,曲线越“高瘦”,表示总体的分布越集中; 越大,
曲线越“矮胖”,表示总体的分布越分散。如下图所示。类型一 条件概率
例1 在10道题中有6道选择题和4道填空题.如果不放回地依次抽取2道题,求:
(1)第1次抽到选择题的概率;
(2)第1次和第2次都抽到选择题的概率;
(3)在第1次抽到选择题的条件下,第2次抽到选择题的概率.
分析:(1) (2)都是古典概型问题,利用古典概型计算概率的公式求解;(3)是条件概率问题,可以用
定义法、公式法或剔除法求解.
解:设事件A为“第1次抽到选择题”,事件B为“第2次都抽到选择题”,则第1次和第2次都抽到
选择题为事件AB.
(1)从10道题中不放回地依次抽取2道题的事件数为 .由分步乘法计数原理,知事件A
包含的基本事件数 .因此 ,
(2)由分步乘法计数原理,知 ,故 。
(3)方法1:由(1) (2),知 , ,故 .
方法2:因为 , ,所以 .
方法3:因为第1次抽到了1道选择题,故还剩9道题,其中有5道选择题,所以在第1次抽到选择题
的条件下,第2次再抽到选择题的概率为 .
解后反思:利用剔除法求解条件概率,是把复杂问题简单化的转化策略,有利于问题的解决.
类型二 互斥事件、相互独立事件概率的求法以及分布列的计算例2 现在甲、乙两个靶,某射手向甲靶射击一次,命中的概率为 ,命中得1分,没有命中得0分;向乙
靶射击两次,每次命中的概率为 ,每命中一次得2分,没有命中得0分.该射手每次射击的结果相
互独立.假设该射手完成以上三次射击.
(1)求该射手恰好命中一次的概率;
(2)求该射手的总得分 的分布列.
分析:(1)利用互斥事件有一个发生的概率和相互独立事件同时发生的概率的求法求解;(2)
先明确 的所有可能取值,再求得与 取值相对应的概率,最后写出分布列.
解:(1)设“该射手恰好命中一次”为事件A,“该射手射击甲靶命中”为事件B,“该射手第一次射
击乙靶命中”为事件C,“该射手第二次射击乙靶命中”为事件D.
由题意,知 , , .
根据事件的独立性和互斥性,得
(2)根据题意,知 的所有可能取值为
根据事件的独立性和互斥性,得故 的分布列为
0 1 2 3 4 5
规律总结:求解某些复杂事件的概率时,可以把复杂事件分解为一些互斥事件的和,利用概率加法公
式求解;也可以利用“正难则反”的思想,先求出复杂事件的对立事件的概率,再利用 求
解.
例3 某射手每次射击击中目标的概率是 ,且各次射击的结果互不影响.
某射手每次射击击中目标的概率是 ,且各次射击的结果互不影响。
(1)假设这名射手射击5次,求恰有2次击中目标的概率
(2)假设这名射手射击5次,求有3次连续击中目标。另外2次未击中目标的概率;
(3)假设这名射手射击3次,每次射击,击中目标得1分,未击中目标得0分,在3次射击中,若有
2次连续击中,而另外1次未击中,则额外加1分;若3次全击中,则额外加3分,记 为射手射
击3次后的总得分数,求 的分布列。
分析:(1) 利用独立重复试验的概率公式求解;(2)先明确射击5次,有3次命中目标,另外两次未
命中目标所包含的所有事件,再利用相互独立事件的概率公式求解;(3)先明确 的所有可能值,并利
用相互独立事件的概率公式求得与取值相对应的概率,再写出分布列
解:(1)设 为射手在5次射击中击中目标的次数,则 .在5次射击中,恰有2次击中
目标的概率
(2)解:设“第 次射击击中目标”为事件 ;“射手在5次射击中,有3次连续击中
目标,另外2次未击中目标”为事件 ,则=
(3)解:设“第 次射击击中目标”为事件
由题意可知, 的所有可能取值为
所以 的分布列是
0 1 2 3 6
解后反思:分布列只是一种形式,求出它的目的在于研究随机变量的规律性,如从分布列中可以看出
随机变量的分布情况以及随机变量取各个值所对应的概率大小等.
类型三 二项分布、超几何分布的应用
例4 投到某杂志的稿件,先由两位初审专家进行评审.若能通过两位初审专家的评审,则予以录用;若两
位初审专家都未予通过,则不予录用;若恰能通过一位初审专家的评审,则再由第三位专家进行复审,
若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为
0.5,复审的稿件能通过评审的概率为0.3.各专家独立评审.
(1)求投到该杂志的1篇稿件被录用的概率;
(2)记 表示投到该杂志的4篇稿件中被录用的篇数,求 的概率.解:(1)令事件 表示“能通过第 位初审专家的评审”,事件 表示“能通过复审专家的评
审 ” , 事 件 表 示 “ 投 到 该 杂 志 社 的 一 篇 稿 件 被 录 用 ” , 则
(2)由题意,知 ,故
,
规律总结:对于一个概率问题,应首先搞清楚它的类型,不同的类型采用不同的计算方法.一般的问
题中总有些关键语句说明其类型,对于复杂问题要善于进行分解或者运用逆向思考的方法.
例5 设有产品100件,其中次品5件,正品95件,现从中随机抽取20件,求抽得次品件数 的分布列.
分析:由题意,知抽得的次品件数服从超几何分布,也可以利用排列组合等相关知识直接求解:从100
件产品中,随机抽取20件,抽得次品件数 是一个离散型随机变量,且 的可能取值为
所以 , ,
, ,
,
所以 的分布列为
0 1 2 3 4 6
规律总结:随机变量 服从超几何分布,当求随机变量 的概率时,可以利用排列组合、古典概型等知识直接求解.
类型四 离散型随机变量的均值和方差
例6 为回馈顾客,某商场拟通过摸球兑奖的方式对 位顾客进行奖励. 规定:每位顾客从一个装有
个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
( 1 ) 若 袋 中 所 装 的 个 球 中 有 个 所 标 的 面 值 为 元 , 其 余
个均为 元,求①顾客所获的奖励额为 的概率;②顾客所获的奖励额的分布
列及数学期望;
(2)商场对奖励总额的预算是 元,并规定袋中的 个球只能由标有面值为 元和
元的两种球组成,或标有面值 元和 元的两种球组成. 为了使顾客得到的奖励
总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的 个球的
面值给出一个合适的设计,并说明理由.
分析:(1)①利用排列组合及古典概型求解;②顾客所获的奖励额可取 20和60;利用概率知识求出相
应的概率,从而得到分布列,利用公式求数学期望;(2)通过比较方差来确定方案.
解:(1)设顾客获得的奖励额为 .
①依题意,得 ,即顾客所获的奖励额为60元的概率是 .
②依题意,随机变量 的可能取值为 .
.
得 的分布列如下:
所以顾客所获的奖励额的期望为
(2)根据商场的预算,每个顾客的平均奖励额为 元.所以,先寻找期望为60元的可能方案:对于面值由 元和 元组成的情况,如果选择 方案,因为 元是面值之和的
最大值,所以期望不可能为 ;若选择 方案,因为 元是面值之和的最小值,所以
期望也不可能是 .因此可能的方案是 ,记为方案 .当球的面值为 元和 元时,
同理可排除 、 的方案,所以可能的方案是 ,记为方案 .
以下是对两个方案的分析:
对于方案 ,即方案 ,设顾客所获的奖励额为 ,则 的分布列为
的数学期望为
的方差为
对于方案 ,即方案 ,设顾客所获得奖励额为 ,则 的分布列为
的期望为
的方差为
因为两种方案奖励额的期望都符合要求,但方案 奖励额的方差要比方案 的小
所以应该选择方案 .即标有面值 元和面值 元的球各两个.
规律总结:求离散型随机变量 的均值的步骤:
(1)理解 的意义,写出 可能取的全部值;
(2)求 取每个值相对应的概率;
(3)写出 的分布列;(4)利用均值公式 ,求出均值.
例7 下图是某市3月1日至14日的空气质量指数趋势图,空气质量指数小于 100表示空气质量优良,空
气质量指数大于200表示空气重度污染.某人随机选择3月1日至3月13日中的某一天到达该市,并
停留2天.
(1)求此人到达当日空气重度污染的概率;
(2)设X是此人停留期间空气质量优良的天数,求X的分布列与数学期望;
(3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)
分析:(1)根据互斥事件的概率公式求解;(2)明确的所有可能取值,并计算相应的概率,再由均值公
式求解;(3)根据方差的意义判断.
解:设 表示事件“此人于3月 日到达该市”( ).
根据题意, ,且 .
(1)设B为事件“此人到达当日空气重度污染”,则 .
所以
(2)由题意可知,X的所有可能取值为0,1,2,且
,
,
.
所以X的分布列为:X 0 1 2
P
故X的期望
(3)从3月5号开始连续三天的空气质量指数方差最大.
规律总结:离散型随机变量的分布列、均值和方差是三个紧密联系的有机统一体,一般在试题中会综合在
一起考查,其解题的关键是求出分布列.
类型五 正态分布
例8 某市去年高考考生成绩服从正态分布 ,现有50000名考生,试确定考生成绩在
分的人数.
分析:先求出考生成绩在 分的概率,再求人数.
解:设考生成绩为 ,因为 服从正态分布 ,所以 ,正态曲线关于直线
对称,所以
且
所以
所以考生成绩在 分的约有 (人)
规律总结:当随机变量服从正态分布时,首先确定 ,画出正态曲线的大致形状,然后充分利用正
态曲线关于直线 对称及在三个特殊区间的概率进行求解.
类型六 概率、统计知识的综合应用
例9一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示:将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
(2)用 表示在未来3天里日销售量不低于100个的天数,求随机变量 的分布列,期望 及方
差 .
分析:首先根据频率分布直方图求出相应的概率,然后求出离散型随机变量 的分布列,最后根据分
布列求出数学期望与方差即可.
解析:(1)设 表示事件“日销售量不低于100个”, 表示事件“日销售量低于50个”, 表示
事件“在未来连续3天里有连续2天日销售量不低于100个且另一天的日销售量低于50个”.因此
.
. .
(Ⅱ) 的可能取值为 ,相应的概率为
, ,
, ,分布列为
0 1 2 3
0.064 0.288 0.432 0.216
因为 ,所以期望为 ,方差
解后反思:在本题中,求分布列的关键在于求概率,因此需要掌握相关的统计、概率知识及常见概率
类型的求法.