文档内容
易错点 16 随机变量及其分布列
易错点1.随机变量和分布列理解错误
1.离散型随机变量
一般地,如果随机试验的样本空间为Ω,而且对于Ω中的每一个样本点,变量
X都对应有唯一确定的实数值,就称X为一个随机变量.其所有可能的取值都是
可以一一列举的随机变量称为离散型随机变量.
2.离散型随机变量的分布列
一般地,若离散型随机变量 X 的取值范围是{x ,x ,…,x },如果对任意
1 2 n
k∈{1,2,…,n},概率P(X=x )=p 都是已知的,则称X的概率分布是已知的,
k k
离散型随机变量X的概率分布可以用如下形式的表格表示,这个表格称为 X的
概率分布或分布列.
X x x … x … x
1 2 k n
P p p … p … p
1 2 k n
3.离散型随机变量的分布列的性质
(1)p ≥0,k=1,2,…,n;
k
(2)∑p =p +p +…+p =1.
k 1 2 n
4.离散型随机变量的数学期望与方差、标准差
一般地,如果离散型随机变量X的分布列如下表所示
X x x … x … x
1 2 k n
P p p … p … p
1 2 k n
(1)均值
称E(X)=x p + x p + … + x p = ∑ x p 为离散型随机变量X的均值或数学期望(简
1 1 2 2 n n i i
称为期望).
(2)方差
D(X)=[x -E(X)]2p +[x -E(X)]2p +…+[x -E(X)]2p = ∑ [ x - E ( X ) ] 2 p,能够刻
1 1 2 2 n n i i
画X相对于均值的离散程度(或波动大小),这称为离散型随机变量X的方差.
(3)标准差
称称为离散型随机变量 X的标准差,它也可以刻画一个离散型随机变量的离散
程度(或波动大小).5.均值与方差的性质
(1)E(aX+b)= aE ( X ) + b .
(2)D(aX+b)= a 2 D ( X ) (a,b为常数).
易错点2.常见分布列分辨不清
1.n次独立试验与二项分布
(1)n次独立重复试验
在相同条件下重复n次伯努利试验时,人们总是约定这 n次试验是相互独立的,
此时这n次伯努利试验也常称为n次独立重复试验.
(2)二项分布
一般地,如果一次伯努利试验中,出现“成功”的概率为p,记q= 1 - p ,且n
次独立重复试验中出现“成功”的次数为X,则X的取值范围是{0,1,…,
k,…,n},而且P(X=k)= C p k q n - k,k=0,1,…,n,
因此X的分布列如下表所示
X 0 1 … k … n
P Cp0qn Cp1qn-1 … C p k q n - k … Cpnq0
注意到上述X的分布列第二行中的概率值都是二项展开式(q+p)n=Cp0qn+Cp1qn
-1+…+Cpkqn-k+…+Cpnq0中对应项的值,因此称 X服从参数为n,p的二项
分布,记作X~B(n,p).
2.两点分布与二项分布的均值、方差
(1)若随机变量X服从两点分布,则E(X)=p,D(X)= p (1 - p ) .
(2)若X~B(n,p),则E(X)=np,D(X)= np (1 - p ) .
3.超几何分布
一般地,若有总数为N件的甲、乙两类物品,其中甲类有 M件(M4)=( )
A.0.1588 B.0.1587 C.0.1586 D.0.1585
【答案】B
【详解】试题分析:正态分布曲线关于 对称,因为
,故选B.
2.设两个正态分布 和 的密度函数图像如图所示.则
有
A.B.
C.
D.
【答案】A
【详解】根据正态分布 函数的性质:正态分布曲线是一条关于 对称,在
处取得最大值的连续钟形曲线; 越大,曲线的最高点越底且弯曲较平缓;反过来,
越小,曲线的最高点越高且弯曲较陡峭,选A.
3.已知随机变量 服从正态分布 ,且 ,则 ( )
A.0.6 B.0.4 C.0.3 D.0.2
【答案】C
【详解】解:因为 ,所以 .
由题意知图象(如图)的对称轴为直线 ,
,
所以 .
所以 .
故选:C.
4.某物理量的测量结果服从正态分布 ,下列结论中不正确的是( )
A. 越小,该物理量在一次测量中在 的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在 与落在 的概率相等
【答案】D
【详解】对于A, 为数据的方差,所以 越小,数据在 附近越集中,所以测量结
果落在 内的概率越大,故A正确;
对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为 ,故B
正确;对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于 的概率与小于
的概率相等,故C正确;
对于D,因为该物理量一次测量结果落在 的概率与落在 的概率不同,
所以一次测量结果落在 的概率与落在 的概率不同,故D错误.
故选:D.
5.某一批花生种子,如果每1粒发芽的概率为 ,那么播下4粒种子恰有2粒发芽的概率
是
A. B. C. D.
【答案】B
【详解】解:根据题意,播下4粒种子恰有2粒发芽即4次独立重复事件恰好发生2次,
由n次独立重复事件恰好发生k次的概率的公式可得,
故选B.
一、单选题
1.若 , , ,则事件 与 的关系是( )
A.事件 与 互斥 B.事件 与 对立
C.事件 与 相互独立 D.事件 与 既互斥又相互独立
【答案】C
【详解】∵ ,
∴ ,
∴事件 与 相互独立、事件 与 不互斥,故不对立.
故选:C
2.已知随机变量 服从正态分布 ,若 ,则 ( )
A.0.977 B.0.954 C.0.5 D.0.023
【答案】B【详解】随机变量 服从正态分布 ,
若 ,则依据正态曲线的性质有
故选:B
3.读取速度是衡量固态硬盘性能的一项重要指标,基于M.2 PCle4.0 NVMe协议的固态硬
盘平均读取速度可达 以上.某企业生产的该种固态硬盘读取速度( )服
从正态分布 .若 ,则可估计该企业生产的1000
个该种固态硬盘中读取速度低于 的个数为( )
A.100 B.200 C.300 D.400
【答案】B
【详解】由正态分布的对称性可知: ,
所以 ,
所以该企业生产的1000个该种固态硬盘中读取速度低于 的个数为
.
故选:B
4.下列说法错误的是( )
A.相关系数r越大,两个变量的线性相关性越强
B.若 ,且 ,则
C.相关指数 ,表示解释变量对于预报变量变化的贡献率为64%
D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
【答案】A
【详解】对于A中,根据相关系数的定义知:相关系数 越大且 ,两个变量的线性
相关性越强,所以A不正确;
对于B中,若 ,且 ,
可得 ,所以B正确;
对于C中,根据相关系数的概念,当相关指数 ,表示解释变量对于预报变量变化
的贡献率为 ,所以C正确;
对于D中,根据数据的残差的定义,在残差图中,残差点分布的带状区域的宽度越狭窄,
其模型拟合的精度越高,所以D正确.
故选:A.5.目前,国际上常用身体质量指数BMI 来衡量人体胖瘦程度以及是否
健康.某公司对员工的BMI值调查结果显示,男员工中,肥胖者的占比为 ;女员工中,
肥胖者的占比为 ,已知公司男、女员工的人数比例为2:1,若从该公司中任选一名肥
胖的员工,则该员工为男性的概率为( )
A. B. C. D.
【答案】D
【详解】设公司男、女员工的人数分别为 和 ,
则男员工中,肥胖者有 人,
女员工中,肥胖者有 人,
设任选一名员工为肥胖者为事件 ,肥胖者为男性为事件 ,
则 , ,
则 .
故选:D.
6.甲乙二人争夺一场围棋比赛的冠军,若比赛为“三局两胜”制,甲在每局比赛中获胜的
概率均为 ,各局比赛结果相互独立且没有平局,则在甲获得冠军的情况下,比赛进行了
三局的概率为( )
A. B. C. D.
【答案】A
【详解】设甲获得冠军为 ,比赛进行了三局为 ,
则 , ,
所以 .所以在甲获得冠军的情况下,比赛进行了三局的概率为 .
故选:A
7.甲口袋中有3个红球,2个白球和5个黑球,乙口袋中有3个红球,3个白球和4个黑球,
先从甲口袋中随机取出一球放入乙口袋,分别以 和 表示由甲口袋取出的球是红球,
白球和黑球的事件;再从乙口袋中随机取出一球,以B表示由乙口袋取出的球是红球的事
件,则下列结论中正确的是( )
A. B.事件 与事件B相互独立
C. D.
【答案】D
【详解】由题意得 ,所以A错误;
因为 ,
,所
以 ,即 ,
故事件事件 与事件B不相互独立,所以B错误,D正确;
,所以C错误;
故选:D
8.已知两个随机变量X,Y,其中 , (σ>0),若E(X)=E(Y),且
,则 ( )
A.0.2 B.0.3 C.0.4 D.0.1
【答案】A
【详解】由题设 ,即 ,
又 ,故 .
故选:A
二、多选题9.给出下列命题,其中错误命题是( )
A.若样本数据 (数据各不相同)的平均数为3,则样本数据 , ,
…, 的平均数为2
B.随机变量 的方差为 ,则
C.随机变量 服从正态分布 , ,则
D.随机变量 ,若 , ,则
【答案】ABD
【详解】对于选项A,根据 得: ,
故选项A错误;
对于选项B,根据 得: ,故选项B错误;
对于选项C,因为 ,所以 ,又因为 ,
则 ,由正态分布的对称性可得:
,故选项C正确;
对于选项D,随机变量 ,根据二项分布的期望和方差公式:
,解得 ,故选项D错误.
故选:ABD
10.已知红箱内有6个红球、3个白球,白箱内有3个红球、6个白球,所有小球大小、形
状完全相同.第一次从红箱内取出一球后再放回去,第二次从与第一次取出的球颜色相同
的箱子内取出一球,然后再放回去,依此类推,第 次从与第k次取出的球颜色相同的
箱子内取出一球,然后再放回去.记第 次取出的球是红球的概率为 ,则下列说法正确
的是( )
A. B.
C.第5次取出的球是红球的概率为 D.前3次取球恰有2次取到红球的概率是
【答案】AC
【详解】依题意 ,设第 次取出球是红球的概率为 ,则白球概率为 ,
对于第 次,取出红球有两种情况.
①从红箱取出的概率为 ,②从白箱取出的概率为 ,
对应 ,即 ,故B错误;
所以 ,
令 ,则数列 为等比数列,公比为 ,因为 ,所以 ,
故 ,所以 , 故选项A,C正确;
第1次取出球是红球的概率为 ,第2次取出球是红球的概率为 ,
第3次取出球是红球的概率为 ,
前3次取球恰有2次取到红球的概率是 ,
故D错误;
故选:AC.
三、解答题
11.有甲、乙两个盒子,甲盒子中装有2个小球,乙盒子中装有4个小球,每次随机取一个
盒子并从中取一个球.
(1)求甲盒子中的球被取完时,乙盒子中恰剩下2个球的概率:
(2)当其中一个盒子中的球被取完时,记另一个盒子恰剩下 个球,则求 的分布列与数学
期望 .
【答案】(1)
甲盒子中的球被取完时,乙盒子中恰剩下2个球,意味着总共取了四次球,第四次取到的
一定是甲盒中的球,
前三次中有一次取到甲盒中的球,另外两次取的是乙盒中的球,
所以
(2)
由题意知: 的可能取值为1.2.3.4,
当 时,总共取了5次球,剩余的一个球可能在甲盒子中,也可能在乙盒子中,若剩余的一个球在甲(乙)盒子中,则第5次取到的是乙(甲)盒子中的球,前4次有一
次取到甲盒子中的球,另外3次取到乙盒子中的球,
所以 ,
当 时,总共取了4次球,剩余的2个球可能在甲盒子中,也可能在乙盒子中,
若剩余的2个球在甲盒子中,则4次均取到乙盒子中的球,
若剩余的2个球在乙盒子中,则第4次取到甲盒中的球,前3次有1次取到甲盒中的球,
有2次取到乙盒子中的球,
故
当 时,总共取了3次球,剩余的3个球一定在乙盒子中,第3次一定取到的是甲盒中
的球,前2次有1次取到甲盒中的球,有1次取到乙盒子中的球,
所以 ,
当 时,总共取了2次球,剩余的4个球一定在乙盒子中,前2次均取到甲盒中的球,
故 .
即 的分布列为:
1 2 3 4
计算可得:
12.某学校在寒假期间安排了“垃圾分类知识普及实践活动”.为了解学生的学习成果,该
校从全校学生中随机抽取了100名学生作为样本进行测试,记录他们的成绩,测试卷满分
100分,并将得分分成以下6组: 、 、 、…、 ,统计结果如
图所示:
(1)试估计这100名学生得分的平均数;(2)从样本中得分不低于70分的学生中,用分层抽样的方法选取11人进行座谈,若从座谈
名单中随机抽取3人,记其得分在 的人数为 ,试求 的分布列和数学期望;
(3)以样本估计总体,根据频率分布直方图,可以认为参加知识竞赛的学生的得分X近似地
服从正态分布 ,其中 近似为样本平均数, 近似为样本方差 ,经计算
.所有参加知识竞赛的2000名学生中,试问得分高于77分的人数最有可能是多少?
参考数据: , ,
.
【详解】(1)解:由频率分布直方图可得这100名学生得分的平均数
.
(2)
0.01
解:参加座谈的11人中,得分在 的有11 2人,
0.030.0150.01
所以的可能取值为0,1,2,
C3 28 C2C1 24 C1C2 3
所以P0 9 ,P1 9 2 ,P2 9 2 .
C3 55 C3 55 C3 55
11 11 11
所以的分布列为
0 1 2
28 24 3
P
55 55 55
28 24 3 6
∴E0 1 2 .
55 55 55 11
(3)解:由(1)知,X ~ N
70.5,6.52
,
10.6827
所以PX 77PX 0.15865.
2
E(X)20000.15865317
得分高于77分的人数最有可能是317.