第7讲 离散型随机变量的均值与方差、正态分布
最新考纲 考向预测
1.通过具体实例,理解离散型随机变量 离散型随机变量的均值和方
分布列及其数字特征(均值、方差). 命题 差、二项分布的均值和方差仍
2.通过具体实例,了解伯努利试验,掌 趋势 是高考考查的热点,题型以解
答题为主.
握二项分布及其数字特征,并能解决
简单的实际问题.
核心
3.通过误差模型,了解服从正态分布的 数据分析、数学建模
素养
随机变量.
1.离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列为
X x x … x … x
1 2 i n
P p p … p … p
1 2 i n
(1)均值
称E(X)=x p + x p + … + xp + … + x p 为随机变量X的均值或数学期望.它
1 1 2 2 i i n n
反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)= ( x - E ( X ) ) 2 p 为随机变量X的方差,它刻画了随机变量 X与其均值
i i
E(X)的平均偏离程度,并称其算术平方根为随机变量X的标准差.
(3)性质
(a)E(aX+b)= aE ( X ) + b .
(b)D(aX+b)= a 2 D ( X ) .(a,b为常数)
2.几个特殊分布的期望、方差
分布 期望 方差
两点分布 p p(1-p)
二项分布 np np(1-p)
正态分布 μ σ2
3.正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交.(2)曲线是单峰的,它关于直线 x = μ 对称.
(3)曲线在x=μ处达到峰值 .
(4)曲线与x轴之间的面积为1.
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移.
(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分
布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
常用结论
均值与方差的七个常用性质
若Y=aX+b,其中a,b是常数,X是随机变量,则
(1)E(k)=k,D(k)=0,其中k为常数.
(2)E(aX+b)=aE(X)+b,D(aX+b)=a2D(X).
(3)E(X +X )=E(X )+E(X ).
1 2 1 2
(4)D(X)=E(X2)-(E(X))2.
(5)若X ,X 相互独立,则E(X ·X )=E(X )·E(X ).
1 2 1 2 1 2
(6)若X服从两点分布,则E(X)=p,D(X)=p(1-p).
(7)若X服从二项分布,即X~B(n,p),则E(X)=np,D(X)=np(1-p).
常见误区
1.E(X)是一个实数,由X的分布列唯一确定,即作为随机变量,X是可变的,
可取不同值,而E(X)是不变的.
2.求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在
求解时,要注意计数原理、排列组合及常见概率模型.
1.判断正误(正确的打“√”,错误的打“×”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,
方差或标准差越小,则偏离均值的平均程度越小.( )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,
σ是正态分布的标准差.( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果
之和,它就服从或近似服从正态分布.( )
(5)均值是算术平均数概念的推广,与概率无关.( )
答案:(1)√ (2)√ (3)√ (4)√ (5)×2.(多选)设离散型随机变量X的分布列为
X 0 1 2 3 4
P q 0.4 0.1 0.2 0.2
若离散型随机变量Y满足Y=2X+1,则下列结果正确的有( )
A.q=0.1 B.E(X)=2
C.D(X)=1.4 D.E(Y)=5
解析:选ABD.因为q+0.4+0.1+0.2+0.2=1,所以q=0.1,故A正确;又
E(X)=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,B正确,D(X)=(0-2)2×0.1
+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,C不正确;E(Y)
=2×E(X)+1=2×2+1=5,D正确.
3.已知随机变量X服从正态分布N(2,σ2),且P(X<4)=0.88.则P(0
E(Y ),所以该医院选择延保方案二更合算.
1 2
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计
中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取
值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于
方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
某投资公司在 2020年年初准备将 1 000万元投资到“低碳”
项目上,现有两个项目供选择:
项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,
也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可
能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由
解:若按“项目一”投资,设获利为X 万元,则X 的分布列为
1 1
X 300 -150
1
P
所以E(X )=300×+(-150)×=200.
1
D(X )=(300-200)2×+(-150-200)2×=35 000,
1
若按“项目二”投资,设获利为X 万元,则X 的分布列为
2 2
X 500 -300 0
2
P
所以E(X )=500×+(-300)×+0×=200.
2
D(X )=(500-200)2×+(-300-200)2×+(0-200)2×=140 000.
2
所以E(X )=E(X ),D(X )4)=P(X<0),则μ=( )
A.1 B.2
C.3 D.4
解析:选B.正态曲线关于直线x=μ对称,若P(X>4)=P(X<0),则μ==2.2.(2021·贵阳市适应性考试)已知随机变量X~B(2,p),Y~N(2,σ2),若
P(X≥1)=0.64,P(04)=________.
解析:因为随机变量X~B(2,p),P(X≥1)=0.64,
所以P(X≥1)=P(X=1)+P(X=2)=1-P(X=0)=1-(1-p)2=0.64,
解得p=0.4或p=1.6(舍去),所以P(04)=(1-0.4×2)=0.1.
答案:0.1
3.在我市的高二年级期末考试中,理科学生的数学成绩X~N(90,σ2),已知
P(70≤X≤90)=0.35,则从全市理科生中任选一名学生,他的数学成绩小于 110
分的概率为________.
解析:因为X~N(90,σ2),
所以μ=90,即正态曲线关于x=90对称.
因为P(70≤X≤90)=0.35,所以P(90≤X≤110)=0.35,
所以P(X≥110)=P(X≥90)-P(90≤X<110)=0.5-0.35=0.15,则P(X<110)=
1-0.15=0.85.
答案:0.85
服从N(μ,σ2)的随机变量X在某个区
间内取值的概率的求法
(1)利用P(μ-σ0.若X的方差D(X)≤对所有a∈(0,1-b)都成立,则( )
A.b≤ B.b≤
C.b≥ D.b≥
解析:选D.依题意,知a+b+c=1,故c=1-a-b,当a∈(0,1-b)时,E(X)=
-a+c=1-b-2a,则D(X)=E(X2)-E2(X)=a+c-(c-a)2=a+c-[(c-a)2+
4ac]+4ac=(a+c)-(a+c)2+4a(1-b-a)
=(1-b)-(1-b)2+4a(1-b-a),令1-b=t,则t∈(0,1),
D(X)=t-t2+4a(t-a)≤,a∈(0,t),
故4a2-4at+t2-t+≥0在a∈(0,t)上恒成立,
当a=时D(X)有最小值,故4-4××t+t2-t+≥0,故t≤,即1-b≤,所以
b≥,故选D.
[A级 基础练]
1.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=(
)
A.0.6 B.0.4
C.0.3 D.0.2
解析:选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
2.在某“猜羊”游戏中,一只羊随机躲在两扇门背后,参赛选手选择其中一
个门并打开,若这只羊就在该门后,则为猜对;否则,为猜错.已知一位选手获得
了4次“猜羊”机会,若至少猜对2次才能获奖,则该选手获奖的概率为( )
A.0.25 B.0.312 5
C.0.5 D.0.687 5
解析:选D.方法一:该选手获奖的概率为P=C×+C×+C×==0.687 5.
方法二:该选手获奖的对立事件为“该选手只猜对一次或一次都没有猜对”,
所求概率为P=1-=1-==0.687 5.
3.(多选)已知ξ是离散型随机变量,则下列结论正确的是( )
A.P≤P
B.(E(ξ))2≤E(ξ2)
C.D(ξ)=D(1-ξ)
D.D(ξ2)=D((1-ξ)2)
解析:选ABC.在A项中,P=P≤P=P,故A项正确;在B项中,由D(ξ)=
E(ξ2)-(E(ξ))2≥0得(E(ξ))2≤E(ξ2)成立,故B项正确;在C项中,由方差的性质
D(aX+b)=a2D(X)得D(ξ)=D(1-ξ),故C项正确;在D项中,D(ξ2)≠D((1-ξ)2)=
4D(ξ)+D(ξ2),故D项错误,故选ABC项.
4.(多选)(2020·山东临沂期末)某市有A,B,C,D四个景点,一位游客来该市
游览,已知该游客游览A的概率为,游览B,C和D的概率都是,且该游客是否游
览这四个景点相互独立.用随机变量X表示该游客游览的景点的个数,则下列判
断正确的是( )
A.游客至多游览一个景点的概率是
B.P(X=2)=
C.P(X=4)=
D.E(X)=
解析:选ABD.记该游客游览i个景点为事件A,i=0,1,则P(A )==,P(A )
i 0 1
=×+3×××=,所以游客至多游览一个景点的概率为P(A )+P(A )=+=,故
0 1
A正确.随机变量X的可能取值为0,1,2,3,4,P(X=0)=P(A )=,P(X=1)=
0
P(A )=,P(X=2)=×C××+×C××=,故B正确.P(X=3)=×C××+×C×
1
=,P(X=4)=×=,故C错误.E(X)=0×+1×+2×+3×+4×=,故D正确.
故选ABD.5.口袋中有编号分别为1,2,3的三个大小和形状相同的小球,从中任取2个,
则取出的球的最大编号X的期望为________.
解析:因为口袋中有编号分别为1,2,3的三个大小和形状相同的小球,从中
任取2个,所以取出的球的最大编号X的可能取值为2,3,所以P(X=2)==,P(X
=3)==,所以E(X)=2×+3×=.
答案:
6.某篮球队对队员进行考核,规则是:①每人进行3个轮次的投篮;②每个轮
次每人投篮2次,若至少投中1次,则本轮通过,否则不通过,已知队员甲投篮1
次投中的概率为,如果甲各次投篮投中与否互不影响,那么甲3个轮次通过的次
数X的期望和方差分别是________.
解析:由题意可知每个轮次通过的概率P=1-=,且X服从二项分布,即X
~B,所以由二项分布的期望与方差公式得E(X)=3×=,D(X)=3××=.
答案:,
7.为了让贫困地区的孩子们过一个温暖的冬天,某校阳光志愿者社团组织
了“这个冬天不再冷”冬衣募捐活动,共有50名志愿者参与.志愿者的工作内容
有两项:①到各班宣传,倡议同学们积极捐献冬衣;②整理、打包募捐上来的衣物
每位志愿者根据自身实际情况,只参与其中的某一项工作,相关统计数据如下表
所示:
到班级宣传 整理、打包衣物 总计
20人 30人 50人
(1)如果用分层抽样的方法从这50名志愿者中抽取5人,再从这5人中随机
选2人,求至少有1人是参与班级宣传的志愿者的概率;
(2)若参与班级宣传的志愿者中有12名男生,8名女生,从中选出2名志愿者
用X表示女生人数,写出随机变量X的分布列及数学期望.
解:(1)用分层抽样的方法,抽样比是=,
所以5人中参与班级宣传的志愿者有20×=2(人),
参与整理、打包衣物的志愿者有30×=3(人),
故所求概率P=1-=.
(2)X的所有可能取值为0,1,2,
则P(X=0)==,
P(X=1)==,
P(X=2)==,所以X的分布列为
X 0 1 2
P
所以X的数学期望E(X)=0×+1×+2×=.
8.(2020·广州市调研检测)某城市A公司外卖配送员底薪是每月1 800元/人,
设每月每人配送的单数为X,若X∈[1,300],配送员每单提成3元;若X∈(300,
600],配送员每单提成4元;若X∈(600,+∞),配送员每单提成4.5元.B公司外
卖配送员底薪是每月2 100元/人,设每月每人配送的单数为Y,若Y∈[1,400],配
送员每单提成3元;若Y∈(400,+∞),配送员每单提成4元.小王计划在A公司
和B公司之间选择一份外卖配送员工作,他随机调查了A公司外卖配送员甲和B
公司外卖配送员乙在9月份(30天)的送餐量数据,如下表:
表1:A公司外卖配送员甲送餐量统计
日送餐量x/单 13 14 16 17 18 20
天数 2 6 12 6 2 2
表2:B公司外卖配送员乙送餐量统计
日送餐量y/单 11 13 14 15 16 18
天数 4 5 12 3 5 1
(1)设A公司外卖配送员月工资为f(X)(单位:元/人),B公司外卖配送员月工资
为g(Y)(单位:元/人),当X=Y且X,Y∈(300,600]时,比较f(X)与g(Y)的大小;
(2)若将甲、乙9月份的日送餐量的频率视为对应公司日送餐量的概率,
(i)分别计算外卖配送员甲和乙每日送餐量的数学期望;
(ii)请利用你所学的知识为小王作出选择,并说明理由.
解:(1)因为X=Y且X,Y∈(300,600],所以g(X)=g(Y),
当X∈(300,400]时,f(X)-g(X)=(1 800+4X)-(2 100+3X)=X-300>0.
当X∈(400,600]时,f(X)-g(X)=(1 800+4X)-(2 100+4X)=-300<0.
故当X∈(300,400]时,f(X)>g(Y),当X∈(400,600]时,f(X)3 720,所以小王应选择B公司外卖配送员.
[B级 综合练]
9.(2021·广东佛山开学摸底)高铁和航空的飞速发展不仅方便了人们的出行,
更带动了我国经济的巨大发展.据统计,某一年乘坐高铁或飞机从A市到B市的
成年人约50万人次,为了解乘客出行的满意度,现从中随机抽取了100人次作为
样本,得到下表(单位:人次).
老年人 中年人 青年人
满意度 乘坐高铁 乘坐飞机 乘坐高铁 乘坐飞机 乘坐高铁 乘坐飞机
10分(满
12 1 20 2 20 1
意)
5分(一
2 3 6 2 4 9
般)
0分(不满
1 0 6 3 4 4
意)
(1)在样本中任取1个,求这个出行人恰好不是青年人的概率;
(2)从这一年乘坐高铁从A市到B市的所有成年人中,随机选取2人次,记其
中老年人出行的人次为X,以频率作为概率,求X的分布列和数学期望;
(3)如果甲将要从A市出发到B市,那么根据表格中的数据,你建议甲是乘坐
高铁还是飞机?并说明理由.
解:(1)设事件M为“在样本中任取1个,这个出行人恰好不是青年人”.由
表可得,样本中出行的老年人、中年人人次分别为19,39.
所以在样本中任取1个,这个出行人恰好不是青年人的概率P(M)==.
(2)由题意,X的所有可能取值为0,1,2.
易知乘坐高铁从A市到B市的所有成年人中,随机选取1人次,此人次为老
年人的概率是p==.所以P(X=0)==,P(X=1)=C××=,
P(X=2)==.
所以X的分布列为
X 0 1 2
P
方法一:故E(X)=0×+1×+2×=.
方法二:因为X~B,所以E(X)=2×=.
(3)从满意度的均值来分析问题.
由表可知,乘坐高铁的人次满意度均值为=.
乘坐飞机的人次满意度均值为=.
因为>,所以建议甲乘坐高铁从A市到B市.
10.(2020·山东枣庄、滕州联考)某投资公司准备在2018年年初将4百万元投
资到三门峡下列两个项目中的一个之中.
项目一:天坑院是黄土高原地域独具特色的民居形式,是人类“穴居”发展
史演变的实物见证.现准备投资建设20个天坑院,每个天坑院投资0.2百万元,
假设每个天坑院是否盈利是相互独立的,据市场调研,到2020年底每个天坑院盈
利的概率为p(0E(X )时,1.6p>3.2p-1.2,
1 2
解得0
4),则μ与D(ξ)的值
分别为μ=3,D(ξ)=7
解析:选ABCD.A.因为ξ~N(1,σ2),P(ξ<4)=0.79,
所以P(ξ≥4)=0.21,
因为P(ξ≤-2)=P(ξ≤1-3)=P(ξ≥1+3)=P(ξ≥4),
所以P(ξ≤-2)=0.21,故A正确.
B.因为直线l⊥平面α,m∥平面β,
又因为α∥β,
所以l⊥平面β,
所以l⊥m.反之,l⊥平面α,m∥平面β,l⊥m,
平面α与平面β不一定平行,可能相交,故B正确.
C.因为ξ~B,
所以E(ξ)=4×=1,故C正确.
D.随机变量ξ服从正态分布N(μ,7),P(ξ<2)=P(ξ>4),所以μ==3,D(ξ)=7,
故D正确.12.公司为了准确把握市场,做好产品计划,特对某产品做了市场调查:先销
售该产品50天,统计发现每天的销量x(单位:件)分布在[50,100)内,且销量x的
分布频率f(x)=若销量大于或等于70件,则称该日畅销,其余为滞销.在畅销日
中用分层抽样的方法随机抽取8天,再从这8天中随机抽取3天进行统计,设这3
天来自X个组,将频率视为概率,则随机变量X的数学期望为( )
A. B.
C. D.
解析:选C.由题意知解得5≤n≤9,故n可取5,6,7,8,9,代入f(x),得-0.5
+-0.5+-a+-a+-a=1,得a=0.15.故销量在[70,80),[80,90),[90,100)内
的频率分别是0.2,0.3,0.3,频率之比为2∶3∶3,所以各组抽取的天数分别为2,
3,3,X的所有可能取值为1,2,3,P(X=1)===,P(X=3)===,P(X=2)=1-
-=.
X的分布列为
X 1 2 3
P
数学期望E(X)=1×+2×+3×=.