文档内容
专题十五 《概率与分布列》讲义
15.4 正态分布
题型一 . 正正态分布
1.(2017•宝鸡三模)设随机变量 服从正态分布N(3,4),若P( <2a﹣3)=P
( >a+2),则a的值等于( )ξ ξ
ξ 5 7
A. B. C.3 D.5
3 3
【解答】解:∵P( <2a﹣3)=P( >a+2),
∴2a﹣3+a+2=6, ξ ξ
7
∴a= .
3
故选:B.
2.(2018春•清远期末)设两个正态分布N ( ,σ )和N ( , )的密度函数曲线
1 1
❑
2 2 2 σ2
1 2
μ μ
如图所示,则有( )
A. < ,σ <σ B. < ,σ >σ
1 2 1 2 1 2 1 2
C.μ1 >μ2 ,σ
1
<σ
2
D.μ1 >μ2 ,σ
1
>σ
2
【解μ答】μ解:从正态曲线的对称轴的位置看,显然μ
1
<μ
2
,
正态曲线越“瘦高”,表示取值越集中,σ越小, μ μ
∴σ <σ
1 2
故选:A.
3.(2021春•沈阳期末)设X~N( ,σ2 ),Y~N( ,σ 2),这两个正态分布密度曲
1 1 2 2
线如图所示,下列结论中错误的是μ( ) μA.P(Y≥ )≥P(Y≥ )
2 1
B.P(X≤μσ
2
)≤P(X≤μσ
1
)
C.对任意正数t,P(X≤t)≥P(Y≤t)
D.对任意正数t,P(X≥t)≥P(Y≥t)
【解答】解:∵由图可知, <0<u ,σ <σ ,
1 2 1 2
∴P(Y≥
2
)<P(Y≥
1
)μ,故A选项错误,
由图可得,μ P(X≤σ
2
)>μ P(X≤σ
1
),故B选项错误,
由图可得,对任意实数t,P(X≤t)≥P(Y≤t),而P(X≤t)=1﹣P(X≥t),P
(Y≤t)=1﹣P(Y≥t),故P(X≥t)<P(Y≥t),故C选项正确,D选项错误.
故选:ABD.
4.(2016秋•武汉期末)某市教育局为了了解高三学生体育达标情况,对全市高三学生进
行了体能测试,经分析,全市学生体能测试成绩 X服从正态分布N(80,σ2)(满分为
100分),已知P(X<75)=0.3,P(X≥95)=0.1,现从该市高三学生中随机抽取3
位同学.
(1)求抽取的三位同学该次体能测试成绩在区间[80,85),[85,95),[95,100)各
有一位同学的概率;
(2)记抽到的3位同学该次体能测试成绩在区间[75,85]内的人数为 ,求随机变量
的分布列和数学期望E( ). ξ ξ
ξ 1
【解答】解:(1)P(80≤X<85)= −P(X<75)=0.2⋯(2 分)P(85≤X<
2
95)=0.3﹣0.1=0.2,P(95≤X<100)=0.1,…(4分)
所以所求概率为 (6分)
P=A3×0.2×0.2×0.1=0.024⋯
3
(2) 的可能值为0,1,2,3.则
P(ξ=k)=Ck (0.4) k (0.6) 3−k,k=0,1,2,3
3
ξ
.,
,
P(ξ=0)=C0 (0.4) 0 (0.6) 3=0.216
3
,
P(ξ=1)=C1 (0.4) 1 (0.6) 2=0.432
3
,
P(ξ=2)=C2 (0.4) 2 (0.6) 1=0.288
3P(ξ=3)=C3 (0.4) 3 (0.6) 0=0.064
3
0 1 2 3
Pξ 0.216 0.432 0.288 0.064
E( )=0×0.216+1×0.432+2×0.288+3×0.064=1.2…(12分)
ξ
5.(2014•新课标Ⅰ)从某企业生产的某种产品中抽取 500件,测量这些产品的一项质量
指标值,由测量结果得如下频率分布直方图:
(Ⅰ)求这500件产品质量指标值的样本平均数x和样本方差s2(同一组中数据用该组
区间的中点值作代表);
(Ⅱ)由直方图可以认为,这种产品的质量指标值Z服从正态分布N( ,σ2),其中
近似为样本平均数x,σ2近似为样本方差s2.
μ μ
(i)利用该正态分布,求P(187.8<Z<212.2);
(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位
于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.
附:√150≈12.2.
若Z~N( ,σ2)则P( ﹣σ<Z< +σ)=0.6826,P( ﹣2σ<Z< +2σ)=0.9544.
【解答】解μ:(Ⅰ)抽取μ产品的质量μ指标值的样本平均数μx和样本方μ差s2分别为:
x=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2 = ( ﹣ 30 ) 2×0.02+ ( ﹣ 20 ) 2×0.09+ ( ﹣ 10 )
2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(Ⅱ)(i)由(Ⅰ)知Z~N(200,150),从而P(187.8<Z<212.2)=P(200﹣
12.2<Z<200+12.2)=0.6826;
(ii)由(i)知一件产品的质量指标值位于区间(187.8,212.2)的概率为0.6826,
依题意知X~B(100,0.6826),所以EX=100×0.6826=68.26.
6.(2017•新课标Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为
这条生产线正常状态下生产的零件的尺寸服从正态分布N( ,σ2).
(1)假设生产状态正常,记 X表示一天内抽取的 16个零μ 件中其尺寸在( ﹣3σ,
+3σ)之外的零件数,求P(X≥1)及X的数学期望; μ
μ(2)一天内抽检零件中,如果出现了尺寸在( ﹣3σ, +3σ)之外的零件,就认为这条
生产线在这一天的生产过程可能出现了异常情况μ,需对当μ 天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得 1 16 9.97,s √ 1 16 √ 1 16 0.212,
x= ∑ x = = ∑ (x −x) 2= (∑ x2−16x2 )≈
16 i 16 i 16 i
i=1 i=1 i=1
其中x 为抽取的第i个零件的尺寸,i=1,2,…,16.
i
用样本平均数 作为 的估计值̂(cid:16) ,用样本标准差s作为σ的估计值̂(cid:16) ,利用估计值判断
x
μ σ
μ
是否需对当天的生产过程进行检查?剔除( ﹣3σ, +3σ)之外的数据,用剩下的数据
估计 和σ(精确到0.01). μ μ
附:若μ 随机变量 Z服从正态分布 N( ,σ2),则P( ﹣3σ<Z< +3σ)=0.9974,
0.997416≈0.9592,√0.008≈0.09. μ μ μ
【解答】解:(1)由题可知尺寸落在( ﹣3σ, +3σ)之内的概率为0.9974,
则落在( ﹣3σ, +3σ)之外的概率为1﹣μ 0.9974μ=0.0026,
由题意知μX~B(1μ6,0.0026),
因为P(X=0) (1﹣0.9974)0×0.997416≈0.9592,
=C0 ×
16
所以P(X≥1)=1﹣P(X=0)=0.0408,
因为X~B(16,0.0026),
所以E(X)=16×0.0026=0.0416;
(2)(ⅰ)如果生产状态正常,一个零件尺寸在 ̂(cid:16) ̂(cid:16) ̂(cid:16) ̂(cid:16) 之外的概率只有
(μ−3σ,μ+3σ)
0.0026,一天内抽取的16个零件中,出现尺寸在 ̂(cid:16) ̂(cid:16) ̂(cid:16) ̂(cid:16) 之外的零件的概率
(μ−3σ,μ+3σ)只有0.0408,发生的概率很小.因此一旦发生这种状况,就有理由认为这条生产线在这
一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生
产过程的方法是合理的.
(ⅱ)由 x=9.97,s≈0.212,得 的估计值为̂(cid:16) 9.97,σ的估计值为̂(cid:16) 0.212,由样本
μ= σ=
μ
数据可以看出一个
零件的尺寸在 ̂(cid:16) ̂(cid:16) ̂(cid:16) ̂(cid:16) 之外,因此需对当天的生产过程进行检查.
(μ−3σ,μ+3σ)
剔除 ̂(cid:16) ̂(cid:16) ̂(cid:16) ̂(cid:16) 之外的数据9.22,剩下的数据的平均数为
(μ−3σ,μ+3σ)
1
(16×9.97﹣9.22)=10.02,
15
因此 的估计值为10.02.
16 μ 2=16×0.2122+16×9.972≈1591.134,
∑ x
i
i=1
剔除 ̂(cid:16) ̂(cid:16) ̂(cid:16) ̂(cid:16) 之外的数据9.22,剩下的数据的样本方差为
(μ−3σ,μ+3σ)
1
(1591.134﹣9.222﹣15×10.022)≈0.008,
15
因此σ的估计值为√0.008≈0.09.
题型二 . 分布列综合问题
1.微博橙子辅导用简单随机抽样方法抽取了100名同学,对其社会实践次数进行调
查,结果如表:
n [0,3) [3,6) [6,9) [9,12) [12,15) [15,18)
男同学人数 7 15 11 12 2 1
女同学人数 5 13 20 9 3 2
若将社会实践次数不低于12次的学生称为“社会实践标兵”.
(Ⅰ)将频率视为概率,估计该校1600名学生中“社会实践标兵”有多少人?
(Ⅱ)从已抽取的8名“社会实践标兵”中随机抽取4位同学参加社会实践表彰活动.
(i)设A为事件“抽取的4位同学中既有男同学又有女同学”,求事件A发生的概率;
(ii)用X表示抽取的“社会实践标兵”中男生的人数,求随机变量 X的分布列和数学
期望.【解答】解:(Ⅰ)样本中“社会实践标兵”不低于12次的学生有8人,
8
∴该校学生中“社会实践标兵”有:1600× =128人.
100
(Ⅱ)8名“社会实践标兵”中有男同学3人,女同学5人,
(i)A为“抽取的4位同学全是女同学”,
∴P( A ) = C 5 4 = 1 ,
C4 14
8
1 13
∴P(A)=1﹣P(A)=1− = .
14 14
(ii)由题意知X所有可能的取值为0,1,2,3,
P(X=0) = C 5 4 = 1 ,
C4 14
8
P(X=1) = C1 3 C 5 3 = 3,
C4 7
8
P(X=2) = C 3 2C 5 2 = 3,
C4 7
8
P(X=3) = C 3 3C 5 1 = 1 .
C4 14
8
则X的分布列为:
X 0 1 2 3
P 1 3 3 1
14 7 7 14
1 3 3 1 3
E(X)=0× +1× +2× +3× = .
14 7 7 14 2
2.一个盒子中装有大量形状大小一样但重量不尽相同的小球,从中随机抽取 50个作为样
本,称出它们的重量(单位:克),重量分组区间为(5,15],(15,25](25,35],
(35,45],由此得到样本的重量频率分布直方图,如图.
(Ⅰ)求a的值;
(Ⅱ)根据样本数据,试估计盒子中小球重量的平均值;
(Ⅲ)从盒子中随机抽取3个小球,其中重量在(5,15]内的小球个数为 ,求 的分布
ξ ξ列和数学期望及方差.
【解答】解:(Ⅰ)由题意得,(0.02+0.032+a+0.018)×10=1
解得a=0.03;
(Ⅱ)由最高矩形中点的横坐标为20,
可估计盒子中小球重量的众数约为20,
而50个样本小球重量的平均值为:0.2×10+0.32×20+0.3×30+0.18×40=24.6(克)
故估计盒子中小球重量的平均值约为24.6克.
(Ⅲ)利用样本估计总体,该盒子中小球的重量在[5,15]内的频率为0.2;
则 ~B(3,0.2),
=ξ0,1,2,3;
ξ 64
P( =0)=C 0×0.83= ;
3
125
ξ
48
P( =1)=C 1×0.82×0.2= ;
3
125
ξ
12
P( =2)=C 2×0.8×0.22= ;
3
125
ξ
1
P( =3)=C 3×0.23= ,
3
125
ξ
∴ 的分布列为:
ξ 0 1 2 3
Pξ 64 48 12 1
125 125 125 125
E =3×0.2=0.6,D =3×0.2×0.8=0.48.
3.某ξ纺织厂为了生产一ξ 种高端布料,准备从A农场购进一批优质棉花,厂方技术员从A农
场存储的优质棉花中随机抽取了100处棉花,分别测量了其纤维长度(单位:mm)的
均值,收集到100个样本数据,并制成如下频数分布表:
长度(单 [23, [25, [27, [29, [31, [33, [35, [37,39]
位: 25) 27) 29) 31) 33) 35) 37)
mm)频数 4 9 16 24 18 14 10 5
(1)求这100个样本数据的平均数x和样本方差s2(同一组数据用该区间的中点值作代
表);
(2)将收集到的数据绘成直方图可以认为这批棉花的纤维长度服从分布 X~N( ,
σ2)其中 ≈x,σ2=s2 μ
①利用正μ态分布,求P(X> ﹣2σ);
②纺织厂将A农场送来的这批μ优质棉进行二次检验,从中随机抽取20处测量其纤维均
值y(i=1,2…,20),数据如下:
i
y y y y y y y y y y
1 2 3 4 5 6 7 8 9 10
24.1 31.8 32.7 28.2 28.4 34.3 29.1 34.8 37.2 30.8
y y y y y y y y y y
11 12 13 14 15 16 17 18 19 20
30.6 25.2 32.9 27.1 35.9 28.9 33.9 29.5 35.0 29.9
若20个样本中纤维均值Y> ﹣2σ的频率不低于①中P(X> ﹣2σ)即可判断该批优
质棉花合格,否则认为农场运μ送时掺杂了次品,判断该批棉花不μ合格.按照此依据判断
A农场送来的这批棉花是否为合格的优质棉花,并说明理由.
附:若Z~N( ,σ2),则P( ﹣σ<Z< +σ)=0.6827,P( ﹣2σ<Z< +2σ)=
0.9543,√12.28μ≈3.504 μ μ μ μ
【 解 答 】 解 : ( 1 )
1
x= (4×24+9×26+16×28+24×30+18×32+14×34+10×36+5×38)=31,
100
1
s2= (4×72+9×52+16×32+24×1+18×1+14×32+10×52+5×72 )=12.28;
100
(2)棉花的纤维长度服从分布X~N( ,σ2),其中 =31,σ=√12.28≈3.504.
μ 1 μ
①利用正态分布,则P(X> ﹣2σ)=1− (1−0.954)=0.97715,
2
μ
② ﹣2σ=31﹣2×3.504≈23.992,
故f(μ Y> ﹣2σ)=f(Y>23.992)=1,满足条件,
∴认为该批μ 优质棉花合格.
课后作业 . 正态分布
1.随机变量 服从正态分布N( ,σ2),若P( <2)=0.2,P(2< <6)=0.6,则
ξ μ ξ ξ= 4 .
μ【解答】解:由题意可知,P( <6)=P( <2)+P(2< <6)=0.2+0.6=0.8,
∴P( >6)=1﹣0.8=0.2, ξ ξ ξ
∵( <ξ 2)=P( >6),
ξ2+6
ξ
∴μ= =4.
2
故答案为:4.
2.已知随机变量X~N(0.4,σ 2),Y~N(0.8,σ 2),其正态曲线如图所示,则下列说
1 2
法错误的是( )
A.P(X≥0.4)=P(Y≥0.8)
B.P(X≥0)=P(Y≥0)
C.X的取值比Y的取值更集中于平均值
D.两支正态曲线与x轴之间的面积均为1
【解答】解:由已知得 =0.4, =0.8,σ <σ ,所以 P(X≥0.4)=0.5,P
1 2 1 2
(Y≥0.8)=0.5,故A正确μ, μ
由图象可知,在 y轴的左侧,分布列 X的图象在 Y的图象下方,故 P(X≥0)>P
(Y≥0),故B错误,
分布列X的图象比Y的图象更“高瘦”,故X的取值比Y的取值更集中于平均值左右,
故C正确,
两支密度曲线与x轴之间的面积均为1,故D正确.
故选:B.
3.江先生朝九晚五上班,上班通常乘坐公交加步行或乘坐地铁加步行.江先生从家到公交
站或地铁站都要步行5分钟.公交车多且路程近一些,但乘坐公交路上经常拥堵,所需
时间Z(单位:分)服从正态分布N(33,42),下车后从公交站步行到单位要12分钟;乘坐地铁畅通,但路线长且乘客多,所需时间 Z(单位:分)服从正态分布N(44,
22),下地铁后从地铁站步行到单位要5分钟.从统计的角度看,下列说法合理的是(
)
A.若8:00出门,则乘坐公交上班不会迟到
B.若8:02出门,则乘坐地铁上班不迟到的可能性更大
C.若8:06出门,则乘坐公交上班不迟到的可能性更大
D.若8:12出门,则乘坐地铁上班几乎不可能不迟到
【解答】解:对于A,若8:00出门,A先生乘坐公交,从甲到车站需要5分钟,下车
后步行再到单位需要12分钟,
乘坐公交到离单位最近的公交站所需时间 Z (单位:分钟)服从正态分布 N(33,
1
42),
1−P(21<Z<45) 1−0.9974
当满足P(Z≥45)= = =0.0013时,江先生仍旧有可能
2 2
迟到,只不过发生的概率较小,故选项A错误;
对于B,若8:02出门,江先生乘坐地铁,因为从家到车站需要5分钟,下车后步行再
到单位需要5分钟,
乘坐地铁到离单位最近的地铁站所需时间 Z (单位:分钟)服从正态分布 N(44,
2
22),
1−P(40<Z<48)
故当满足P(Z≤48)= +P(40<Z<48)=0.9972时,A先生乘
2
坐地铁不会迟到;故选项B正确;
对于C:若8:06出门,江先生乘坐公交,因为从家到车站需要5分钟,下车后步行再
到单位需要12分钟,
乘坐公交到离单位最近的公交站所需时间 Z (单位:分钟)服从正态分布 N(33,
1
42),
1−P(29<Z<37)
故当满足P(Z≤37)= +P(29<Z<37)=0.8413时,江先生乘
2
坐公交不会迟到;故选项C正确;
对于D:若8:12出门,江先生乘坐地铁,因为从家到车站需要5分钟,下地铁后步行
再到单位需要5分钟,
乘坐地铁到离单位最近的地铁站所需时间 Z (单位:分钟)服从正态分布 N(44,
2
22),1−P(38<Z<50)
故当满足P(Z≤38)= =0.00135时,江先生乘坐地铁会迟到,故
2
选项D错误.
故选:BC.
4.某市为了解本市2万名学生的汉字书写水平,在全市范围内进行了汉字听写考试,发现
其成绩服从正态分布N(69,49),现从某校随机抽取了50名学生,将所得成绩整理
后,绘制出如图所示的频率分布直方图.
(Ⅰ)估算该校50名学生成绩的平均值x(同一组中的数据用该组区间的中点值作代
表);
(Ⅱ)求这50名学生成绩在[80,100]内的人数;
(Ⅲ)现从该校50名考生成绩在[80,100]的学生中随机抽取两人,该两人成绩排名
(从高到低)在全市前26名的人数记为X,求X的分布列和数学期望.
参考数据:若X~N( ,σ2),则P( ﹣σ<X≤ +σ)=0.6828
P( ﹣2σ<X≤ +2σ)μ=0.9544 μ μ
P(μ﹣3σ<X≤μ+3σ)=0.9974.
【 μ 解 答 】 μ 解 : ( Ⅰ ) 该 校 50 名 学 生 成 绩 的 平 均 值 x=
45×0.08+55×0.20+65×0.32+75×0.20+85×0.12+95×0.08=68.2;
(Ⅱ)这50名学生成绩在[80,100]内的频率为0.20,则这50名学生成绩在[80,100]内
的人数为50×(0.08+0.12)=10;
(Ⅲ)∵P(69﹣3×7<X≤69+3×7)=0.9974,
1
∴P( ≥90)= (1﹣0.9974)=0.0013,
2
ξ
∵0.0013×20000=26.
∴全市前26名的排名(从高到低) 最低是90,这50人中90分以上的有50×0.08=4人.
随机变量X可取0,1,2,于是P(X=0) = C 6 2 = 1,P(X=1) = C1 6 ⋅C1 4= 8 ,P(X=2) = C2 4 = 2 ,
C2 3 C2 15 C2 15
10 10 10
X 0 1 2
P 1 8 2
3 15 15
1 8 2 4
∴E(X)=0× +1× +2× = .
3 15 15 5
声明:试题解析著作权属所有,未经书面同意,不得复制发布
日期:2021/12/12 14:20:10;用户:15942715433;邮箱:15942715433;学号:32355067