文档内容
课时规范练 69 概率与统计中的综合问题
1.(15分)(2023·新高考Ⅱ,19)某研究小组经过研究发现某种疾病的患病者与未患病者的
某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分
布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于
或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);
误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生
的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最
小值.
2.(15分)(2024·江西鹰潭二模)等高堆积条形图是一种数据可视化方式,能够清晰呈现多
个变量的数据并进行比较,这种类型图表将多个条形图堆积在一起并用颜色进行区分,形
成一条整体条形图,每个条形图的高度表示对应变量的值,不同颜色表示不同变量,能够
更好地理解每个变量在总体中的占比.石墨烯发热膜能用在衣服上,使之更加轻薄、保暖.
石墨烯发热膜的制作如下:从石墨中分离出石墨烯,制成石墨烯发热膜.从石墨中分离石
墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、
B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了50次再结晶试验,得
到如下等高堆积条形图.
关注精品公众号【偷着学】或添加微信:tzx985tzx单位:次
试验结果 A材料 B材料 合计
试验成功
试验失败
合计
(1)根据等高堆积条形图,填写2×2列联表,并根据小概率值α=0.001的独立性检验,判断
试验的结果是否与材料有关;
(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV胶层;②
2
石墨烯层;③表面封装层.第一、二环节生产合格的概率均为 ,第三环节生产合格的概率
3
3
为 ,且各生产环节相互独立.已知生产1吨石墨烯发热膜的固定成本为1万元,若生产不
4
合格还需进行修复,第三环节的修复费用为4 000元,其余环节修复费用均为2 000元.试
问如何定价(单位:万元),才能实现每生产1吨石墨烯发热膜获利不低于1万元的目标?
(精确到0.001)
n(ad-bc)2
附:χ2= ,其中n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
α 0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
α
3.(15分)(2024·广东梅州一模)某学校为了解本学期学生参加公益劳动的情况,从学校内
随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:时)分配
情况等数据,并将样本数据分成[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],(12,14],(14,16],(16,18]
九组,绘制成如图所示的频率分布直方图.
关注精品公众号【偷着学】或添加微信:tzx985tzx(1)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在
(12,14],(14,16],(16,18]三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中
随机抽取3人.记参加公益劳动时间在(14,16]内的学生人数为X,求X的分布列和期望;
(2)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用
“P (k)”表示这20名学生中恰有k名学生参加公益劳动时间在(10,12](单位:时)内的概
20
率,其中k=0,1,2,…,20.当P (k)最大时,写出k的值.
20
4.(15分)(2024·浙江杭州模拟)某单位有10 000名职工,想通过验血的方法筛查出某种细
菌感染性疾病.抽样化验显示,当前携带该细菌的人约占0.9%,若逐个化验需化验10 000
次.统计专家提出了一种化验方法:随机按n人一组进行分组,将各组n个人的血液混合在
一起化验,若混合血样呈阴性,则这n个人的血样全部阴性;若混合血样呈阳性,则说明其
中至少有一人的血样呈阳性,就需对每个人再分别化验一次.
(1)若每人单独化验一次花费10元,n个人混合化验一次花费n+9元.问n为何值时,化验
费用的数学期望最小?(注:当p<0.01时,(1-p)n≈1-np)
(2)该疾病主要是通过人与人之间进行传播,感染人群年龄大多数是40岁以上.细菌进入
人体后有潜伏期.潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越
长,感染给他人的可能性越高.现对已发现的90个病例的潜伏期(单位:天)进行调查,统计
发现潜伏期的平均数为7.2,方差为2.252.如果认为超过8天的潜伏期属于“长潜伏期”,
按照年龄统计样本,得到下面的列联表:
年龄/人数 长期潜伏 非长期潜伏
40岁以上 15 50
40岁及40岁以下 10 15
①依据小概率值α=0.05的独立性检验,判断“长期潜伏”与年龄是否有关?
②假设潜伏期X服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.
为防止该疾病的传播,现要求感染者的密接者居家观察14天,请用概率的知识解释其合
理性.
关注精品公众号【偷着学】或添加微信:tzx985tzxn(ad-bc)2
附:χ2= ,
(a+b)(c+d)(a+c)(b+d)
α 0.1 0.05 0.01
x 2.706 3.841 6.635
α
若ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈0.954
5,P(μ-3σ≤ξ≤μ+3σ)≈0.997 3.
5.(17分)(2024·山东聊城三模)今年五一节期间,聊城百货大楼有限公司搞促销活动,下表
是该公司5月1号至10号(日期简记为1,2,3,…,10)连续10天的销售情况:
日期x 1 2 3 4 5 6 7 8 9 10
销售额
19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
y(万元)
由上述数据,用最小二乘法得到销售额和日期的经验回归方程为 ^=0.84x+17.45,日期的
y
方差约为3.02,销售额的方差约为2.59.
(1)根据经验回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差;
(2)计算样本相关系数r,并分析销售额和日期的相关程度(精确到0.001);
(3)该公司为了促销,拟打算对电视机实行分期付款方式销售,假设顾客购买一台电视机
选择分期付款的期数及相应的概率和公司获得的利润Y(单位:元)情况如下表:
ξ 2 4 6
P a a a
1 2 3
Y 400 600 800
已知a ,a ,a 成等比数列.
1 2 3
设该公司销售两台电视机所获得的利润为X(单位:元),当X=1 200的概率取得最大值时,
求利润X的分布列和数学期望.
n
∑(x -x)(y - y)
参考公式:样本相关系数r=i=1 i i .回归方程^ ^x+^中斜率和截距的
y=b a
√ n n
∑(x -x)2∑(y - y)2
i i
i=1 i=1
n
∑(x -x)(y - y)
最小二乘法估计公式分别为
b
^
=i=1
i i
,a
^
= y−b
^
x
.相关数据:
√78 218
n
∑(x -x)2
i
i=1
≈279.67.
关注精品公众号【偷着学】或添加微信:tzx985tzx6.(17分)(2024·黑龙江哈尔滨模拟)某景区接待外地游客数量如下:
x/日 1 2 3 4 5
y/万人 45 50 60 65 80
(1)计算x,y的样本相关系数r(计算结果精确到0.01),并判断是否可以认为日期与游客人
数的相关性很强;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程;
(3)该景区为了吸引游客,在售票处针对各个旅游团进行了现场抽奖的活动,具体抽奖规
则为:从该旅游团中随机同时抽取两名游客,两名游客性别不同则为中奖.已知某个旅游
团中有5名男游客和k(k≥5)名女游客,设重复进行三次抽奖中恰有一次中奖的概率为p,
当k取多少时,p最大?
n n n
∑(x -x)(y - y) ∑x y -nx y ∑(x -x)(y - y)
参考公式: b ^ =i=1 i i =i=1 i i ,a ^ = y−b ^ x ,r=i=1 i i .
n n √ n n
∑(x -x)2 ∑x2-nx2 ∑(x -x)2∑(y - y)2
i i i i
i=1 i=1 i=1 i=1
参考数据:√3≈1.732.
答案:
1.解 (1)当p(c)=0.5%时,由患病者频率分布直方图可得第一个小矩形面积为0.002×5=0.01,
95+100
∴c= =97.5.
2
由未患病者频率分布直方图可得q(c)=0.01×(100-97.5)+0.002×5=0.035.
(2)当c∈[95,100)时,p(c)=(c-95)×0.002,q(c)=(100-c)×0.01+0.01,
∴f(c)=-0.008c+0.82>0.02;
当c∈[100,105]时,p(c)=5×0.002+(c-100)×0.012,q(c)=(105-c)×0.002,
∴f(c)=0.01c-0.98≥0.02.
{-0.008c+0.82,c∈[95,100),
∴f(c)=
0.01c-0.98,c∈[100,105].
故当c=100时,f(c)取最小值,最小值为f(100)=0.02.
2.解 (1)零假设为H :试验结果和材料无关.
0
根据题中所给等高堆积条形图,得2×2列联表如下.
试验结果 A材料 B材料 合计
试验成功 45 30 75
试验失败 5 20 25
关注精品公众号【偷着学】或添加微信:tzx985tzx合计 50 50 100
100(45×20-30×5)2
计算可得χ2= =12>10.828,
75×25×50×50
依据α=0.001的独立性检验,可以推断H 不成立,即试验的结果与材料有关.
0
(2)设生产1吨石墨烯发热膜所需的修复费用为X万元,易知X的可能取值为0,0.2,0.4,0.6,0.8,
2 3 1 2 1 3 1
P(X=0)=( )2 × = ,P(X=0.2)=C1× × × = ,
3 4 3 2 3 3 4 3
2 1 1 3 7 2 1 1 1 1 1 1
P(X=0.4)=( )2 × +( )2 × = ,P(X=0.6)=C1× × × = ,P(X=0.8)=( )2 × = ,
3 4 3 4 36 2 3 3 4 9 3 4 36
则X的分布列为
X 0 0.2 0.4 0.6 0.8
1 1 7 1 1
P
3 3 36 9 36
1
修复费用X的期望E(X)=0× +0.2×
3
1 7 1 1 7
+0.4× +0.6× +0.8× = ≈0.233,
3 36 9 36 30
所以石墨烯发热膜的定价至少为1+1+0.233=2.233(万元/吨),才能实现预期的利润目标.
3.解 (1)由频率分布直方图得2(0.02+0.03+0.05+0.05+0.15+a+0.05+0.04+0.01)=1,解得a=0.10.
这500名学生中参加公益劳动时间在(12,14],(14,16],(16,18]三组内的学生人数分别为
500×0.10=50,500×0.08=40,500×0.02=10,若采用分层抽样的方法抽取了10人,
40
则从参加公益劳动时间在(14,16]内的学生中抽取 ×10=4(人),现从这10人中随机抽
50+40+10
取3人,
C3
20 1
C1C2
60 1
则X的可能取值为0,1,2,3,P(X=0)= 6 = = ,P(X=1)= 4 6= = ,P(X=2)=
C3 120 6 C3 120 2
10 10
C2C1
36 3
C3
4 1
4 6= = ,P(X=3)= 4 = = ,
C3 120 10 C3 120 30
10 10
∴X的分布列为
X 0 1 2 3
1 1 3 1
P
6 2 10 30
1 3 1 6
则其期望为E(X)=1× +2× +3× = .
2 10 30 5
关注精品公众号【偷着学】或添加微信:tzx985tzx(2)由(1)可知参加公益劳动时间在(10,12]的概率P=0.1×2=0.2,所以P (k)=Ck 0.2k(1-0.2)20-k=Ck
20 20 20
0.2k0.820-k,
{P (k)≥P (k-1),
依题意 20 20
P (k)≥P (k+1),
20 20
即{Ck 0.2k0.820-k≥Ck-10.2k-10.821-k,
20 20
Ck 0.2k0.820-k≥Ck+10.2k+10.819-k,
20 20
20-k+1
{ 0.2× ≥0.8,
k
即
20-(k+1)+1
0.8≥0.2× ,
k+1
16 21
解得 ≤k≤ ,
5 5
因为k∈N*,所以k=4,
即当P (k)最大时,k=4.
20
4.解 (1)要使化验费用的数学期望最小,只需每个人的化验费用期望最小.
设每人的化验费用为Y元,若混合血样呈阴性,
n+9 9
则Y= =1+ ,若混合血样是阳性,
n n
9
则Y=11+ ,
n
9 9
所以P(Y=1+ )=0.991n,P(Y=11+ )=1-0.991n,
n n
9 9 9
每位职工的化验费用为E(Y)=(1+ )×0.991n+(11+ )×(1-0.991n)=11-10×0.991n+ =11-10×(1-
n n n
0.009)n+ 9 ≈11-10×(1-0.009n)+ 9 =1+0.09n+ 9 ≥1+2 √ 0.09n· 9 =2.8,
n n n n
9
当且仅当0.09n= ,即n=10时取等号,故n=10时,每位职工化验费用的期望最小.
n
(2)①零假设为H :“长期潜伏”与年龄无关.
0
90(15×15-50×10)2 2 178
根据列联表中的数据,经计算得到χ2= = ≈2.58<3.841=x
0.05
,根据小
65×25×25×65 845
概率值α=0.05的独立性检验,没有充分证据推断H 不成立,因此可以认为“长期潜伏”与年龄
0
无关.
②若潜伏期X~N(7.2,2.252),
关注精品公众号【偷着学】或添加微信:tzx985tzx1-0.997 3
由P(X>13.95)=P(X>7.2+3×2.25)≈ =0.001 35,得知潜伏期超过14天的概率很低,因
2
此隔离14天是合理的.
5.解 (1)根据经验回归方程^=0.84x+17.45,日期每增加一天,销售额约增加0.84万元,把x=4代入
y
经验回归方程,得^=0.84×4+17.45=20.81,因为20-20.81=-0.81,所以第4天的残差为-0.81.
y
(2)由
10 10 10 10
∑(x -x)(y - y) ∑(x -x)2 ∑(x -x)2 √ ∑(x -x)2
r i i i i i
=i=1 ×i=1 =i=1 = i=1
b ^ √ ∑ 10 (x -x)2∑ 10 (y - y)2 ∑ 10 (x -x)(y - y) √ ∑ 10 (x -x)2∑ 10 (y - y)2 ∑ 10 (y - y)2
i=1 i i=1 i i=1 i i i=1 i i=1 i i=1 i
10
√ ∑(x -x)2
得r= b ^ i=1 i =0.84 × √3.02=0.84 × √78 218 ≈ 0.907,
10 2.59 259
∑(y - y)2
i
i=1
0.907比较接近于1,故销售额和日期的相关程度较强.
1
(3)由a
1
,a
2
,a
3
成等比数列,得 a2=a
1
·a
3
,且a
1
+a
2
+a
3
=1,设其公比为q,则a
2
( +1+q)=1,所以a
2
=
2 q
1
,
1
+1+q
q
由题意可得X的值分别为800,1 000,1 200,1 400,1 600,
则P(X=800)=a2,P(X=1 000)=2a a ,P(X=1 200)=a2+2a a =3a2,P(X=1 400)=2a a ,P(X=1 600)=a2,
1 1 2 2 1 3 2 2 3 3
3
又P(X=1 200)=3 a 2 2= 1 ≤ 3×( 1 )2= 1 ,取得最大值的条件1 =q,即q=1,此时a 1 =a 2 =a 3 = 1 ,
( +1+q) 2 3 3 q 3
q
故X的分布列为
X 800 1 000 1 200 1 400 1 600
1 2 1 2 1
P
9 9 3 9 9
1 2 1 2 1
期望E(X)=800× +1 000× +1 200× +1 400× +1 600× =1 200.
9 9 3 9 9
关注精品公众号【偷着学】或添加微信:tzx985tzx1+2+3+4+5 45+50+60+65+80
6.解 (1)因为 x= =3,y= =60,
5 5
5 5
所以∑(x
i
-x)(y
i
-y)=∑x
i
y
i
-5x y=(1×45+2×50+3×60+4×65+5×80)-5×3×60=85,
i=1 i=1
5
∑(x
-x)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
i
i=1
5
∑(y -
y)2=(45-60)2+(50-60)2+(60-60)2+(65-60)2+(80-60)2=750,
i
i=1
n
∑(x -x)(y - y)
所以r=i=1 i i = 85 ≈ 85 ≈ 0.98,
√ 5 5 50√3 86.6
∑(x -x)2∑(y - y)2
i i
i=1 i=1
由此可以认为两者的相关性很强.
5 5
(2)由(1)知 ∑(x
i
-
x
)(y
i
-
y
)=85,∑(x -x)2=10,
i
i=1 i=1
5
∑(x -x)(y - y)
所以
b
^
=i=1
i i
=
85=8.5.
5 10
∑(x -x)2
i
i=1
因为^ ^ =60-8.5×3=34.5,
a= y−bx
所以经验回归方程为y=8.5x+34.5.
C1·C1
10k
(3)记P(k)=t= 5 k = (k≥5,k∈N*),
C2 (k+5)(k+4)
5+k
10(k+1) 10k 10(4-k)
因为P(k+1)-P(k)= − = <0,
(k+6)(k+5) (k+5)(k+4) (k+4)(k+5)(k+6)
5 5
所以P(k+1)
0,t∈( , ],F'(t)<0, 3 3 9 1 1 5 1 所以F(t)在(0, )上单调递增,在( , ]上单调递减,所以当t= 时,P取得最大值. 3 3 9 3 10k 1 由t= = ,解得k=20或k=1(舍去), (k+5)(k+4) 3 所以当k=20时,恰有一次中奖的概率P最大 关注精品公众号【偷着学】或添加微信:tzx985tzx成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468 也可联系微信fjshuxue加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期 关注精品公众号【偷着学】或添加微信:tzx985tzx