文档内容
第六节 概率与统计的综合问题
题型一 概率与频率分布直方图的交汇
[典例] (2021·西安一模)某超市每年10月份都销售某种桃子,在10月份的每天计划进货量
都相同,进货成本为每千克16元,销售价为每千克24元;当天超出需求量的部分,以每千克
10元全部卖出.根据往年销售经验,每天的需求量与当天最高气温(单位:℃)有一定关系:最
高气温低于25 ℃,需求量为1 000千克;最高气温位于[25,30)内,需求量为2 000千克;最高
气温不低于30 ℃,需求量为3 000千克.为了制订2020年10月份的订购计划,超市工作人
员统计了近三年10月份的气温数据,得到如图所示的频率分布直方图.
以气温位于各区间的频率代替气温位于该区间的概率.
(1)求2020年10月份桃子一天的需求量X的分布列;
(2)设2020年10月份桃子一天的销售利润为Y元,当一天的进货量为多少千克时,E(Y)取到
最大值?
[解] (1)由题意知X的可能取值为1 000,2 000,3 000,
P(X=1 000)=(0.008 9+0.031 1)×5=0.2,
P(X=2 000)=0.080 0×5=0.4,
P(X=3 000)=(0.046 7+0.033 3)×5=0.4.
所以X的分布列为
X 1 000 2 000 3 000
P 0.2 0.4 0.4
(2)设一天的进货量为n千克,则1 000≤n≤3 000.
①当1 000≤n<2 000时,
若最高气温不低于25 ℃,则Y=8n;
若最高气温低于25 ℃,则Y=1 000×8-(n-1 000)×6=14 000-6n.
此时E(Y)=0.8×8n+0.2×(14 000-6n)=5.2n+2 800<13 200.
②当2 000≤n≤3 000时,
若最高气温不低于30 ℃,则Y=8n;
若最高气温位于[25,30)内,则Y=2 000×8-(n-2 000)×6=28 000-6n;
若最高气温低于25 ℃,则Y=1 000×8-(n-1 000)×6=14 000-6n.
此时E(Y)=0.4×8n+0.4×(28 000-6n)+0.2×(14 000-6n)=14 000-0.4n≤13 200,当且
仅当n=2 000时取等号.
综上,当一天的进货量为2 000千克时,E(Y)取到最大值.[方法技巧]
高考常将求概率与等可能事件、互斥事件、相互独立事件、超几何分布、二项分布等交汇在一
起进行考查,因此在解答此类题时,准确把题中所涉及的事件进行分解,明确所求问题所属
的事件类型是关键.特别是要注意挖掘题目中的隐含条件.
[针对训练]
“不忘初心、牢记使命”主题教育活动正在全国开展,某区政府为统计全区党员干部一周参
与主题教育活动的时间,从全区的党员干部中随机抽取n名,获得了他们一周参加主题教育
活动时间(单位:时)的频率分布直方图,如图所示,已知参加主题教育活动的时间在(12,16]内
的人数为92.
(1)求n的值;
(2)估计这些党员干部一周参与主题教育活动时间的平均值以及中位数(中位数的结果精确到
0.01);
(3)用频率估计概率,如果计划对全区一周参与主题教育活动的时间在(16,24]内的党员干部
给予奖励,且参与时间在(16,20],(20,24]内的分别得二等奖和一等奖,从这些获奖人中随机
抽取5人,求这5人中获得一等奖人数的分布列及期望.
解:(1)由已知可得,a=1÷4-(0.025 0+0.047 5+0.050 0+0.012 5)=0.115 0,
0.115 0×4×n=92,因而n==200.
(2)这些党员干部一周参加主题教育活动时间的平均值约为
(6×0.025 0+10×0.047 5+14×0.115 0+18×0.050 0+22×0.012 5)×4=13.64.
设中位数的估计值为x,则0.050 0×4+0.012 5×4+(16-x)×0.115 0=0.5,得x≈13.83.
(3)由频率分布直方图知,这些获奖人中参与主题教育活动的时间在(16,20]的概率为=,在
(20,24]的概率为=,
设抽取的5人中获得一等奖的人数为ξ,则ξ的可能取值为0,1,2,3,4,5.
P(ξ=0)=C×0×5=,
P(ξ=1)=C×1×4=,
P(ξ=2)=C×2×3=,
P(ξ=3)=C×3×2=,
P(ξ=4)=C×4×1=,
P(ξ=5)=C×5×0=,
则ξ的分布列为ξ 0 1 2 3 4 5
P
法一:E(ξ)=0×+1×+2×+3×+4×+5×=1.
法二:易知ξ服从二项分布,所以E(ξ)=5×=1.
题型二 概率与统计、统计案例的交汇
[典例] (2021·上饶一模)某晚会上,演员身穿独特且轻薄的石墨烯发热服,在寒气逼人的零
下20 ℃的现场表演了精彩的节目.石墨烯发热服的制作:从石墨中分离出石墨烯,制成石墨
烯发热膜,再把石墨烯发热膜铺到衣服内.
(1)从石墨分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现
有A,B两种材料供选择,研究人员对附着在A材料上再结晶做了30次试验,成功28次;对
附着在B材料上再结晶做了30次试验,成功20次.补充下面的2×2列联表,并判断是否有
99.5%的把握认为试验是否成功与A材料和B材料的选择有关.
A材料 B材料 总计
成功
不成功
总计
(2)研究人员得到石墨烯后,再制作石墨烯发热膜有四个环节,其中前三个环节每个环节生产
合格的概率均为,每个环节不合格需要修复的费用均为200元;第四个环节生产合格的概率
为,此环节不合格需要修复的费用为100元.问:一次生产出来的石墨烯发热膜成为合格品
平均需要多少修复费用?
附:K2=,其中n=a+b+c+d.
P(K2≥k) 0.100 0.050 0.025 0.010 0.005 0.001
0
k 2.706 3.841 5.024 6.635 7.879 10.828
0
[解] (1)2×2列联表如下:
A材料 B材料 总计
成功 28 20 48
不成功 2 10 12
总计 30 30 60
K2=≈6.667<7.879,
所以没有99.5%的把握认为实验是否成功与A材料和B材料的选择有关.
(2)设 X 为一次生产出石墨烯发热膜为合格品所需的修复费用,则 X 的可能取值为
0,100,200,300,400,500,600,700,
P(X=0)=3×=,
P(X=100)=3×=,
P(X=200)=C×2×=,P(X=300)=C×2×=,
P(X=400)=C2××=,
P(X=500)=C2××=,
P(X=600)=3×=,
P(X=700)=3×=,
E(X)=0×+100×+200×+300×+400×+500×+600×+700×=333.
故一次生产出来的石墨烯发热膜成为合格品平均需要333元修复费用.
(1)概率常与随机抽样、频率分布直方图、统计、独立性检验、离散型随机变量的分布列、数学
期望等综合,注意频率分布直方图的纵轴不表示频率.
(2)当题目中出现“在……条件(前提)下”等字眼时,所求概率一般为条件概率;若无上述字
眼,但已发生的事件影响了所求事件的概率,也认为是条件概率.条件概率的公式需记牢,不
要混淆事件A,B.也有不用条件概率的公式,根据实际意义求概率的,如“甲、乙比赛时,甲
每局获胜的概率皆为,且各局比赛胜负互不影响,比赛采用五局三胜制.已知第一局乙获胜,
求甲获胜的概率.”易得甲获胜的概率P=3+×C2×=.
[针对训练]
某人经营淡水池塘养草鱼,根据过去40期的养殖档案,该池塘的养
殖重量X(百斤)都在20百斤以上,其中不足40百斤的有8期,不低
于40百斤且不超过60百斤的有24期,超过60百斤的有8期.根据
统计,该池塘的草鱼重量的增加量y(百斤)与使用某种饵料的质量
x(百斤)之间的关系如图所示.
(1)根据数据可知y与x具有线性相关关系,请建立y关于x的回归方程y=bx+a;如果此人
设想使用某种饵料10百斤时,草鱼重量的增加量须多于5百斤,请根据回归方程计算,确定
此方案是否可行?并说明理由.
(2)养鱼的池塘对水质含氧量与新鲜度要求较高,某商家为该养殖户提供收费服务,即提供不
超过3台增氧冲水机,每期养殖使用的冲水机运行台数与鱼塘的鱼重量X有如下关系:
鱼的重量
2060
(单位:百斤)
冲水机只
1 2 3
需运行台数
若某台增氧冲水机运行,则商家每期可获利5千元;若某台冲水机未运行,则商家每期亏损2
千元.视频率为概率,商家欲使每期冲水机总利润的均值达到最大,应提供几台增氧冲水机?
附:对于一组数据(x,y),(x,y),…,(x ,y ),其回归方程y=bx+a的斜率和截距的最小二乘
1 1 2 2 n n
估计公式分别为b==,a=-b.
解:(1)依题意,=5,=4,(x-)(y-)=6,
i i(x-)2=26,
i
∴b==,a=-b=4-×5=,
∴y=x+.当x=10时,y=>5,故此方案可行.
(2)设盈利为Y,安装1台时,盈利Y=5 000.
安装2台时,2060,Y= 15
000,P=.
∴E(Y)=1 000×+8 000×+15 000×=8 000.
∵8 600>8 000,故应提供2台增氧冲水机.题型三 概率与函数、数列、不等式的交汇
[典例] 为了引导居民合理用电,国家决定实行合理的阶梯电价,居民用电原则上以住宅为
单位(一套住宅为一户).
阶梯级别 第一阶梯 第二阶梯 第三阶梯
月用电范围/度 (0,210] (210,400] (400,+∞)
某市随机抽取10户同一个月的用电情况,得到统计表如下:
居民用电户编号 1 2 3 4 5 6 7 8 9 10
用电量/度 53 86 90 124 132 200 215 225 300 410
(1)若规定第一阶梯的电价为每度0.5元,第二阶梯超出第一阶梯的部分每度0.6元,第三阶
梯超出第二阶梯的部分每度0.8元,试计算A居民用电户用电410度时应交电费多少元?
(2)现要在这10户家庭中任意抽取3户,求抽到用电量为第二阶梯的户数的分布列与数学期
望;
(3)以表中抽到的10户作为样本估计全市的居民用电,现从全市中抽取10户,若抽到k户的
用电量为第一阶梯的可能性最大,求k的值.
[解] (1)210×0.5+(400-210)×0.6+(410-400)×0.8=227(元).
(2)设抽到用电量为第二阶梯的户数为ξ.由题意知,用电量为第二阶梯的用户有3户,则ξ的
所有可能取值为0,1,2,3,
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,P(ξ=3)==.
故ξ的分布列为
ξ 0 1 2 3
P
所以E(ξ)=0×+1×+2×+3×=.
(3)由题意知,从全市中抽取10户,用电量为第一阶梯的户数X满足X~B,可知
P(X=k)=Ck10-k(k=0,1,2,3,…,10).
由
解得≤k≤,k∈N*.
所以当k=6时,概率最大,即抽到6户的用电量为第一阶梯的可能性最大.
[方法技巧]
在概率与统计的问题中,决策的工具是样本的数字特征或有关概率.决策方案的最佳选择是
将概率最大(最小)或数学期望最大(最小)的方案作为最佳方案,这往往借助于函数、不等式或
数列的有关性质去实现.[针对训练]
1.上面[典例]其他条件不变,求居民一个月应交电费关于用电量n(n∈N)的函数解析式f(n).
解:因为当0<n≤210时,f(n)=0.5n;
当210<n≤400时,f(n)=210×0.5+(n-210)×0.6=0.6n-21;
当n>400时,f(n)=210×0.5+(400-210)×0.6+(n-400)×0.8=0.8n-101,
所以f(n)=
2.设甲投球命中的概率为p.
(1)[考查不等式]如果甲一共投球4次,甲恰好投中2次的概率不大于其恰好投中3次的概率,
试求p的取值范围.
(2)[考查基本不等式]如果甲一共投球6次,那么甲恰好命中3次的概率可能是吗?
(3)[与导数交汇]记甲3次投球中恰有2次投中的概率为q,则当p取何值时,q最大?
解:(1)由C·p2·(1-p)2≤C·p3·(1-p),0<p<1,解得≤p<1,故p的取值范围为.
(2)不可能.P(X=3)=C·p3·(1-p)3≤
203=<.
(3)由题意知q=C·p2·(1-p)=-3p3+3p2,0<p<1,则q′=-9p2+6p=-3p(3p-2),易知
在上q=-3p3+3p2为增函数,在上q=-3p3+3p2为减函数,故当p=时,q取得最大值.
3.武汉又称江城,是湖北省省会,它不仅有着深厚的历史积淀与丰富的民俗文化,更有着众
多名胜古迹与旅游景点,黄鹤楼与东湖便是其中的两个.为合理配置旅游资源,现对已参观
黄鹤楼景点的游客进行随机问卷调查,若不游玩东湖记1分,若继续游玩东湖记2分,每位游
客选择是否参观东湖的概率均为,游客之间选择意愿相互独立.
(1)从游客中随机抽取3人,记这3人的总得分为随机变量X,求X的分布列与数学期望.
(2)①若从游客中随机抽取m(m∈N*)人,记这m人的总分恰为m分的概率为A ,求数列{A }
m m
的前10项和;
②在对所有游客进行随机问卷调查的过程中,记已调查过的人的累计得分恰为n分的概率为
B ,探讨B 与B (n≥2)之间的关系,并求数列{B }的通项公式.
n n n-1 n
解:(1)X的所有可能取值为3,4,5,6.
P(X=3)=3=,P(X=4)=C3=,P(X=5)=C3=,P(X=6)=3=.
所以X的分布列为
X 3 4 5 6
P
所以E(X)=3×+4×+5×+6×=.
(2)①总分恰为m分的概率A =m,
m
所以数列{A }是首项为,公比为的等比数列.
m
其前10项和S ==.
10②因为已调查过的人的累计得分恰为n分的概率为B ,得不到n分的情况只有先得(n-1)分,
n
再得2分,概率为B (n≥2),
n-1
所以1-B =B (n≥2),
n n-1
即B =-B +1(n≥2),
n n-1
所以B -=-(n≥2),
n
所以B -=n-1.易知B =,
n 1
所以B =-n-1=+n=+.
n
1.调查表明,市民对城市的居住满意度与该城市环境质量、城市建设、物价与收入的满意度
有极强的相关性.现将这三项的满意度指标分别记为x,y,z,并对它们进行量化:0表示不满
意,1表示基本满意,2表示满意.再用综合指标ω=x+y+z的值评定居民对城市的居住满
意度等级:若ω≥4,则居住满意度为一级;若2≤ω≤3,则居住满意度为二级;若0≤ω≤1,则居住
满意度为三级.为了解某城市居民对该城市的居住满意度,研究人员从此城市居民中随机抽
取10人进行调查,得到如下结果:
人员编号 1 2 3 4 5
(x,y,z) (1,1,2) (2,1,1) (2,2,2) (0,1,1) (1,2,1)
人员编号 6 7 8 9 10
(x,y,z) (1,2,2) (1,1,1) (1,2,2) (1,0,0) (1,1,1)
(1)在这10名被调查者中任取2人,求这2人的居住满意度指标z相同的概率;
(2)从居住满意度为一级的被调查者中任取一人,其综合指标为m,从居住满意度不是一级的
被调查者中任取一人,其综合指标为n,记随机变量X=m-n,求随机变量X的分布列及其
数学期望.
解:(1)记事件A为“从10名被调查者中任取2人,这2人的居住满意度指标z相同”,则居住
满意度指标z为0的只有编号为9的1名;居住满意度指标z为1的编号有2,4,5,7,10共5名;
居住满意度指标z为2的编号有1,3,6,8共4名.
从10名被调查者中任取2人,所有可能的结果为C=45(种),这2人的居住满意度指标z相
同的结果为C+C=10+6=16(种),所以在这10名被调查者中任取2人,这2人的居住满意
度指标z相同的概率为P(A)=.
(2)计算10名被调查者的综合指标,可列下表:
人员编号 1 2 3 4 5 6 7 8 9 10
综合指标 4 4 6 2 4 5 3 5 1 3
其中居住满意度为一级的编号有1,2,3,5,6,8共6名,则m的值可能为4,5,6;居住满意度不是
一级的编号有4,7,9,10共4名,则n的值可能为1,2,3,所以随机变量X所有可能的取值为
1,2,3,4,5.
P(X=1)==,P(X=2)==,
P(X=3)==,
P(X=4)==,
P(X=5)==,
所以随机变量X的分布列为
X 1 2 3 4 5
P
E(X)=1×+2×+3×+4×+5×=.
2.已知具有相关关系的两个变量x,y之间的几组数据如下表所示:
x 2 4 6 8 10
y 3 6 7 10 12
(1)请根据上表数据在图中绘制散点图;
(2)请根据上表提供的数据,求出y关于x的线性回归方程y=bx+a,并估计当x=20时y的值;
(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y
-4=0右下方的点的个数为ξ,求ξ的分布列及数学期望.
参考公式:b=,a=-b.
解:(1)散点图如图所示.
(2)依题意得,=×(2+4+6+8+10)=6,
=×(3+6+7+10+12)=7.6,
=4+16+36+64+100=220,
y=6+24+42+80+120=272,
i i
b===1.1,
所以a=7.6-1.1×6=1,所以线性回归方程为 y=1.1x+1,
故当x=20时,y=23.
(3)可以判断,落在直线2x-y-4=0右下方的点的坐标满足2x-y-4>0,
所以符合条件的点的坐标为(6,7),(8,10),(10,12),
故ξ的所有可能取值为1,2,3.
P(ξ=1)==,P(ξ=2)===,P(ξ=3)==,
故ξ的分布列为
ξ 1 2 3
P
E(ξ)=1×+2×+3×=.
3.2020年10月16日,是第40个世界粮食日.中国工程院院士袁隆平海水稻团队迎来了海
水稻的测产收割,其中宁夏石嘴山海水稻示范种植基地YC801测产,亩产超过648.5千克,
通过推广种植海水稻,实现了荒滩变粮仓,大大提高了当地居民收入.某企业引进一条先进
食品生产线,以海水稻为原料进行深加工,发明了一种新产品,若该产品的质量指标值为
m(m∈[70,100]),其质量指标等级划分如下表:
质量指标值m [70,75) [75,80) [80,85) [85,90) [90,100]
质量指标等级 良好 优秀 良好 合格 废品
为了解该产品的经济效益并及时调整生产线,该企业先进行试生产.现从试生产的产品中随
机抽取了1 000件,将其质量指标值m的数据作为样本,绘制频率分布直方图如图:
(1)若将频率作为概率,从该产品中随机抽取3件产品,记“抽出的产品中至少有1件不是废
品”为事件A,求事件A发生的概率.
(2)若从质量指标值m≥85的样本中利用分层抽样的方法抽取7件产品,然后从这7件产品
中任取3件产品,求质量指标值m∈[90,95)的件数X的分布列及数学期望.
(3)若每件产品的质量指标值m与利润y(单位:元)的关系如下表(10,函数y=2.5t-0.5et单调递增;
当t∈(ln 5,4)时,y′<0,函数y=2.5t-0.5et单调递减.
所以当t=ln 5时,y取得最大值,最大值为2.5×ln 5-0.5eln 5≈1.5.
所以生产该产品能够盈利,当t=ln 5≈1.6时,每件产品的平均利润取得最大值,约为1.5元.
4.某景点上山共有999级台阶,寓意长长久久.甲上台阶时,可以一步走一个台阶,也可以一
步走两个台阶,若甲每步上一个台阶的概率为,每步上两个台阶的概率为.为了简便描述问题,
我们约定,甲从0级台阶开始向上走,一步走一个台阶记1分,一步走两个台阶记2分,记甲
登上第n个台阶的概率为P ,其中n∈N*,且n≤998.
n
(1)若甲走3步时所得分数为X,求X的分布列和数学期望;
(2)证明:数列{P -P }是等比数列;
n+1 n
(3)求甲在登山过程中,恰好登上第99级台阶的概率.
解:(1)由题意可得X的所有可能取值为3,4,5,6,
则P(X=3)=3=,P(X=4)=C××2=,
P(X=5)=C×2×=,
P(X=6)=3=,
所以X的分布列为
X 3 4 5 6
P
所以X的数学期望
E(X)=3×+4×+5×+6×=5.
(2)证明:由题意可得P =P +P ,
n+2 n+1 n
所以P -P =-(P -P ).
n+2 n+1 n+1 n
又P=,P=+2=,所以P-P=≠0,
1 2 2 1
所以{P -P }是以为首项,-为公比的等比数列.
n+1 n
(3)由(2)可得,
P =(P -P )+(P -P )+…+(P-P)+P
99 99 98 98 97 2 1 1
=+=-×98.