文档内容
通关秘籍 06 概率统计
目录
【高考预测】概率预测+题型预测+考向预测
【应试秘籍】总结常考点及应对的策略
【误区点拨】点拨常见的易错点
易错点一:回归方程
易错点二:独立性检验的意义
【抢分通关】精选名校模拟题,讲解通关策略
【题型一】条件概率
【题型二】 全概率公式与贝叶斯公式
【题型三】 离散型随机变量的分布列和概率性质
【题型四】 二项分布
【题型五】 超几何分布
【题型六】 正态分布
概率预测 ☆ ☆ ☆ ☆ ☆
题型预测 选择题、填空题☆ ☆ ☆ ☆ ☆
考向预测 全概率公式、正态分布、总体百分位数的估计
概率属于解答题必考题,大多考察两方面,一个是超几何分布与二项分布的区别,还有就是线性回归
方程与独立性检验。小题中新教材新加的全概率公式和条件概率是重点,当然古典概型和相互独立事件的
判断以及正态分布也是需要熟练掌握的。今年还需对冷门的知识点,比如用样本方差估计总体方差、最小
二乘法、残差等知识点的掌握和理解。均是书本上提到的内容,但长久未考,学生都容易忽视。
易错点一:回归方程
(1)回归方程为 ,其中 .(2)通过求 的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的
距离的平方和最小,这一方法叫做最小二乘法.
例(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因
花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度
和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为 ,利用最小二乘法求
得相应的经验回归方程为 ,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
【答案】C
【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,
把 代入 可得 ,C选项正确;
由于 是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据
的相关系数不一定是 ,D选项错误
故选:C
变式1:(2024·青海海南·一模)近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发
展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.某车企通过市场调研并进行粗略模
拟,得到研发投入 (亿元)与经济收益 (亿元)的数据,统计如下:
研发投入 亿元 1 2 3 4 5
经济收益 亿元 2.5 4 6.5 9 10.5
(1)计算 的相关系数 ,并判断是否可以认为研发投入 与经济收益 具有较高的线性相关程度:(若
,则线性相关程度一般,若 ,则线性相关程度较高)
(2)求出 关于 的线性回归方程,并预测研发投入10亿元时的经济收益.
参考数据:附:相关系数 ,线性回归方程的斜率 ,截距
.
【答案】(1) ,
(2) ,约为 亿元
【详解】(1)依题意 , ,
,
所以 ,
所以 ,
因为 ,所以可以认为研发投入 与经济收益 具有较高的线性相关程度;
(2)由(1)可得 ,
所以 ,
所以 关于 的线性回归方程为 ,
当 时 ,所以当研发投入 亿元时的经济收益约为 亿元.
变式2:(2024·全国·模拟预测)某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期
作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养
液,现
统计了使用营养液十天之内该作物的高度变化
天数x 1 2 3 4 5 6 7 8 9 10
作物高度y/cm 9 10 10 11 12 13 13 14 14 14
(1)观察散点图可知,天数 与作物高度 之间具有较强的线性相关性,用最小二乘法求出作物高度 关于
天数 的线性回归方程 (其中 用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为 ,请根据(1)中的结果预测第22天该作物的高
度的残差.参考公式: .参考数据: .
【答案】(1) ;
(2) .
【详解】(1)依题意, ,
,
故 ,
,故所求回归直线方程为 .
(2)由(1)可知,当 时, ,
故所求残差为 .
易错点二:独立性检验的意义
独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.
例 (2024·吉林·模拟预测)短视频已成为当下宣传的重要手段,东北某著名景点利用短视频宣传增加旅
游热度,为调查某天南北方游客来此景点旅游是否与收看短视频有关,该景点对当天前来旅游的500名游
客调查得知,南方游客有300人,因收看短视频而来的280名游客中南方游客有200人.
(1)依据调查数据完成如下列联表,根据小概率值 的独立性检验,分析南北方游客来此景点旅游
是否与收看短视颍有关联:单位:人
短视频
游客 合计
收看 未看
南方游
客
北方游
客
合计
(2)为了增加游客的旅游乐趣,该景点设置一款5人传球游戏,每个人得到球后都等可能地传给其余4人之
一,现有甲、乙等5人参加此游戏,球首先由甲传出.
(i)求经过 次传递后球回到甲的概率;(ii)记前 次传递中球传到乙的次数为 ,求 的数学期望.
参考公式: ,其中 ;
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,无关
(2)(i) ;(ii)
【详解】(1)将所给数据进行整理,得到如下列联表:
短视频
游客 合计
收看 未看
南方游
200 100 300
客
北方游
80 120 200
客
合计 280 220 500
零假设 :南北方游客来此景点旅游与短视频无关联.
根据小概率值 的独立性检验,我们推断 不成立,
即认为南北方游客来此景点旅游与收看短视频有关联,此推断犯错误的概率不大于0.001
(2)(i)设经过 次传递后回到甲的概率为 ,
, ,
又 ,
所以 是首项为 ,公比为 的等比数列,
所以 .
(ii)(方法一)
设第 次传递时甲接到球的次数为 ,则 服从两点分布, ,
设前 次传递中球传到甲的次数为 ,,
因为 ,所以 .
(方法二)
设第 次传递时,乙接到球的概率和次数分别为 与 ,则 服从两点分布,
,由题可知 , ,
又 ,所以 ,所以 是首项为 ,公比为 的等比数列,
, ,
,
故 .
变式1: (2024·河北沧州·一模)流感病毒是一种 病毒,大致分为甲型、乙型、丙型三种,其中甲
流病毒传染性最强,致死率最高,危害也最大.某药品科技研发团队针对甲流病毒的特点,研发出预防甲
流
药品 和治疗甲流药品 ,根据研发前期对动物试验所获得的相关有效数据作出统计,随机选取其中的
100个样本数据,得到如下2×2列联表:
甲流病毒
预防药品 合计
感
未感染
染
未使用 24 21 45
使用 16 39 55
合计 40 60 100
(1)根据 的独立性检验,分析预防药品 对预防甲流的有效性;
(2)用频率估计概率,从已经感染的动物中,采用随机抽样方式每次选出1只,用治疗药品 对该动物进
行治疗,已知治疗药品 的治愈数据如下:对未使用过预防药品 的动物的治愈率为0.5,对使用过预防药品 的动物的治愈率为0.75,若共选取3只已感染动物,每次选取的结果相互独立,记选取的3只已感
染动物中被治愈的动物只数为 ,求 的分布列与数学期望.
附: .
0.050 0.010 0.001
3.841 6.635 10.828
【答案】(1)答案见解析
(2)答案见解析
【详解】(1)假设 :使用预防药品 与对预防甲流无效果,
由列联表可知 ,
根据小概率值 的独立性检验,推断 不成立,
即认为使用预防药品 与对预防甲流有效果,此推断犯错误的概率不大于0.05.
(2)设事件 表示使用治疗药品 并且治愈,事件 表示未使用过预防药品 ,事件 表示使用过预
防药品 ,
由题意可得 ,
且 ,
则 ,
治疗药品 的治愈概率 ,
则 ,
所以 , ,
, ,
所以,随机变量 的分布列为
0 1 2 3
.【题型一】条件概率
一般地,当事件B发生的概率大于0时(即P(B)>0),已知事件B发生的条件下事件A发生的概率,称为条件
概率,记作P(A|B), 而且P(A|B)= .
【例1】(多选)(2024·湖南娄底·一模)对于事件 与事件 ,若 发生的概率是0.72,事件 发生
的概率是事件 发生的概率的2倍,下列说法正确的是( )
A.若事件 与事件 互斥,则事件 发生的概率为0.36
B.
C.事件 发生的概率的范围为
D.若事件 发生的概率是0.3,则事件 与事件 相互独立
【答案】BCD
【详解】对于 ,若事件 与事件 互斥,则 ,所以
,故A错误;
对于B, ,故 正确;
对于C, ,
若事件 与事件 互斥,则 ,此时 取到最小值为0.24,若 ,此时
取到最大值为 ,故C正确;
对于D, ,则 ,由 ,
得 ,则事件 与事件 相互独立,故D正确.
故选:BCD.
【例2】(2024·北京石景山·一模)一袋中有大小相同的4个红球和2个白球.若从中不放回地取球2次,
每次任取1个球,记“第一次取到红球”为事件 ,“第二次取到红球”为事件 ,则 ( )A. B. C. D.
【答案】C
【详解】 .
故选:C.
【例3】(2024·辽宁沈阳·二模)我国古代典籍《周易》用“卦”描述万物的变化,每一“重卦”由从下到上排
列的6个爻组成,爻分为阳爻“ ”和阴爻“ ”,如图就是一重卦.在所有重卦
中随机取一重卦,记事件 “取出的重卦中至少有1个阴爻”,事件 “取出的重卦中至少有3个阳爻”.
则 ( )
A. B. C. D.
【答案】C
【详解】 ,事件 “取出的重卦中有3阳3阴或4阳2阴或5阳1阴”,
则 ,则
故选:C
【变式1】(2024·山西·二模)一个盒子里装有5个小球,其中3个是黑球,2个是白球,现依次一个一个
地往外取球(不放回),记事件 表示“第 次取出的球是黑球”, ,则下面不正确的是
( )
A. B.
C. D.
【答案】D
【详解】依次一个一个地往外取球(不放回)的试验,基本事件总数是 ,它们等可能,对于A, 表示第3次取出黑球, ,A正确;
对于B, 表示第1次、第2次取出的球都是黑球, ,B正确;
对于C, , ,
所以 ,C正确;
对于D, ,所以 ,D错误.
故选:D
【变式2】(2024·全国·模拟预测)甲、乙两人进行一场游戏比赛,其规则如下:每一轮两人分别投掷一
枚质地均匀的骰子,比较两者的点数大小,其中点数大的得3分,点数小的得0分,点数相同时各得1
分.经过三轮比赛,在甲至少有一轮比赛得3分的条件下,乙也至少有一轮比赛得3分的概率为( )
A. B. C. D.
【答案】B
【详解】用 分别表示甲、乙两人投掷一枚骰子的结果,
因为甲、乙两人每次投掷均有6种结果,则在一轮游戏中,共包含 个等可能的基本事件.
其中,甲得3分,即 包含的基本事件有
,共15个,概率为
.
同理可得,甲每轮得0分的概率也是 ,得1分的概率为 .
所以每一轮甲得分低于3分的概率为 .
设事件A表示甲至少有一轮比赛得3分,事件 表示乙至少有一轮比赛得3分,则事件 表示经过三轮比
赛,甲没有比赛得分为3分.
则 , .
事件 可分三类情形:
①甲有两轮得3分,一轮得0分,概率为 ;②甲有一轮得3分,两轮得0分,概率为 ;
③甲有一轮得3分,一轮得0分,一轮得1分,概率为 .
所以 ,
所以 .
故选:B.
【变式3】(23-24高二下·辽宁大连·阶段练习)小明爬楼梯每一步走1级台阶或2级台阶是随机的,且走
1级台阶的概率为 ,走2级台阶的概率为 .小明从楼梯底部开始往上爬,在小明爬到第4级台阶的条件
下,他走了3步的概率是( )
A. B. C. D.
【答案】B
【详解】设事件 “小明爬到第4级台阶”, “小明走了3步爬到第4级台阶”,
事件 包含三种情况:①小明走了4步到第4级台阶,概率为 ;
②小明走了3步到第4级台阶,概率为 ,即 ;
③小明走了2步到第4级台阶,概率为 ;
所以 ,
.
故选:B
【题型二】 全概率公式与贝叶斯公式
全概率公式
一般地,设A,A,…,A 是一组两两互斥的事件,A∪A∪…∪A =Ω,且P(A)>0,i=1,2,…,n,则对
1 2 n 1 2 n i
任意的事件B Ω,有
⊆
P(B)= P(A)P(B|A)
i i我们称上面的公式为全概率公式.
*贝叶斯公式:
一般地,设 是一组两两互斥的事件, ,且 ,
则对任意的事件 ,有
【例1】(2024·江西南昌·一模)假设甲袋中有3个白球和2个红球,乙袋中有2个白球和2个红球.现从
甲袋中任取2个球放入乙袋,混匀后再从乙袋中任取2个球.已知从乙袋中取出的是2个白球,则从甲袋中
取出的也是2个白球的概率为( )
A. B. C. D.
【答案】C
【详解】设从甲中取出 个球,其中白球的个数为 个的事件为 ,事件 的概率为 ,从乙中取出
个球,其中白球的个数为2个的事件为 ,事件 的概率为 ,由题意:
① , ;
② , ;
③ , ;
根据贝叶斯公式可得,从乙袋中取出的是2个白球,则从甲袋中取出的也是2个白球的概率为
故选:C
【例2】(2024·海南省直辖县级单位·一模)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯
统计理论,随机事件 , 存在如下关系: .若某地区一种疾病的患病率是0.05,
现有一种试剂可以检验被检者是否患病.已知该试剂的准确率为 ,即在被检验者患病的前提下用该试剂检测,有 的可能呈现阳性;该试剂的误报率为 ,即在被检验者未患病的情况下用该试剂检
测,有 的可能会误报阳性.现随机抽取该地区的一个被检验者,已知检验结果呈现阳性,则此人患病
的概率为( )
A. B. C. D.
【答案】C
【详解】依题意,设用该试剂检测呈现阳性为事件B,被检测者患病为事件A,未患病为事件 ,
则 , , , ,
故 ,
则所求概率为 .
故选:C.
【例3】(2024·全国·二模)某单位选派一支代表队参加市里的辩论比赛,现有“初心”“使命”两支预备队.
选哪支队是随机的,其中选“初心”队获胜的概率为0.8,选“使命”队获胜的概率为0.7,单位在比赛中获胜
的条件下,选“使命”队参加比赛的概率为( )
A. B. C. D.
【答案】D
【详解】依题意,记选“初心”队为事件 ,选“使命”队为事件 ,该单位获胜为事件 ,
则 ,
因此 ,
所以选“使命”队参加比赛的概率 .
故选:D
【变式1】(多选)(2024·山西朔州·一模)在信道内传输 信号,信号的传输相互独立,发送某一
信号时,收到的信号字母不变的概率为 ,收到其他两个信号的概率均为 .若输入四个相
同的信号 的概率分别为 ,且 .记事件 分别表示“输
入 ”“输入 ”“输入 ”,事件 表示“依次输出 ”,则( )
A.若输入信号 ,则输出的信号只有两个 的概率为
B.
C.D.
【答案】BCD
【详解】A:因为发送某一信号时,收到的信号字母不变的概率为 ,收到其他两个信号的概率
均为 ,即收到的信号字母变的概率为 ,且信号的传输相互独立,
所以输入信号 ,则输出的信号只有两个 的概率为 ,故A错误;
B:因为 ,故B正确;
C: ,故C正确;
D:因为 ,
而
,
所以
,
故D正确;
故选:BCD.
【变式2】(2024·江苏扬州·模拟预测)有3台车床加工同一型号的零件,第1台加工的次品率为 ,第
2,3台加工的次品率均为 ,加工出来的零件混放在一起.已知第 台车床加工的零件数分别占总数
的 .任取一个零件,如果取到的零件是次品,则它是第2台车床加工的概率为 .
【答案】【详解】设 表示“取到的零件是第 台车床加工 ”, 表示“取到的零件是次品”,
则
,
,
故 .
故答案为: .
【变式3】(2024·浙江丽水·二模)为保护森林公园中的珍稀动物,采用某型号红外相机监测器对指定区
域进行监测识别.若该区域有珍稀动物活动,该型号监测器能正确识别的概率(即检出概率)为 ;若该
区域没有珍稀动物活动,但监测器认为有珍稀动物活动的概率(即虚警概率)为 .已知该指定区域有珍
稀动物活动的概率为0.2.现用2台该型号的监测器组成监测系统,每台监测器(功能一致)进行独立监测
识别,若任意一台监测器识别到珍稀动物活动,则该监测系统就判定指定区域有珍稀动物活动.
(1)若 .
(i)在该区域有珍稀动物活动的条件下,求该监测系统判定指定区域有珍稀动物活动的概率;
(ii)在判定指定区域有珍稀动物活动的条件下,求指定区域实际没有珍稀动物活动的概率(精确到
0.001);
(2)若监测系统在监测识别中,当 时,恒满足以下两个条件:①若判定有珍稀动物活动时,该
区域确有珍稀动物活动的概率至少为0.9;②若判定没有珍稀动物活动时,该区域确实没有珍稀动物活动
的概率至少为0.9.求 的范围(精确到0.001).
(参考数据: )
【答案】(1)(i) ;(ii)
(2)
【详解】(1)记事件 为“监测系统判定指定区域有珍稀动物活动”,事件 为“监测区域实际上有珍稀动
物活动”,
(i) ;
(ii)
,则
;
(2) ,
,
由题意可得 ,即 ,
令 , ,得 , ,故 , ,
即 ,即 ,则 ,
因为 ,所以 ,所以 ,
故 ,即 ,所以 ,
故 .
【题型三】 离散型随机变量的分布列和概率性质
设离散型随机变量X的分布列为:
X x x … x … x
1 2 i n
P p p … p … p
1 2 i n
则(1)p≥0,i=1,2,…,n;
i
(2)p+p+…+p+…+p=1;
1 2 i n
(3)E(X)=xp + xp + … + xp + … + xp;
1 1 2 2 i i n n
(4)D(X)= ( x - E ( X ) ) 2 p + ( x - E ( X ) ) 2 p + … + ( x - E ( X ) ) 2 p.
1 1 2 2 n n
随机变量的数学期望与方差
(1)如果E(η)和E(ξ)都存在,则E(ξ+η)= E ( ξ ) + E ( η ) .
(2)若η=aξ+b,则E(η)= aE ( ξ ) + b ,D(η)= a 2 D ( ξ ) .
(3)期望与方差的转化:D(ξ)=E(ξ2)-(E(ξ))2.【例1】(2024·山西临汾·二模)已知质量均匀的正 面体, 个面分别标以数字1到 .
(1)抛掷一个这样的正 面体,随机变量 表示它与地面接触的面上的数字.若 求n;
(2)在(1)的情况下,抛掷两个这样的正n面体,随机变量 表示这两个正 面体与地面接触的面上的数字
和的情况,我们规定:数字和小于7,等于7,大于7, 分别取值0,1,2,求 的分布列及期望.
【答案】(1) .
(2)分布列见解析, .
【详解】(1)因为 ,所以 .
(2)样本空间 ,共有36个样本点.
记事件 “数字之和小于7”,事件 “数字之和等于7",
事件 “数字之和大于7”.
,
,共15种,
故
,共6种,
故 ;
,
,共15种,
故 ;
从而 的分布列为:
0 1 2
故
【例2】(2024·浙江宁波·二模)三个人利用手机软件依次进行拼手气抢红包活动,红包的总金额数为
个单位.第一个人抢到的金额数为1到 个单位且等可能(记第一个人抢完后剩余的金
额数为 ),第二个人在剩余的 个金额数中抢到1到 个单位且等可能,第三个人抢到剩余的所有
金额数,并且每个人抢到的金额数均为整数个单位.三个人都抢完后,获得金额数最高的人称为手气王
(若有多人金额数相同且最高,则先抢到最高金额数的人称为手气王).(1)若 ,则第一个人抢到的金额数可能为 个单位且等可能.
(i)求第一个人抢到金额数 的分布列与期望;
(ii)求第一个人获得手气王的概率;
(2)在三个人抢到的金额数为 的一个排列的条件下,求第一个人获得手气王的概率.
【答案】(1)(i)分布列见解析,2;(ii) ;
(2) .
【详解】(1)若第一个人抢到的金额数为 个单位,第二个人抢到的金额数为 个单位,第三个人抢到的
金额数为 个单位,我们将三个人抢到的金额数记作 .
(i) ,
所以 的分布列为
1 2 3
.
(ii)第一个人获得手气王时,三个人抢到的金额数只可能为 ,
故第一个人获得手气王的概率
.
(2)记事件 “三个人抢到的金额数为 的一个排列”,事件 “第一个人获得手气王”.
所要求的是条件概率 ,有 .
当三个人抢到的金额数为 的一个排列时,总金额数为9,故第一个人抢到的金额数可能为
.
又 ,
,
故 .【例3】(2024·湖南·模拟预测)有一枚质地均匀点数为1到4的特制骰子,投掷时得到每种点数的概率均
等,现在进行三次独立投掷,记X为得到最大点数与最小点数之差,则X的数学期望 ( )
A. B. C. D.
【答案】D
【详解】 的所有可能取值为 ,记三次得到的数组成数组 ,
满足 的数组有:
,共4个,
所以 ,
满足 的数组有:
,
,共18个,
所以 ,
满足 的数组有:
,
,
,
,共24个,
所以 ,
满足 的数组有:
, ,
, ,
, ,共18个,
所以 ,
所以X的数学期望 .
故选:D.
【变式1】(2024·全国·模拟预测)在2002年美国安然公司(在2000年名列世界财富500强第16位,拥
有数千亿资产的巨头公司,曾经是全球最大电力、天然气及电讯服务提供商之一)宣布破产,原因是持续
多年的财务数据造假.但是据说这场造假丑闻的揭露并非源于常规的审计程序,而是由于公司公布的每股盈利数据与一个神秘的数学定理——本福特定律——严重偏离.本福特定律指出,一个没有人为编造的自
然生成的数据(为正实数)中,首位非零的数字是 这九个事件并不是等可能的,而是大约遵循这样一
个
公式:随机变量 是一个没有人为编造的首位非零数字,则 , 则根据本
福特定律,在一个没有人为编造的数据中,首位非零数字是8的概率约是(参考数据: ,
)( )
A.0.046 B.0.051 C.0.058 D.0.067
【答案】B
【详解】由题意可得: ,
故选:B
【变式2】(2024·贵州黔西·一模)高一(1)班每周举行历史擂台比赛,排名前2名的同学组成守擂者
组,下周由3位同学组成攻擂者组挑战,共答20题,若每位守擂者答出每道题的概率为 ,每位攻擂者
答出每道题的概率为 .为提高攻擂者的积极性,第一题由攻擂者先答,若未答对,再由守擂者答;剩下
的题抢答,抢到的组回答,只要有一人答出,即为答对,记为1分,否则为0分.
(1)求攻擂者组每道题答对的概率 及守擂者组第1题后得分为0分的概率 ;
(2)设 为3题后守擂者的得分,求 的分布列与数学期望 .
【答案】(1) ,
(2)分布列见解析, ;
【详解】(1)根据答题规则可知,若三人均答不出,则攻擂者组答不出每道题的概率 ;
则可知攻擂者组每道题答对的概率 ;
若守擂者组第1题后得分为0分,则第一题由攻擂者先答,
该题需答对或者该题答错由守擂者组再答题并答错,
易知守擂者组答出每道题的概率为 ,
因此 ;
(2)易知 的所有可能取值为 ;
第一题守擂者组得一分的概率为 ,
抢答环节的题目守擂者组和攻擂者组抢到的概率均为 ,守擂者组每题得一分的概率为 ;即可知前三题中第一题守擂者组得一分的概率为 ,第二、三题得一分的概率均为 ;
则 ,
,
,
,
因此 的分布列为
0 1 2 3
数学期望 .
【变式3】(2024·湖南益阳·模拟预测)新鲜是水果品质的一个重要指标.某品牌水果销售店,为保障所销
售的某种水果的新鲜度,当天所进的水果如果当天没有销售完毕,则第二天打折销售直至售罄.水果销售
店以每箱进货价50元、售价100元销售该种水果,如果当天卖不完,则剩下的水果第二天将在原售价的
基础上打五折特价销售,而且要整体支付包装更换与特别处理等费用30元.这样才能保障第二天特价水
果售罄,并且不影响正价水果销售,水果销售店经理记录了在连续50天中该水果的日销售量x(单位:
箱)和天数y(单位:天)如下表所示:
日销售量x(单位:箱) 22 23 24 25 26
天数y(单位:天) 10 10 15 9 6
(1)为能减少打折销售份额,决定 地满足顾客需求(即在100天中,大约有70天可以满足顾客需
求).请根据上面表格中的数据,确定每天此种水果的进货量 的值.(以箱为单位,结果保留一位小数)
(2)以这50天记录的日需求量的频率作为日需求量的概率,设(1)中所求 的值满足
,请以期望作为决策依据,帮销售店经理判断每天购进此种水果是 箱划算还是 箱划算?
【答案】(1)
(2)
【详解】(1) 地满足顾客需求相当于估计某类水果日销售量的 分位数.
由表可知,把50个日需求量的数据从小到大排列,
由 ,日需求量在 箱及以下(含 箱)的天数为 ,
可知,可以估计日需求量的第 分位数为 ,
所以能 地满足顾客的需求,估计每天应该进货量为 箱.(2)由(1)知 ,即 ,
设每天的进货量为 箱的利润为 ,
由题设,每天的进货量为 箱,
当天卖完的概率为 ,
当天卖不完剩下 箱的概率为 ,
当天卖不完剩下 箱的概率为 ,
若当天卖完 元,
若当天卖不完剩下 箱, 元,
若当天卖不完剩下 箱, 元,
所以 元.
设每天的进货量为 箱的利润为 ,
由题设,每天的进货量为 箱,
当天卖完的概率为 ,
当天卖不完剩下 箱的概率为 ,
当天卖不完剩下 箱的概率为 ,
当天卖不完剩下 箱的概率为 ,
若当天卖完 元,
当天卖不完剩下 箱,则 元,
当天卖不完剩下 箱,则 元,
当天卖不完剩下 箱,则 元,
所以 元,
由于 ,
显然每天的进货量 箱的期望利润小于每天的进货量为 箱的期望利润,
所以每天购进此种水果 箱划算一些.
【题型四】 二项分布
二项分布:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率
为p,则事件A恰好发生k次的概率为P(X=k)= pk(1-p)n-k,k=0,1,2,…,n,则称随机变量X服从二
项分布,记作X~B(n,p),并称p为成功概率.二项分布的数学期望与方差:若X~B(n,p),则E(X)=np.D(X)=np(1-p)
【例1】(2024·河北邢台·一模)小张参加某知识竞赛,题目按照难度不同分为A类题和B类题,小张回
答A类题正确的概率为0.9,小张回答B类题正确的概率为0.45.已知题库中B类题的数量是A类题的两
倍.
(1)求小张在题库中任选一题,回答正确的概率;
(2)已知题库中的题目数量足够多,该知识竞赛需要小张从题库中连续回答10个题目,若小张在这10个题
目中恰好回答正确k个( ,1,2, ,10)的概率为 ,则当k为何值时, 最大?
【答案】(1)0.6
(2)6
【详解】(1)设小张回答A类题正确的概率为 ,小张回答B类题正确的概率为 ,小张在题库
中任选一题,回答正确的概率为 ,
由题意可得 ,
所以 ,
所以小张在题库中任选一题,回答正确的概率为0.6.
(2)由(1)可得 ,
设 ,
即 ,
所以 ,
即 ,解得 ,
又 ,所以 时, 最大.
【例2】(2024·全国·模拟预测)某市物理教研员在一次高二全市统考后为了了解本市物理考试情况,从
全市高二参加考试的学生中随机抽取50名学生对其物理成绩(单位:分,成绩都在 内)进行统
计,制成频率分布直方图如图所示:
(1)求 的值,并以样本估计总体,求本次高二全市统考物理成绩的中位数(同一组中的数据用该组区间
的中点值为代表);
(2)从该市高二参加考试的学生中随机抽取3人,记这3人中物理考试成绩在 内的人数为 ,求
的分布列及数学期望.
【答案】(1) ,68
(2)分布列见解析,
【详解】(1)由题知 ,解得 ,
因为 ,
,
所以可设中位数为 ,
则 ,
解得 ,所以本次高二全市统考物理成绩的中位数为68.
(2)从该市高二参加考试的学生中随机抽取1人,其物理考试成绩在 内的概率为
.由题意知 的所有可能取值为0,1,2,3,
且 , ,
, ,
所以 的分布列为
0 1 2 3所以 的数学期望 .
(另解: , )
【例3】(2024·全国·模拟预测)如图所示,已知一质点在外力的作用下,从原点 出发,每次向左移动
的概率为 ,向右移动的概率为 .若该质点每次移动一个单位长度,设经过5次移动后,该质点位于
的位置,则 ( )
A. B. C. D.
【答案】D
【详解】依题意,当 时, 的可能取值为1,3,5,且 ,
所以
.
故选:D.
【变式1】(2024·辽宁·模拟预测)一质子从原点处出发,每次等可能地向左、向右、向上或向下移动一
个单位长度,则移动6次后质子回到原点处的概率是( )
A. B. C. D.
【答案】C
【详解】因为移动6次后仍然回到原点,故质子水平方向移动偶数次,竖直方向移动偶数次
若质子水平方向移动0次,则回到原点的概率 ;
若质子水平方向移动2次,则回到原点的概率 ;
若质子水平方向移动4次,则回到原点的概率 ;
若质子水平方向移动6次,则回到原点的概率 ;故移动6次后仍然回到原点的概率为 ,
故选:C
【变式2】(2023·山东·模拟预测)已知随机变量 ,其中 ,随机变量 的分布列为
0 1 2
表中 ,则 的最大值为 .我们可以用 来刻画 与 的相似
程度,则当 ,且 取最大值时, .
【答案】
【详解】由题意,可得 ,则
,
因为 ,所以当 时, 取得最大值 ,
又由 ,可得 ,解得 ,
可得 ,
又因为 ,
可得 ,
所以 .
故答案为: ; ,
【变式3】(2024·北京西城·一模)10米气步枪是国际射击联合会的比赛项目之一,资格赛比赛规则如
下:每位选手采用立姿射击60发子弹,总环数排名前8的选手进入决赛.三位选手甲、乙、丙的资格赛成
绩如下:
环数 6环 7环 8环 9环 10环
甲的射出频数 1 1 10 24 24
乙的射出频数 3 2 10 30 15丙的射出频数 2 4 10 18 26
假设用频率估计概率,且甲、乙、丙的射击成绩相互独立.
(1)若丙进入决赛,试判断甲是否进入决赛,说明理由;
(2)若甲、乙各射击2次,估计这4次射击中出现2个“9环”和2个“10环”的概率;
(3)甲、乙、丙各射击10次,用 分别表示甲、乙、丙的10次射击中大于 环的次数,其中
.写出一个 的值,使 .(结论不要求证明)
【答案】(1)甲进入决赛,理由见解析
(2)
(3) 或8
【详解】(1)甲进入决赛,理由如下:
丙射击成绩的总环数为 ,
甲射击成绩的总环数为 .
因为 ,
所以用样本来估计总体可得甲进入决赛.
(2)根据题中数据:
“甲命中9环”的概率可估计为 ;
“甲命中10环”的概率可估计为 ;
“乙命中9环”的概率可估计为 ;
“乙命中10环”的概率可估计为 .
所以这4次射击中出现2个“9环”和2个“10环”的概率可估计为:
(3) 或8.
根据题中数据:
当 时,
在每次射击中,甲击中大于 环的的概率为 ;
在每次射击中,乙击中大于 环的的概率为 ;
在每次射击中,丙击中大于 环的的概率为 ;
由题意可知: , , .此时 , , ,
不满足 .
当 时,
在每次射击中,甲击中大于 环的的概率为 ;
在每次射击中,乙击中大于 环的的概率为 ;
在每次射击中,丙击中大于 环的的概率为 ;
由题意可知: , , .
此时 , , ,
满足 .
当 时,
在每次射击中,甲击中大于 环的的概率为 ;
在每次射击中,乙击中大于 环的的概率为 ;
在每次射击中,丙击中大于 环的的概率为 ;
由题意可知: , , .
此时 , , ,
满足 .
当 时,
在每次射击中,甲击中大于 环的的概率为 ;
在每次射击中,乙击中大于 环的的概率为 ;
在每次射击中,丙击中大于 环的的概率为 ;
由题意可知: , , .
此时 , , ,
不满足 .
所以 或8.【题型五】 超几何分布
超几何分布列
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)= ,k=0,1,2,…,
m,其中 m = min{ M , n } ,且 n ≤ N , M ≤ N , n , M , N ∈ N * .
❺
X 0 1 … m
P …
若随机变量X的分布列具有上表的形式,则称X服从超几何分布
超几何分布列的数学期望与方差
若X~H(n,M,N),则E(X)= . D(X)=
【例1】(23-24高三上·北京西城·期末)生活中人们喜爱用跑步软件记录分享自己的运动轨迹.为了解某地
中学生和大学生对跑步软件的使用情况,从该地随机抽取了200名中学生和80名大学生,统计他们最喜
爱使用的一款跑步软件,结果如下:
跑步软件一 跑步软件二 跑步软件三 跑步软件四
中学 6
80 40 20
生 0
大学 2
30 20 10
生 0
假设大学生和中学生对跑步软件的喜爱互不影响.
(1)从该地区的中学生和大学生中各随机抽取1人,用频率估计概率,试估计这2人都最喜爱使用跑步软件
一的概率;
(2)采用分层抽样的方式先从样本中的大学生中随机抽取 人,再从这 人中随机抽取 人.记 为这 人中
最喜爱使用跑步软件二的人数,求 的分布列和数学期望;
(3)记样本中的中学生最喜爱使用这四款跑步软件的频率依次为 , , , ,其方差为 ;样本中的
大学生最喜爱使用这四款跑步软件的频率依次为 , , , ,其方差为 ; , , , ,
, , , 的方差为 .写出 , , 的大小关系.(结论不要求证明)
【答案】(1)
(2)分布列详见解析,
(3)【详解】(1)从该地区的中学生和大学生中各随机抽取1人,
这 人都最喜爱使用跑步软件一的概率为 .
(2)因为抽取的 人中最喜爱跑步软件二的人数为 ,
所以 的所有可能取值为 ,
,
所以 的分布列为:
所以 .
(3) ,证明如下:
,
,
所以 .
,
,
所以 .
数据: , , , , , , , ,
对应的平均数为
所以
所以 .
【例2】(2024·云南昆明·模拟预测)某校举行知识竞赛,最后一个名额要在A,B两名同学中产生,测试
方案如下:A,B两名学生各自从给定的4个问题中随机抽取3个问题作答,在这4个问题中,已知A能正确作答其中的3个,B能正确作答每个问题的概率都是 ,A,B两名同学作答问题相互独立.
(1)求A,B两名同学恰好共答对2个问题的概率;
(2)若让你投票决定参赛选手,你会选择哪名学生,简要说明理由.
【答案】(1)
(2)应该选择学生 ,理由见解析
【详解】(1)设 同学答对的题数为 ,则随机变量 的所有可能取值为 , .
则 , ;
设 同学答对的题数为 ,则随机变量 的所有可能取值为 , , , .
, ,
, .
所以 , 两名同学恰好共答对 个问题的概率为 .
(2)由(1)知, , ;
而 ,
.
因为 , < .所以应该选择学生 .
【例3】(2023·江西鹰潭·模拟预测)设随机变量 ( 且 ),当
最大时, .
【答案】2
【详解】由随机变量 ,则 ,
因为 最大,所以有 ,
即整理得 ,
又 ,所以 ,则 ,
故答案为:2
【变式1】(2024·陕西西安·三模)每个国家对退休年龄都有不一样的规定,2018年开始,我国关于延迟
退休的话题一直在网上热议,为了了解市民对“延迟退休”的态度,现从某地市民中随机选取100人进行调
查,调查情况如下表:
年龄段(单位:岁)
被调查的人数 10 15 20 25 5
赞成的人数 6 12 20 12 2
(1)从赞成“延迟退休”的人中任选1人,此年龄在 的概率为 ,求出表格中 , 的值;
(2)若从年龄在 的参与调查的市民中按照是否赞成“延迟退休”进行分层抽样,从中抽取10人参与某
项调查,然后再从这10人中随机抽取4人参加座谈会,记这4人中赞成“延迟退休”的人数为 ,求 的
分布列及数学期望.
【答案】(1) ,
(2)分布列见解析;期望为
【详解】(1)因为总共抽取100人进行调查,所以 ,
因为从赞成“延迟退休”的人中任选1人,其年龄在 的概率为 ,所以 .
(2)从年龄在 中按分层抽样抽取10人,赞成的抽取 人,不赞成的抽取2人,再从这10
人中随机抽取4人,则随机变量 的可能取值为2,3,4.
则 ,
,.
所以 的分布列为
2 3 4
所以 .
【变式2】(2024·新疆·二模)水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从
采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:
标准
等级 优质果 精品果 礼品果
果
个数 个 10 25 40 25
(1)若将频率视为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;
(2)用分层抽样的方法从这100个水果中抽取20个,再从抽取的20个水果中随机地抽取2个,用 表示抽
取的是精品果的数量,求 的分布列及数学期望 .
【答案】(1)
(2)分布列见解析,0.8
【详解】(1)设“从100个水果中随机抽取一个,抽到礼品果”为事件 ,则 ,
现有放回地随机抽取4个,设抽到礼品果的个数为 ,则 ,
故恰好抽到2个礼品果的概率为 ;
(2)用分层抽样的方法从100个水果中抽取20个,则其中精品果8个,非精品果12个,
现从中抽取2个,则精品果的数量 服从超几何分布, 所有可能的取值为 ,
则 ,
所以 的分布列为:
0 1 2
故 的数学期望 .【变式3】(2024·北京怀柔·模拟预测)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽
取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将
样本数据分成 , , , , , , , , 九组,绘制成如
图所示的频率分布直方图.
(1)求a的值;
(2)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在 , ,
三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动
时间在 内的学生人数为X,求X的分布列和期望;
(3)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“ ”表示这20名学
生中恰有k名学生参加公益劳动时间在 (单位:小时)内的概率,其中 ,1,2, ,20.当
最大时,写出k的值.(只需写出结论).
【答案】(1)
(2)分布列见解析,期望为
(3)
【详解】(1)由频率分布直方图得:
,
解得 ;
(2)由频率分布直方图得:
这500名学生中参加公益劳动时间在 , , 三组内的学生人数分别为:
人, 人, 人,
若采用分层抽样的方法抽取了10人,
则从参加公益劳动时间在 内的学生中抽取: 人,
现从这10人中随机抽取3人,则 的可能取值为0,1,2,3,
, ,, ,
的分布列为:
0 1 2 3
则其期望为 ;
(3)由(1)可知参加公益劳动时间在 的概率 ,
所以 ,
依题意 ,即 ,
即 ,解得 ,
因为 为非负整数,所以 ,
即当 最大时, .
【题型六】 正态分布
正态分布的定义
对任意的x∈R,f(x)>0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)
为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量X的概率分布密度函数
2
为f(x),则称随机变量X服从正态分布(normal dis-tribution),记为X~N(u,σ ).特别地,当u=0, σ=1时,称随机变量
X服从标准正态分布.
正态分布的期望和方差
参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的
离散程度。
正态分布的3σ原则【例1】(2024·山西·二模)某高校对参加军训的4000名学生进行射击、体能、伤病自救等项目的综合测
试,现随机抽取200名军训学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,
如图.
(1)根据频率分布直方图,求出 的值并估计这200名学生测试成绩的平均数(单位:分).
(2)现该高校为了激励学生,举行了一场军训比赛,共有三个比赛项目,依次为“10千米拉练”“实弹射
击”“伤病救援”,规则如下:三个环节均参与,三个项目通过各奖励200元、300元、500元,不通过则不
奖励.学生甲在每个环节中通过的概率依次为 , , ,假设学生甲在各环节中是否通过是相互独立的.
记学生甲在这次比赛中累计所获奖励的金额为随机变量 ,求 的分布列和数学期望 .
(3)若该高校军训学生的综合成绩 近似服从正态分布 ,其中 近似为样本平均数,规定军训成
绩不低于98分的为“优秀标兵”,据此估计该高校军训学生中优秀标兵的人数(结果取整数).
参考数据:若 ,则 , ,
.
【答案】(1) ,
(2)分布列见解析,
(3) 人
【详解】(1)有图可得 ,解得 ,
;
(2) 的可能取值为 、 、 、 、 、 、 ,,
,
,
,
,
,
,
则其分布列为:
;
(3) , ,则 ,
又 ,故 ,
,故可估计该高校军训学生中优秀标兵的人数为 人.
【例2】(2024·四川·模拟预测)新高考改革后部分省份采用“ ”高考模式,“3”指的是语文、数学、外
语三门为必选科目,“1”指的是要在物理、历史里选一门,“2”指考生要在生物、化学、思想政治、地理4门中
选择2门.
(1)若按照“ ”模式选科,求甲、乙两名学生恰有四门学科相同的选法种数;
(2)某教育部门为了调查学生语数外三科成绩,从当地不同的学校中抽取高一学生4000名参加语数外的网
络测试(满分450分),假设该次网络测试成绩服从正态分布 .
①估计4000名学生中成绩介于190分到355分之间的有多少人(结果保留到个位);
②该地某校对外宣传“我校200人参与此次网络测试,有12名同学获得425分以上的高分”,请结合统计学
知识分析上述宣传语是否可信.
附: .
【答案】(1) ;
(2)①3274人;②不可信.【详解】(1)甲、乙两名学生必选语文、数学、外语.
若另一门相同的为物理、历史中的一门,有 种,
在生物、化学、思想政治、地理4门中,甲、乙选择不同的2门,
则有 种,共 种;
若另一门相同的为生物、化学、思想政治、地理4门中的一门,则有 种.
所以甲、乙两个学生恰有四门学科相同的选法总数为 .
(2)①设此次网络测试的成绩记为 ,则 .
由题知 ,
则 ,
所以 .
所以估计4000名学生中成绩介于190分到355分之间的约有3274人.
②不可信.
,
则 ,
4000名学生中成绩大于410分的约有 人,
这说明4000名考生中,只有约5人的成绩高于410分.
所以说“某校200人参与此次网络测试,有12名同学获得425分以上的高分”的宣传语不可信.
【例3】(2024·广东梅州·二模)某中学1500名同学参加一分钟跳绳测试,经统计,成绩X近似服从正态
分布 ,已知成绩大于170次的有300人,则可估计该校一分钟跳绳成绩X在130~150次之间
的人数约为 .
【答案】
【详解】由题意可知, ,
又因为 ,
所以
所以跳绳成绩X在130~150次之间的人数约为 .
故答案为: .
【变式1】(多选)(2024·新疆喀什·二模)下列说法正确的是( )
A.已知随机变量 服从二项分布 ,则B.设随机变量 服从正态分布 ,若 ,则
C.已知一组数据为1,2,3,4,5,6,7,8,9,10,则它的第70百分位数为7
D.若事件 满足 ,则事件 相互独立
【答案】AD
【详解】因为随机变量 服从二项分布 ,则 ,故A正确;
因为随机变量 服从正态分布 ,则对称轴为 , ,故B错
误;
这组数据的第70百分位数为 ,故C错误;
因为 ,所以 ,所以事件 相互独立.
故选:AD.
【变式2】(2024·河北石家庄·二模)某市教育局为了解高三学生的学习情况,组织了一次摸底考试,共
有50000名考生参加这次考试,数学成绩 近似服从正态分布,其正态密度函数为
且 ,则该市这次考试数学成绩超过110分的考生人数约为
( )
A.2000 B.3000 C.4000 D.5000
【答案】D
【详解】由题易知均值 ,
由正态曲线的对称性可知 ,
则该市这次考试数学成绩超过110分的考生人数约为 .
故选:D.
【变式3】(2024·广西贺州·一模)某电器厂购进了两批电子元件,其中第一批电子元件的使用寿命X
(单位:小时)服从正态分布,且使用寿命不少于1200小时的概率为0.1,使用寿命不少于800小时的概
率为0.9.第二批电子元件的使用寿命不少于900小时的概率为0.8,使用寿命不少于1000小时的概率为
0.6且这两批电子元件的使用寿命互不影响.若该厂产出的某电器中同时装有这两批电子元件各一个,则
在1000小时内这两个元件都能正常工作的概率为( )
A. B. C. D.
【答案】B
【详解】依题意, ,则 ,由正态分布的对称性知,使用寿命X的期望 ,则 ,
所以在1000小时内这两个元件都能正常工作的概率为 .
故选:B