文档内容
(9)计数原理与概率统计
——2025 高考数学一轮复习易混易错专项复习
【易混点梳理】
1.
名称 定义 符号表示
若事件A发生,则事件B一定发生,这时称
包含关系 (或 )
事件B包含事件A(或事件A包含于事件B)
如果事件 B包含事件 A,事件 A也包含事件
相等关系 B,即 且 ,则称事件 A 与事件 B A=B
相等
事件A与事件B至少有一个发生,这样的一
并事件
个事件中的样本点或者在事件 A中,或者在
(或 )
(和事
事件 B中,则称这个事件为事件 A与事件 B
件)
的并事件(或和事件)
事件A与事件B同时发生,这样的一个事件
交事件
中的样本点既在事件A中,也在事件B中,
(或 )
(积事
则称这样的一个事件为事件 A与事件B的交
件)
事件(或积事件)
若 为不可能事件,那么称事件A与事件
互斥事件
B互斥
且
若 为不可能事件, 为必然事件,
对立事件 (U为全
那么称事件A与事件B互为对立事件
集)
2.古典概率模型:我们将具有以下两个特征的试验称为古典概型试验,其数学模型称为古典
概率模型,简称古典概率:
(1)有限性:样本空间的样本点只有有限个;
(2)等可能性:每个样本点发生的可能性相等.
3.古典概型的概率公式
(1)在基本事件总数为n的古典概型中,每个基本事件发生的概率都是相等的,即每个基本
事件发生的概率都是 .(2)对于古典概型,任何事件的概率为 .
4.离散型随机变量的分布列
(1)如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,按一定次
序一一列出,这样的随机变量叫做离散型随机变量.
(2)一般地,若离散型随机变量X可能取的不同值为 取每一个值
的概率 ,则下表称为随机变量X的概率分布列,简称为X的分布
列.
X … …
P … …
5.离散型随机变量的分布列的性质
根据概率的性质,离散型随机变量的分布列具有如下性质:
(1) ;
(2) ;
(3) .
6.常见的离散型随机变量的概率分布模型
(1)两点分布
若随机变量X的分布列为
X 0 1
P p
则称X服从两点分布.
(2)超几何分布
一般地,在含有M件次品的N件产品中任取n件,其中恰有X件次品,则,其中 ,且 ,称分布列
X 0 1 … m
P …
为超几何分布.
7.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X … …
P … …
(1)均值
称 为随机变量X的均值或数学期望,它反映了离散型随
机变量取值的平均水平.
(2)方差
称 为随机变量X的方差,它刻画了随机变量X与其均值 的平均
偏离程度,并称 为随机变量X的标准差,记为 .
8.均值与方差的性质
(1) .
(2) .
9.两点分布的均值、方差
若X服从两点分布,则 .
10.条件概率及其性质
(1)一般地,设A,B为两个事件,且 ,称 为在事件A发生的条件
下,事件B发生的概率.(2)条件概率的性质:
(i) ;
(ii)如果B和C是两个互斥事件,则 .
11.全概率公式
一般地,设 是一组两两互斥的事件, ,且
,则对任意的事件 ,有 ,称此公式为全概
率公式.
12.相互独立事件
(1)对于事件A、B,若A的发生与B的发生互不影响,则称A、B是相互独立事件.
(2)若A与B相互独立,则 , .
(3)若A与B相互独立,则A与 , 与B, 与 也都相互独立.
(4)若 ,则A与B相互独立.
13.独立重复试验与二项分布
独立重复试验 二项分布
一般地,在n次独立重复试验(n重伯
一般地,在相同条件下重复做的 努利试验)中,设事件A发生的次数
定
n 次试验称为 n 次独立重复试验 为X,在每次试验中事件A发生的概
义
(也叫n重伯努利试验) 率为p,此时称随机变量X服从二项
分布,记作
计 用 表示第i次试验 在n次独立重复试验中,事件A恰好
算 发生k次的概率为
结果,则
公
式
14.二项分布的均值与方差:若 ,则 , .
15.正态曲线的定义函数 (其中实数 和 为参数)的图象为正态分布
密度曲线,简称正态曲线.
16.正态曲线的特点
(1)曲线位于x轴上方且与x轴不相交;
(2)曲线是单峰的,它关于直线 对称;
(3)曲线在 处达到峰值 ;
(4)曲线与x轴之间的面积为1;
(5)当 一定时,曲线随着 的变化而沿x轴移动;
(6)当 一定时,曲线的形状由 确定, 越小,曲线越“瘦高”; 越大,曲线越“矮
胖”.
17.正态分布的定义及表示
如果对于任何实数 ,随机变量X满足 ,则称X的分布为正
态分布,记作 .
18.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(
)个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样
方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
19.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独
立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比.
20.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值
叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的
高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小
长方形的面积 .
各个小长方形面积的总和等于1.
21.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线
图.
(2)总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减
小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密
度曲线.
22.用样本的数字特征估计总体的数字特征
数字特征 样本数据 频率分布直方图
取最高的小长方形底边中点的横坐
众数 出现次数最多的数据
标
将数据按大小依次排列,处
把频率分布直方图划分为左右两个
在最中间位置的一个数据
中位数 面积相等的部分,分界线与x轴交
(或最中间两个数据的平均
点的横坐标
数)
每个小长方形的面积乘小长方形底
平均数 样本数据的算术平均数
边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.方差: ;
标准差: .
23.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为 .可以发现,
区间 内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数
的平均数 ,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据
小于或等于这个值,且至少有 的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数
把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第
一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
24.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不
同,相关关系是一种非确定性关系.
(2)在散点图中,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相
关,点散布在从左上角到右下角的区域内,两个变量的相关关系称为负相关.
25.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称
两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程①最小二乘法:通过求 的最小值而得到回归直线的方法,即使得样本数据
的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
②回归方程:方程 是两个具有线性相关关系的变量的一组数据
的回归方程,其中 是待定参数.
,其中 称为样本点的
中心.
(3)相关系数r
① ;
②当 时,表明两个变量正相关;当 时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变
量之间几乎不存在线性相关关系.当r的绝对值大于或等于0.75时,认为两个变量有很强的线
性相关关系.
(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在线性回归模型
中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y
的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.
26.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
27.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可
能取值分别为 和 ,其样本频数列联表(称为2×2列联表)为:
总计
a bc d
总计
可构造一个随机变量 ,其中 为样本容量.
28.独立性检验
利用独立性假设、随机变量 来确定是否有一定把握认为“两个分类变量有关系”的方法称
为两个分类变量的独立性检验.
两个分类变量X和Y是否有关系的判断标准:
统计学研究表明:当 时,认为X与Y无关;
当 时,有95%的把握说X与Y有关;
当 时,有99%的把握说X与Y有关;
当 时,有99.9%的把握说X与Y有关.
29.排列与排列数
(1)排列:从n个不同元素中取出 个元素,按照一定的顺序排成一列,叫做从n个
不同元素中取出m个元素的一个排列.
(2)排列数:从n个不同元素中取出 个元素的所有不同排列的个数,叫做从n个不
同元素中取出m个元素的排列数,记作 .
30.组合与组合数
(1)组合:从n个不同元素中取出 个元素组成一组,叫做从n个不同元素中取出m
个元素的一个组合.
(2)组合数:从n个不同元素中取出 个元素的所有不同组合的个数,叫做从n个不
同元素中取出m个元素的组合数,记作 .31.二项式定理
公式 叫做二项式定理.公式中右边的
多项式叫做 的二项展开式,其中各项的系数 叫做二项式系数,式中的
叫做二项展开式的通项,用 表示,即通项为展开式的第 项.
32.二项式系数的性质
(1)对称性:与首末两端“等距离”的两个二项式系数相等,即 .
(2)增减性与最大值:对于二项式系数 ,当 时,二项式系数是递
增的;当 时,二项式系数是递减的.当n是偶数时,二项展开式的中间一项(第
项)的二项式系数最大,即最大的二项式系数为 .当n是奇数时,二项展开式的中间两项
(第 项和第 项)的二项式系数相等且最大,即最大的二项式系数为 和 .
(3)二项式系数的和: 的展开式的各个二项式系数的和等于 ,即
.二项展开式中,偶数项的二项式系数的和等于奇数项的二
项式系数的和,即 .
【易错题练习】
1.从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )A. B. C. D.
2.已知 的展开式中常数项为 240,则 的展开式中 的系数为
( )
A.10 B.-8 C.-6 D.4
3.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调
查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为
B.该地农户家庭年收入不低于10.5万元的农户比率估计为
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
4.某班50名同学参加体能测试,经统计成绩c近似服从 ,若 ,
则可估计该班体能测试成绩低于85分的人数为( )
A.5 B.10 C.15 D.30
5.某中学教师节活动分上午和下午两场,且上午和下午的活动均为A,B,C,D,E这5个项
目.现安排甲、乙、丙、丁四位教师参加教师节活动,每位教师上午、下午各参加一个项目,
每场活动中的每个项目只能有一位老师参加,且每位教师上午和下午参加的项目不同.已知丁
必须参加上午的项目E,甲、乙、丙不能参加上午的项目A和下午的项目E,其余项目上午和下午都需要有人参加,则不同的安排方法种数为( )
A.20 B.40 C.66 D.80
6.(多选)我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天
的复工、复产指数折线图.
根据该折线图,( )
A.这11天复工指数和复产指数均逐日增加
B.在这11天期间,复产指数的增量大于复工指数的增量
C.第3天至第11天,复工指数和复产指数都超过
D.第9天至第11天,复产指数的增量大于复工指数的增量
7.(多选)甲箱中有3个红球和2个白球,乙箱中有2个红球和2个白球(两箱中的球除颜色
外没有其他区别),先从甲箱中随机取出一球放入乙箱,分别用事件 和 表示从甲箱中取
出的球是红球和白球;再从乙箱中随机取出两球,用事件B表示从乙箱中取出的两球都是红
球,则( )
3 9 11
PA P B A PB
A. 1 5 B. 1 50 C. 50 D.
8.某银行规定,一张银行卡若在一天内出现 3次密码尝试错误,该银行卡将被锁定,小王到
银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的
6个密码之一,小王决定从中不重复地随机选择 1个进行尝试.若密码正确,则结束尝试;否
则继续尝试,直至该银行卡被锁定.则小王至少尝试两次才能成功的概率是__________.
9.从一批含有13件正品,2件次品的产品中不放回地抽 3次,每次抽取1件,设抽取的次品数为 ,则 __________.
10.中国跳水队有“跳水梦之队”的称号,在国际赛场上有绝对的优势,同时跳水运动也得到
了广泛推广,获得了越来越多人的喜爱.现有A,B,C,…,J共10位跳水运动爱好者自发组
建了跳水训练营,并邀请教练甲帮助训练.教练训练前对10位跳水员进行测试打分,得分情
况如图中虚线所示;集训后再进行测试打分,10位跳水员得分情况如图中实线所示.规定满分
为10分,记得分在8分以上的为“优秀”.
“优秀”人数 “非优秀”人数 合计
训练前
训练后
合计
(1)将上面的列联表补充完整,并根据小概率值 的独立性检验,判断跳水员的优秀
情况与训练是否有关,并说明原因.
(2)从这10人中任选3人,在这3人中恰有2人训练后为“优秀”的条件下,求这3人中恰
有1人训练前也为“优秀”的概率.
(3)跳水员A将对“ , 和 ”这三种高度的跳水运动进行集训,且在训练中进
行了多轮测试.规定:在每轮测试中,都会有这3种高度,且至少有2个高度的跳水测试达到
“优秀”,则该轮测试才记为“优秀”.每轮测试中,跳水员A在每个高度中达到“优秀”的
概率均为 ,每个高度的跳水运动是否达到“优秀”互不影响且每轮测试互不影响.如果跳水员A在集训测试中想获得“优秀”的轮数平均值为3,那么理论上至少要进行多少轮测试?
附: ,其中 .
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828答案以及解析
1.答案:D
解析:从 2 至 8 的 7 个整数中随机取 2 个不同的数,取法有 , , , ,
, , , , , , , , , , , ,
, , , , ,共 21种,其中这 2个数互质的情况有 , ,
, , , , , , , , , , , ,
共14种.所以这2个数互质的概率 .故选D.
2.答案:C
解析:因为 的展开式的通项为 ,令 ,得
,所以 的展开 式中常数项为 ,又 ,解得 ,所以
的展开式中含 的项为 ,故所求系数为-6.
3.答案:C
解析:由频率分布直方图知年收入低于 4.5万元的农户比率估计为 ,
故A正确;年收入不低于10.5万元的农户比率估计为 ,故B正
确 ; 该 地 农 户 家 庭 年 收 入 的 平 均 值 约 为
,故C错误;年收入介于4.5万元至8.5万元之间的农户比率约为 ,故D正确.故选C.
4.答案:B
解析:由c近似服从 ,可知正态分布曲线的对称轴为 ,
则 ,
所以 ,
则可估计该班体能测试成绩低于85分的人数为 人,
故选:B.
5.答案:C
解析:因为丁必须参加上午的项目 E,甲、乙、丙不能参加上午的项目 A,所以上午甲、乙、
丙参加B,C,D这3个项目,共有 种不同的安排方法.
易知甲、乙、丙、丁四人下午参加的项目为A,B,C,D,
分2类:①丁参加项目A,共有2种不同的安排方法;
②丁参加B,C,D这3个项目中的1个,从甲、乙、丙中选1人参加项目A,剩下两人参加
剩下的2个项目,共有 种不同安排方法.
综上,共有 种不同的安排方法.故选C.
6.答案:CD
解析:由题图可知第8,9天复工指数和复产指数均减小,故A错误;第1天时复工指数小于
复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B错误;由题
图可知第3天至第11天,复工复产指数都超过 ,故C正确;第9天至第11天,复产指
数的增量大于复工指数的增量,故D正确.
7.答案:ACD解析:依题意可得 , , , ,所以
,故A正确、B错误、C正确;
,故D正确.
8.答案:
解析:由题意得,小王尝试三次才成功的概率为 ,小王尝试三次也没成功的概率
为 ,所以小王至少尝试两次才能成功的概率为 .
9.答案:4
解析:解法一:依题意知 服从参数为15,2,3的超几何分布,所以 ,所
以 .
解 法 二 : 依 题 意 得 , 的 可 能 取 值 为 0 , 1 , 2 , 则 ,
, ,
所以 ,所以 .
10.答案:(1)列联表见解析,跳水员的优秀情况与训练有关,此推断犯错误的概率不超过
0.01
(2)
(3)至少要进行12轮测试
解析:(1)零假设 :跳水员的优秀情况与训练无关.
列联表为
“优秀”人数 非“优秀”人数 合计
训练前 2 8 10
训练后 8 2 10
合计 10 10 20
.
故根据小概率值 的独立性检验,零假设不成立,即跳水员的优秀情况与训练有关,
此推断犯错误的概率不超过0.01.
(2)由题图可知训练前后均不“优秀”的有 C,F共2人,训练前后均“优秀”的有 D,G
共2人,训练前不“优秀”而训练后“优秀”的有6人.
设 “所选3人中恰有2人训练后为‘优秀’”, “所选3人中恰有1人训练前为‘优
秀’”,
则 , ,
所以 .
(3)设跳水员A每轮测试为“优秀”的概率为p,则 .
设测试轮数为n,则“优秀”的轮数 .
所以 ,即 ,
故至少要进行12轮测试.