文档内容
高中数学选择性必修第三册必备知识手册 2024 一轮复习
【计数原理】
1、一般地,有如下分类加法计数原理:完成一件事有两类不同方案,在第1类方案中有 种不同的方法,
在第2类方案中有 种不同的方法,那么完成这件事共有 种不同的方法。
2、一般地,有如下分步乘法计数原理:完成一件事有两类不同方案,在第1类方案中有 种不同的方法,
在第2类方案中有 种不同的方法,那么完成这件事共有 种不同的方法。
3、一般地,我们有: 元集合A={ , ,…, }的不同子集有 个。
4、一般地,从 个不同元素中取出 ( )个元素,并按照一定的顺序排成一列,叫做从 个不同
元素中取出 个元素的一个排列。
5、我们把从 个不同元素中取出 ( )个元素的所有不同排列的个数,叫做从 个不同元素中取
出 个元素的排列数,用符号 表示。
6、排列数公式: ,其中 , *,并且 。特别地,我们把
个不同元素全部取出的一个排列,叫做 个元素的一个全排列。这时排列数公式中 ,即有
。也就是说,将 个不同的元素全部取出的排列数,等于正整数1到
的连乘积。正整数1到 的连乘积,叫做 的阶乘,用 表示。于是, 个元素的全排列数公式可以写成
。另外,我们规定, 。
7、排列数公式还可以写成 ,它还有另一个变形 。
8、一般地,从 个不同元素中取出 ( )个元素作为一组,叫做从 个不同元素中取出 个元素
的一个组合。
9、从 个不同元素中取出 ( )个元素的所有不同组合的个数,叫做从 个不同元素中取出 个
1
学科网(北京)股份有限公司元素的组合数,用符号 表示。
10、根据分步乘法计数原理,有
。
因此,组合数公式: ,这里 , *,并且 。
11、因为 ,所以上面的组合数公式可以写成 。另外,我们规定 。
12、常见排列组合变形公式:
(1) ; (2) ;
(3) (4) 。
13、二项式定理: , *。右边的多项式叫做
的二项展开式,其中各项的系数 ( =0,1,2,…, )叫做二项式系数。式中的
叫做二项展开式的通项,用 表示,即通项为展开式的第 项: 。
14、二项式系数有以下性质:
(1)对称性:与首末两端“等距离”的两个二项式系数相等;这一性质可以直接由 得到。
直线 将函数 的图象分成对称的两部分,它是图象的对称轴。
(2)增减性与最大值:因为 ,即 ,
2
学科网(北京)股份有限公司所以当 >1时,即 时, 随 的增加而增大;由对称性知,当 时, 随 的
增加而减小。当 是偶数时,中间的一项 取得最大值;当 是奇数时,中间的两项 与 相等,
且同时取得最大值。
(3)各二项式系数的和:若令二项式的 , ,得 。这就是说,
的展开式的各二项式系数的和等于 。
(4)奇数项和偶数项:奇数项的二项式系数的和等于偶数项的二项式系数的和。
15、杨辉三角的特征:三角形的两个腰都是由数字1组成的,其余的数都等于它肩上的两个数相加。杨辉
三角的第 行的第 个数可以表示为 ,第 行就是 的展开式的二项式系数。把上述特征用公
式表示,有 。
【随机变量及其分布】
1、一般地,设A,B为两个随机事件,且P(A)>0,我们称
为在事件A发生的条件下,事件B发生的条件概率,简称条件概率。
2、一般地,P(B|A)与P(B)不一定相等。如果P(B|A)与P(B)相等,那么事件A与B应满足相互
独立。
3、由条件概率的定义,对任意两个事件A与B,若P(A)>0,则P(AB)=P(A)P(B|A)。我们称
它为概率的乘法公式。
4、求条件概率由两种方法:一种是基于样本空间 ,先计算P(A)和P(AB),再利用条件概率公式求
P(B|A);另一种是根据条件概率的直观意义,增加了“A发生”的条件后,样本空间缩小为A,求P
3
学科网(北京)股份有限公司(B|A)就是以A为样本空间计算AB的概率。
5、条件概率只是缩小了样本空间,因此条件概率同样具有概率的性质。如果P(A)>0,则
(1) ;
(2)如果B和C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A);
(3)设 和B互为对立事件,则 。
6、一般地,设 , ,…, 是一组两两互斥的事件, ,且 , 1,
2,…, ,则对任意的事件 ,有 。我们把它称为全概率公式。
7、贝叶斯公式:设 , ,…, 是一组两两互斥的事件, ,且 ,
1,2,…, ,则对任意的事件 ,P(B)>0,有
, 1,2,…, 。
8、一般地,对于随机试验样本空间 中的每个样本点 ,都有唯一的实数 与之对应,我们称X为
随机变量。其中,可以取值为有限个或可以一一列举的随机变量,我们称为离散型随机变量。通常用大写
英文字母表示随机变量,例如X,Y,Z;用小写英文字母表示随机变量的取值,例如 , , 。
9、一般地,设离散型随机变量X的可能取值为 , ,…, ,我们称X取每一个值 的概率
, 1,2,…,
为X的概率分布列,简称分布列。
10、根据概率的性质,离散型随机变量分布列具有下述两个性质:
(1) , 1,2,…, ;
(2) 。
4
学科网(北京)股份有限公司11、对于只有两个可能结果的随机试验,用A表示“成功”, 表示“失败”,定义 ,
如果 ,则 ,那么X的分布列如表:
X 0 1
P
我们称X服从两点分布或0-1分布。
12、一般地,若离散型随机变量X的分布列如表,
X …
P …
则称
为随机变量X的均值或数学期望,数学期望简称期望。均值是随机变量可能取值关于取值概率的加权平均
数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平。
13、一般地,如果随机变量X服从两点分布,那么
。
14、如果X是一个离散型随机变量,将X进行平移或伸缩后,均值有如下变化:
,
,
。
15、设离散型随机变量X的分布列如表:
X …
P …
我们称
5
学科网(北京)股份有限公司为随机变量X的方差,有时也记为 ,并称 为随机变量X的标准差,记为 。
16、随机变量的方差和标准差都可以度量随机变量取值与其均值的偏离程度,反映了随机变量取值的离散
程度。方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散。
17、离散型随机变量X加上一个常数 ,仅仅使X的值产生一个平移,不改变X与其均值的离散程度,方
差保持不变,即 。而离散型随机变量X乘以一个常数 ,其方差变为原方差的 倍,
即 。一般地,可以证明 成立。
18、我们把只包含两个可能结果的试验叫做伯努利试验。我们将一个伯努利试验独立地重复进行 次所组
成的随机试验称为n重伯努利试验。显然, 重伯努利试验具有如下共同特征:
(1)同一个伯努利试验重复做 次,“重复”意味着各次试验成功的概率相同;
(2)各次试验的结果相互独立。
19、一般地,在 重伯努利试验中,设每次试验中事件A发生的概率为(0< <1),用X表示事件A
发生的次数,则X的分布列为 , 0,1,2,…, 。如果随机变量X的分
布列具有上式的形式,则称随机变量X服从二项分布,记作 ( , )。
11、由二项式定理,容易得到
。
12、一般地,确定一个二项分布模型的步骤如下:
(1)明确伯努利试验及事件A的意义,确定事件A发生的概率 ;
(2)确定重复试验的次数 ,并判断各次试验的独立性;
(3)设X为 次独立重复试验中事件A发生的次数,则 ( , )。
13、一般地,可以证明:如果 ( , ),那么 , 。
14、一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取 件(不放回),用X
表示抽取的 件产品中的次品数,则X的分布列为
, , , ,…, 。
6
学科网(北京)股份有限公司其中 ,N,M *,M≤N, ≤N, , 。如果随机变量X
的分布列具有上式的形式,那么称随机变量X服从超几何分布。
15、设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取
件产品中的次品数。令 ,则 是N件产品的次品率,而 是抽取的 件产品的次品率,可以得
到 ,即 。
16、除了离散型随机变量,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至
整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量。
17、我们称 ( ,其中 , 为参数)为正态密度函数,称它的图象
为正态密度曲线,简称正态曲线。显然对于任意的 , ,它的图象在 轴的上方。 轴和曲
线之间的区域的面积为1。
18、若随机变量X的概率分布密度函数为 ,则称随机变量X服从正态分布,记为 ( ,
)。特别地,当 , 时,称随机变量X服从标准正态分布。
19、正态曲线的特点:
(1)曲线是单峰的,它关于直线 对称;
(2)曲线在 处达到峰值 ;
(3)当 无限增大时,曲线无限接近 轴。
20、函数 的图像可由 的图像平移得到。在参数 取固定值时,正态曲线的位置由
7
学科网(北京)股份有限公司确定,且随着 的变化而沿 轴平移。当 取定值时,因为曲线的峰值 与 成反比,而且对任
意的 >0,曲线与 轴围成的面积总为1。因此,当 较小时,峰值高,曲线“瘦高”,表示随机变量X
的分布比较集中;当 较大时,峰值低,曲线“矮胖”,表示随机变量X的分布比较分散。
21、若 ( , ),则有 , 。
22、假设 ( , ),可以证明:对于给定的 *,P( )是一个只与
有关的定值。特别地,
P( )≈0.6827,
P( )≈0.9545,
P( )≈0.9973。
由此看到,尽管正态变量的取值范围是( , ),但在一次试验中,X的取值几乎总是落在区
间[ , ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发
生。在实际应用中,通常认为服从于正态分布( , )的随机变量X只取[ , ]中的值,
这在统计学中称为3σ原则。
8
学科网(北京)股份有限公司【成对数据的统计分析】
1、两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关
系。如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个
变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关。
2、一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变
量线性相关。
3、一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相
关。
4、我们称
为变量 和变量 的样本相关系数。它是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小
可以反映成对样本数据的变化特征:
当 >0时,称成对样本数据正相关。这时,当其中一个数据的值变小时,另一个数的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大。
当 <0时,称成对样本数据负相关。这时,当其中一个数据的值变小时,另一个数的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小。
5、样本相关系数 的大小取值范围: 。它的绝对值大小可以反映成对样本数据之间线性相关的
程度。当 越接近1时,成对样本数据的线性相关程度越强;当 越接近0时,成对样本数据的线性相
9
学科网(北京)股份有限公司关程度越弱。
6、我们称 为Y关于 的一元线性回归模型,其中,Y称为因变量或响应变量, 称
为自变量或解释变量; 和 为模型的未知参数, 称为截距参数, 称为斜率参数; 是Y与 之
间的随机误差。模型中的Y也是随机变量,其值虽然不能由变量 的值确定,但是却能表示为 与
的和(叠加),前一部分由 所确定,后一部分是随机的。
7、我们将 称为Y关于 的经验回归方程,也称为经验回归函数或经验回归公式,其图形称为
经验回归直线。这种求经验回归方程的方法叫做最小二乘法(这里的“二乘”是平方的意思),求得的 ,
叫做 , 的最小二乘估计。公式写为:
。
8、对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的 称为预测值,观测值
减去预测值称为残差。
9、我们可以用决定系数R2来比较两个模型的拟合效果,R2的计算公式为
,
在R2表达式中, 与经验回归方程无关,残差平方和 与经验回归方程有关。
因此R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟
10
学科网(北京)股份有限公司合效果越差。
10、我们可以用概率语言,将零假设改述为
H:分类变量X和Y独立。
0
在假定H 的条件下,对于有放回简单随机抽样,当样本容量 充分大时,统计学家得到了 的近似
0
分布,忽略 的实际分布与近似分布的误差后,对于任何小概率值 ,可以找到相应的正实数 ,使得
下面关系成立: ,我们称 为 的临界值,这个临界值就可以作为判断 大小的标准。
概率值 越小,临界值 越大。当总体很大时,抽样有、无放回对 的分布影响较小。
11、由 可知,只要把概率值 取得充分小,在假设H 成立的情况下,事件 是
0
不大可能发生的。根据这个规律,如果该事件发生,我们就可以推断H 不成立。不过这个推断有可能犯错
0
误,但犯错误的概率不会超过 。
12、基于小概率值 的检验规则是:
当 时,我们就推断H 不成立,即认为X和Y不独立,该推断犯错误的概率不超过 ;
0
当 时,我们没有充分证据推断H 不成立,可以认为X和Y独立。
0
这种利用 的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检
验”,简称独立性检验。
13、 独立性检验中几个常见的小概率值和相应的临界值
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
例如,对于小概率值 =0.05,我们有如下的具体检验规则:
(1)当 时,我们推断H 不成立,即认为X和Y不独立,该推断犯错误的概率不超过
0
0.05;
11
学科网(北京)股份有限公司(2)当 时,我们没有充分证据推断H 不成立,可以认为X和Y独立。
0
14、应用独立性检验解决实际问题包括以下环节:
(1)提出零假设H:X和Y相互独立,并给出在问题中的解释;
0
(2)根据抽样数据整理出2×2列联表,计算 的值,并与临界值 比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律。
15、独立性检验与反证法的相同与不同
反证法是在某种假设H 之下,推出一个矛盾结论,从而证明H 不成立;而独立性检验是在零假设H
0 0 0
之下,如果出现一个与H 相矛盾的小概率事件,就推断H 不成立,且该推断犯错误的概率不大于这个小
0 0
概率。另外,在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误。独立性
检验的本质是比较观测值和期望值之间的差异,由 所代表的这种差异的大小是通过确定适当的小概率
值进行判断的。
16、 的计算公式: 。
12
学科网(北京)股份有限公司