文档内容
热点 8-2 概率与统计综合
概率统计专题相关的知识点错综复杂又环环相扣,在高考考查中一般情况会对多个知识点进行综合考查。
题量通常为“两小一大”,有时也“三小一大”或“一小一大”;选择题、填空题考查全面,解答题重点
考查概率统计主干知识,以图表信息、古典概型、常见概率分布,回归分析,独立性检验、样本估计总
体、分布列和数学期望为主要考查内容,关注学科知识的综合性,常与分段函数、二次函数、导数、数
列、最值问题等相结合进行综合考查。
【题型1 古典概型的计算】
满分技巧
古典概型中基本事件的探求方法
1、列举法:适合于基本事件个数较少且易一一列举出来的试验;
2、列表法(坐标法):适合于从多个元素中选定两个元素的试验;
3、树形图法:适合于有顺序的问题及较复杂问题中基本事件个数的探究;
4、排列组合法:求较复杂试验中基本时间的个数时,可利用排列或组合的知识.
【例1】(2024·四川·校联考一模)一次课外活动中,某班60名同学均参加了羽毛球或乒乓球运动,其中
37人参加了羽毛球运动,38人参加了乒乓球运动.若从该班随机抽取一名同学,则该同学既参加了羽毛
球运
动又参加了乒乓球运动的概率为( ).
A. B. C. D.
【答案】A
【解析】依题意,该班学生中既参加了羽毛球运动又参加了乒乓球运动有: (名),
故从该班随机抽取一名同学,该同学既参加了羽毛球运动又参加了乒乓球运动的概率为 ,故选:A.
【变式1-1】(2024·湖南岳阳·高三岳阳一中校考开学考试)四位同学乘同一列火车,火车有10节车厢,
则至少有两位同学上了同一节车厢的概率为( )
A. B. C. D.
【答案】C
【解析】四位同学乘同一列火车,则所有的基本事件有: 个;
设事件 :“至少有两位同学上了同一节车厢”,
则事件 表示:四位同学所在车厢都不相同;
则事件 包括的基本事件个数为: ,
事件 包括的基本事件个数有: ,
故至少有两位同学上了同一节车厢的概率 .故选:C.
【变式1-2】(2024·江苏徐州·高三校考开学考试)今年暑期,《八角笼中》、《长安三万里》、《封神
榜》、《孤注一掷》引爆了电影市场,小明和他的同学一行四人决定去看这四部电影,若小明要看《长安
三万里》,则恰有两人看同一部影片的概率为( )
A. B. C. D.
【答案】B
【解析】分以下两种情况讨论:
(1)小明和其中一人同时看《长安三万里》,另外两人看剩余三部电影中的两部,
此时,所求概率为 ;
(2)观看《长安三万里》只有小明一人,只需将剩余三人分为两组,
再将这两组人分配给两部电影,此时,所求概率为 .
综上所述,恰有两人看同一部影片的概率为 .故选:B .
【变式1-3】(2022·河南·高三专题练习)“天问一号”中的天问是中国行星探测任务的名称,它的名字起
源于屈原的《天问》,想要表达的是中华民族对追求真理的执着,对科技创新的不懈.中国行星探测任务
被命名为“天问系列”是在2020年4月24日,首次火星探测任务的探测器则被命名为“天问一号”.2020年
7月23日,中午12时41分,长征五号遥四运载火箭托举着我国首次火星探测任务“天问一号”探测器,在
中国文昌航天发射场点火升空.若从“天,问,一,号”,这4个字中任取一个字,再从“4,24,7,23”这
4个数字中任取2个数字,组成一个“系列组”,则该“系列组”中包含“天问一号”命名时间“4,24”或发射时
间“7,23”的概率为( )
A. B. C. D.【答案】D
【解析】所有“系列组”的不同情况有:
(天,4,24),(天,4,7),(天,4,23),(天,24,7),(天,24,23),(天,7,23),
(问,4,24),(问,4,7),(问,4,23),(问,24,7),(问,24,23),(问,7,23),
(一,4,24),(一,4,7),(一,4,23),(一,24,7),(一,24,23),(一,7,23),
(号,4,24),(号,4,7),(号,4,23),(号,24,7),(号,24,23),(号,7,23).
共24种不同情况,
其中包含命名时间“4,24”或发射时间“7,23”的不同情况有8种,
故所求概率为: .故选:D.
【变式1-4】(2024·广东·高三统考期末)《易·系辞上》有“河出图,洛出书”之说,河图、洛书是中华文
化,阴阳术数之源,其中河图排列结构是一、六在后,二、七在前,三、八在左,四、九在右,五、十背
中.如图,白点为阳数,黑点为阴数.若从这10个数中任取3个数,已知3个数中至多有1个阴数,则取出
的3个数之和是5的倍数的概率是( )
A. B. C. D.
【答案】A
【解析】如图,白点为阳数,黑点为阴数,阳数为 ,阴数为
若从这10个数中任取3个数且3个数中至多有1个阴数,
基本事件总数为 ,
取出的3个数之和是5的倍数,基本事件包
,
共有12个,
取出的3个数之和是5的倍数的概率是 .故选:A.
【题型2 随机抽样与计算】
满分技巧
1、明确简单随机抽样与分层抽样的定义。
2、分层随机抽样的相关计算关系:
(1) = ;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.(3)样本的平均数和各层的样本平均数的关系为: = + = + .
【例2】(2024·重庆·高三校联考阶段练习)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和
草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一
批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【答案】C
【解析】①乔木、灌木、草木,分类明显,可以采用分层随机抽样;
②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样;故选:C.
【变式2-1】(2024·青海西宁·高三统考期末)用分层抽样的方法从某社区的500名男居民和700名女居民
中选取12人参与社区服务满意度调研,则女居民比男居民多选取( )
A.8人 B.6人 C.4人 D.2人
【答案】D
【解析】由题可知,男居民选取 人,女居民选取 人,
则女居民比男居民多选取2人.故选:D.
【变式2-2】(2024·湖南长沙·长郡中学校考一模)为了了解学生们的身体状况,某学校决定采用分层抽
样的方法,从高一、高二、高三三个年级共抽取100人进行各项指标测试.已知高三年级有500人,高二年
级有700人,高一年级有800人,则高三年级抽取的人数为( )
A.30 B.25 C.20 D.15
【答案】B
【解析】根据分层抽样的性质可知:
高三年级抽取的人数为 .故选:B
【变式2-3】(2023·广西·高三南宁三中校联考阶段练习)北京时间2023年10月31日8时11分,神舟十
六号载人飞船返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有120名同学
的“航天”社团中随机抽取24名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层
随机抽样,则高一年级抽取6人,若按性别比例分层随机抽样,则女生抽取15人,则下列结论错误的是
( )
A.24是样本容量
B.120名社团成员中男生有50人
C.高二与高三年级的社团成员共有90人
D.高一年级的社团成员中女生最多有30人
【答案】B
【解析】对于A,由样本容量定义知:样本容量为 ,A正确;
对于B, 女生共有 人, 男生有 人,B错误;对于C, 高一年级的社团成员有 人,
高二高三年级的社团成员共有 人,C正确;
对于D,由C知:高一年级的社团成员共 人,
高一年级的社团成员中女生最多有 人, 正确.故选:B.
【变式2-4】(2024·陕西·校联考一模)我校高三年级为了学生某项身体指标,利用随机数表对650名学
生进行抽样,先将650进行编号,001,002, ,649,650.从中抽取50个样本,下图提供随机数表的
第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【答案】C
【解析】从表中第5行第6列开始向右读取数据,
前7个数据分别是253,313,457,007,328,623,072.故选:C
【题型3 用样本估计总体】
满分技巧
样本估计总体的常用结论:
1、如果两组数 和 的平均数分别是 和 ,则一组数 的平
均数是 ;
2、如果一组数 的平均数为 ,则一组数 的平均数为 。
3、如果一组数 的平均数为 ,则一组数 的平均数为
4、如果一组数 的方差为 ,则一组数 的方差为 ;
5、如果一组数 的方差为 ,则一组数 的方差为 。
【例3】(2024·江苏苏州·高三统考开学考试)歌唱比赛共有 11位评委分别给出某选手的原始评分,评定
该选手的成绩时,从11个原始评分中去掉1个最高分、1个最低分,得到9个有效评分. 9个有效评分与
11个原始评分相比,一定不变的数字特征是( )
A.平均数 B.极差 C.方差 D.中位数
【答案】D
【解析】设11位评委评分按从小到大排列为 .
则①原始中位数为 ,去掉最低分 ,最高分 ,
后剩余 ,中位数仍为 , D正确.
②原始平均数 ,
后来平均数 ,平均数受极端值影响较大,
与 不一定相同,A不正确;③
,由②易知,C不正确.
④原极差 ,后来极差 ,可能相等可能变小,B不正确.故选:D.
【变式3-1】(2024·安徽合肥·合肥一六八中学校联考模拟预测)已知数据 , ,…,
的平均数和方差分别为4,10,那么数据 , ,…, 的平均数和方差分别为( )
A. , B.1, C. , D. ,
【答案】D
【解析】设数据 , ,…, 的平均数和方差分别为 和 ,
则数据 , ,…, 的平均数为 ,方差为 ,
得 , ,故选:D.
【变式3-2】(2024·湖南长沙·长沙一中校联考模拟预测)现有随机选出的20个数据,统计如下,则
( )
7 24 39 54 61 66 73 82 82 82
87 91 95 8 98 102 102 108 114 120
A.该组数据的众数为102 B.该组数据的极差为112
C.该组数据的中位数为87 D.该组数据的80%分位数为102
【答案】D
【解析】将数据按从小到大的顺序排列:
7,8,24,39,54,61,66,73,82,82,
82,87,91,95,98,102,102,108,114,120,
对于A,出现次数最多的是82,所以众数是82,故A错误;
对于B,极差为 ,故B错误;
对于C, , 第10个数和第11个数的平均数为中位数,即 ,故C错
误;
对于D, , 第16个数和第17个数的平均数为80%分位数,
即 ,故D正确.故选:D.
【变式3-3】(2024·陕西西安·统考一模)某班学生每天完成数学作业所需的时间的频率分布直方图如
图,为响应国家减负政策,若每天作业布置量在此基础上减少5分钟,则减负后完成作业的时间的中位数
为( )A.25 B.30 C.35 D.40
【答案】A
【解析】由频率分布直方图可得: ,解得 ,
因为第一组的频率为 ,第二组的频率为 ,
故中位数在第二组的中间,即中位数为 (分钟),
又因为每天作业布置量在此基础上减少5分钟,
所以减负后完成作业时间的中位数为 (分钟).故选:A
【变式3-4】(2024·四川·高三西充中学校联考期末)下图是2023年11月中国的10个城市地铁运营里程
(单位:公里)及运营线路条数的统计图,下列判断正确的是( )
A.这10个城市中北京的地铁运营里程最长且运营线路条数最多
B.这10个城市地铁运营里程的中位数是516公里
C.这10个城市地铁运营线路条数的平均数为15.4
D.这10城市地铁运营线路条数的极差是12
【答案】C
【解析】对于A,北京的地铁运营线路条数最多,而运营里程最长的是上海,A错误;
于是B,地铁运营里程的中位数是 公里,B错误;
对于C,地铁运营线路条数的平均数为 ,C正确;
对于D,地铁运营线路条数的极差是 ,D错误.故选:C
【题型4 百分位数的计算】
满分技巧
计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百
分位数为第i项与第(i+1)项数据的平均数.
【例4】(2024·广东·高三校联考开学考试)某班12名同学某次测试的数学成绩(单位:分)分别为62,
57,72,85,95,69,74,91,83,65,78,89,则这12名同学这次测试的数学成绩的第60百分位数是
( )
A.74 B.78 C.83 D.91
【答案】C
【解析】将这组数据按从小到大的顺序排列为57,62,65,69,72,74,78,83,85,89,91,95.
因为 ,所以这12名同学这次测试的数学成绩的第60百分位数是83.故选:C.
【变式4-1】(2024·重庆·高三西南大学附中校联考开学考试)一个容量为10的样本,其数据依次为:
9,2,5,10,16,7,18,23,20,3,则该组数据的第75百分位数为( )
A.15 B.16 C.17 D.18
【答案】D
【解析】将这些数从小到大重新排列后为:2,3,5,7,9,10,16,18,20,23,
,则取从小到大排列后的第8个数,
即该组数据的第75百分位数为18.故选:D.
【变式4-2】(2024·广东深圳·高三深圳中学校考开学考试)已知7个数据0,1,5,6,7,11,12,则这
组数据的第 百分位数为( )
A. B. C. D.
【答案】D
【解析】因为 ,所以这组数据的第 百分位数为这组数据从小到大排列的第 个数,即为
,
所以这组数据的第 百分位数为 .故选:D
【变式4-3】(2024·江西南昌·南昌二中校联考模拟预测)从某公司生产的产品中任意抽取12件,得到它
们的质量(单位: )如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,则这组数据
的四分位数不可能是( )
A.8.75 B.8.15 C.9.9 D.8.5
【答案】C
【解析】将这12个数据从小到大排序得:7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
由 ,可知这组数据的第25百分位数为 ,
由 ,可知这组数据的第50百分位数为 ,
由 ,可知这组数据的第75百分位数为 ,
所以这组数据的四分位数不可能是9.9.故选:C【变式4-4】(2024·全国·校联考模拟预测)已知2024个互不相同的实数,记其上四分位数为 ,中位数
为 ,第75分位数为 ,则( )
A. B. C. D.
【答案】C
【解析】根据百分位数的概念可知,将这2024个互不相同的实数从小到大排列后,
其上四分位数即为第75分位数,故 ,
由于这2024个互不相同的实数最中间两数为第1012和第1013个数,
故中位数b为这两个数的平均数,
又第50分位数也为第1012和第1013个数的平均数,
故b即等于第50分位数,而第50分位数小于第75分位数,故 ,故选:C
【题型5 事件关系的判断】
满分技巧
判断互斥、对立事件的两种方法
(1)定义法:判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个
事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)集合法:①由各个事件所含的结果组成的集合彼此的交集为空集,则事件互斥.
②事件A的对立事件所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的补集.
【例5】(2024·全国·模拟预测)同时抛掷两颗骰子,观察向上的点数,记“点数之和为5”是事件 ,“点
数之和为4的倍数”是事件 ,则( )
A. 为不可能事件 B. 与 为互斥事件
C. 为必然事件 D. 与 为对立事件
【答案】B
【解析】同时抛掷两颗骰子,有36个结果,
“点数之和为5”是事件 有 共有4种情况;
“点数之和为4的倍数”是事件 有 共有9种情况;
对于选项A: 表示“点数之和为5或是4的倍数”, 不是不可能事件.故A错误;
对于选项B:A与B不可能同时发生.故B正确;
对于选项C: 表示“点数之和为5且是4的倍数”,是不可能事件,故C错误;
对于选项D: 与 不能包含全部基本事件,故D错误.故选:B.
【变式5-1】(2024·广东·高三学业考试)一个人打靶时连续射击3次,则事件“至少有两次中靶”的对立事
件为( )
A.至多有一次中靶 B.至多有两次中靶 C.恰好有一次中靶 D.三次都中靶
【答案】A
【解析】由题意,事件“至少有两次中靶”的对立事件为“至多有一次中靶”.故选:A.
【变式5-2】(2024·广东湛江·统考一模)在一次考试中有一道4个选项的双选题,其中B和C是正确选项,A和D是错误选项,甲、乙两名同学都完全不会这道题目,只能在4个选项中随机选取两个选项.设
事件 “甲、乙两人所选选项恰有一个相同”,事件 “甲、乙两人所选选项完全不同”,事件
“甲、乙两人所选选项完全相同”,事件 “甲、乙两人均未选择B选项”,则( )
A.事件M与事件N相互独立 B.事件X与事件Y相互独立
C.事件M与事件Y相互独立 D.事件N与事件Y相互独立
【答案】C
【解析】依题意甲、乙两人所选选项有如下情形:
①有一个选项相同,②两个选项相同,③两个选项不相同,
所以 , , , ,
因为事件 与事件 互斥,所以 ,又 ,
所以事件M与事件N不相互独立,故A错误;
,故B错误;
由 ,则事件M与事件Y相互独立,故C正确;
因为事件N与事件Y互斥,所以 ,
又 ,所以事件N与事件Y不相互独立,故D错误.故选:C.
【变式5-3】(2022·全国·高三专题练习)从装有3个黄球和4个蓝球的口袋内任取3个球,那么互斥不对
立的事件是( )
A.恰有一个黄球与恰有一个蓝球 B.至少有一个黄球与都是黄球
C.至少有一个黄球与都是蓝球 D.至少有一个黄球与至少有一个蓝球
【答案】A
【解析】从装有3个黄球和4个蓝球的口袋内任取3个球,不同的取球情况共有以下4种:
①3个球全是黄球;②2个黄球和1个蓝球;③1个黄球2个蓝球;④3个球全是蓝球.
对于A,恰有一个黄球是情况③,恰有一个蓝球是情况②,
∴恰有一个黄球与恰有一个蓝球是互斥不对立的事件,故A正确;
对于B,至少有一个黄球是情况①②③,都是黄球是情况①,
∴至少有一个黄球与都是黄球能同时发生,不是互斥事件,故B错误;
对于C,至少有一个黄球是情况①②③,都是蓝球是情况④,
∴至少有一个黄球与都是蓝球是对立事件,故C错误;
对于D,至少有一个黄球是情况①②③,至少有一个蓝球是情况②③④,
∴至少有一个黄球与至少有一个蓝球能同时发生,不是互斥事件,故D错误.故选:A.
【变式5-4】(2023·广东惠州·高三校考阶段练习)同时抛掷一红一绿两枚质地均匀的骰子,用 表示红
色骰子的点数, 表示绿色骰子的点数,设事件 “ ”,事件 “ 为奇数”,事件 “
”,则下列结论正确的是( )
A.A与 对立 B. C.A与 相互独立 D. 与 相互独立【答案】C
【解析】由题意可知: ,
对于选项A:事件 “ ”,事件 “ 为奇数”,
例如 ,则 , 不为奇数,
即A事件和 事件可以同时不发生,所以A事件与 事件不对立,故A错误;
对于选项B:样本空间共 个样本点,
且 ,共 个样本点,所以 ,
,共 个样本点, ,
,共 个样本点, ,
则 ,所以 ,故B错误;
对于选项C:因为 ,所以 与 不相互独立,故D错误;
对于选项D:因为 ,则 ,
且 ,可得 ,
所以 与 相互独立,故C正确.故选:C.
【题型6 线性回归分析】
满分技巧
线性回归分析问题的类型及解题方法
1、求线性回归方程:(1)利用公式求出回归系数 , ;(2)利用回归直线过样本中心点求系数;
2、利用回归方程进行预测:把线性回归方程看作一次函数,求函数值;
3、利用回归直线判断正、负相关:决定正相关函数负相关的系数是 ;
4、回归方程的拟合效果可以利用相关系数判断,当 越接近1时,两变量的线性相关性越强。
【例6】(2024·河南·高三校联考开学考试)(多选)已知变量 之间的经验回归方程为 ,
且变量 的数据如下表所示:
5 6 8 12 14
10 8 6 5 1
则下列说法正确的是( )
A.变量 之间负相关 B.
C.当 时,可估计 的值为11 D.当 时,残差为
【答案】AC
【解析】对于A选项,由 ,可得变量 之间负相关,故A选项正确;对于B选项, ,
将 代入经验回归方程,有 ,可得 ,故B选项错误;
对于C选项,由上知 ,当 时, ,故C选项正确;
对于D选项,当 时, ,残差为 ,故D选项错误.故选:
AC.
【变式6-1】(2024·湖南·长沙一中校联考模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻
炼情况进行统计分析,统计每次骑行期间的身体综合指标评分 与骑行用时 (单位:小时)如下表:
1 2 3 4 5
身体综合指标评分
8.
用时 小时) 9.5 7.8 7 6.1
8
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数 .
A.身体综合指标评分 与骑行用时 正相关
B.身体综合指标评分 与骑行用时 的相关程度较弱
C.身体综合指标评分 与骑行用时 的相关程度较强
D.身体综合指标评分 与骑行用时 的关系不适合用线性回归模型拟合
【答案】C
【解析】因为相关系数 .
即相关系数近似为 与 负相关,且相关程度相当高,
从而可用线性回归模型拟合 与 的关系,所以选项ABD错误,C正确.故选:C.
【变式6-2】(2024·山东·高三山东省实验中学校考开学考试)为研究某池塘中水生植物的覆盖水塘面积
(单位: )与水生植物的株数 (单位:株)之间的相关关系,收集了4组数据,用模型
去拟合 与 的关系,设 与 的数据如表格所示:得到 与 的线性回归方程
,则 ( )
3 4 6 72 2.5 4.5 7
A.-2 B.-1 C. D.
【答案】C
【解析】由已知可得, , ,
所以,有 ,解得 ,所以, ,
由 ,得 ,
所以, ,则 .故选:C.
【变式6-3】(2024·湖北武汉·统考模拟预测)随着科技发展的日新月异,人工智能融入了各个行业,促
进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真
人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚
拟角色直播带货后的销售金额情况统计.
2023年8 2023年9 2023年10 2023年11 2023年12 2024年1
年月
月 月 月 月 月 月
月份编号 1 2 3 4 5 6
销售金额 /万
15.4 25.4 35.4 85.4 155.4 195.4
元
若 与 的相关关系拟用线性回归模型表示,回答如下问题:
(1)试求变量 与 的样本相关系数 (结果精确到0.01);
(2)试求 关于 的经验回归方程,并据此预测2024年2月份该公司的销售金额.
附:经验回归方程 ,其中 , ,
样本相关系数 ;
参考数据: , .
【答案】(1)0.96;(2) ,219.4万元
【解析】(1) ,
,
所以 .(2)由题意 ,
所以 ,
所以 关于 的经验回归方程为 ,
所以预测2024年2月份该公司的销售金额为 万元.
【变式6-4】(2024·广东广州·统考二模)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量
有所增加.为调查该地区植物覆盖面积与某种野生动物数量的关系,将其分成面积相近的若干个地块,从
这些地块中随机抽取20个作为样区,调查得到样本数据 ,其中 ,和 ,分别表示
第 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:只),并计算得
.
(1)求样本 的相关系数(精确到0.01),并推断这种野生动物的数量y(单位:
只)和植物覆盖面积x(单位:公顷)的相关程度;
(2)已知20个样区中有8个样区的这种野生动物数量低于样本平均数,从20个样区中随机抽取2个,
记抽到这种野生动物数量低于样本平均数的样区的个数为X,求随机变量X的分布列.
附:相关系数
【答案】(1)0.94,相关性较强;(2)见解析
【解析】(1)样本 , ,2, , 的相关系数为
.
由于相关系数 , ,则相关性很强, 的值越大,相关性越强.
故 ,故相关性越强.
(2)由题意得: 的可能取值为0,1,2,
20个样区中有8个样区的这种野生动物数量低于样本平均数,
有12个样区的这种野生动物数量不低于样本平均数,
所以 , , ,
所以 的分布列为:
0 1 2【题型7 独立性检验】
满分技巧
独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量相互独立,并给出在问题中的解释。
(3)根据列联表中的数据及计算公式 求出 的值;
(4)当 时,我们就推断 不成立,即两个变量不独立,该推断犯错误的概率不超过 ;
当 时,我们没有充分证据推断 不成立,可以认为两个变量相互独立。
【例7】(2024·广东广州·统考二模)根据分类变量 与 的成对样本数据,计算得到 .依据
的独立性检验,结论为( )
A.变量 与 独立
B.变量 与 独立,这个结论犯错误的概率不超过
C.变量 与 不独立
D.变量 与 不独立,这个结论犯错误的概率不超过
【答案】A
【解析】因为 ,
所以,依据 的独立性检验,我们认为变量 与 独立,故选:A.
【变式7-1】(2024·四川成都·高三成都七中校考期末)在某病毒疫苗的研发过程中,需要利用基因编辑
小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下 列联表(部分
数据缺失):
被某病毒感
未被某病毒感染 合计
染
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
计算可知,根据小概率值 ______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病
毒感染的效果” ( )
附: , .A.0.001 B.0.05 C.0.01 D.0.005
【答案】B
【解析】完善 列联表如下:
被某病毒感
未被某病毒感染 合计
染
注射疫苗 10 40 50
未注射疫 3
20 50
苗 0
7
合计 30 100
0
假设 :“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.
因为: ,而 ,
所以根据小概率值 的独立性检验,推断 不成立.
即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.故选:B
【变式7-2】(2024·福建泉州·高三校考阶段练习)针对时下的“短视频热”,某高校团委对学生性别和喜
欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为 人,男生中喜欢短视
频的人数占男生人数的 ,女生中喜欢短视频的人数占女生人数的 .零假设为 :喜欢短视频和性别相
互独立.若依据 的独立性检验认为喜欢短视频和性别不独立,则 的最小值为( )
附: ,附表:
0.05 0.01
3.841 6.635
A.7 B.8 C.9 D.10
【答案】C
【解析】根据题意,不妨设 ,
于是 ,
由于依据 的独立性检验认为喜欢短视频和性别不独立,
根据表格可知 ,解得 ,于是 最小值为 .故选:C
【变式7-3】(2023·全国·高三专题练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、
速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩
云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到 ,下列小波
对地区A天气的判断不正确的是( )
日落云里
走 下雨 未下雨
夜晚天气
出现 25 5
未出现 25 45
参考公式:
临界值参照表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.据小概率值 的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”, 据小概率值 的独立性检验,可以认为夜晚会下雨
【答案】D
【解析】由列联表知:100天中有50天下雨,50天未下雨,
因此夜晚下雨的概率约为 ,A正确;
未出现“日落云里走”,夜晚下雨的概率约为 ,B正确;
,
因此据小概率值 的独立性检验,认为“日落云里走”是否出现与夜晚天气有关,
C正确,D错误.故选:D
【变式7-4】(2024·四川宜宾·高三四川省兴文第二中学校校考开学考试)为探究某药物对小鼠的生长抑
制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
测得40只小鼠体重如下(单位: ):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5
27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
附: ,其中 .
0.10 0.05 0.010
2.706 3.841 6.635(1)求40只小鼠体重的中位数 ,并完成下面 列联表:
合计
对照组
实验组
合计
(2)根据 列联表,能否有 的把握认为药物对小鼠生长有抑制作用.
【答案】(1)23.4,列联表见解析;(2)有 的把握认为药物对小鼠生长有抑制作用.
【解析】(1)由所给数据从小到大排序:
,
所以40只小鼠体重的中位数为 ,
列联表如下:
合计
对照组 6 14 20
实验组 14 6 20
合计 20 20 40
(2)由 公式可知 ,
所以有 的把握认为药物对小鼠生长有抑制作用.
【题型8 二项分布】
满分技巧
独立重复试验与二项分布
1、定型:“独立”“重复”是二项分布的基本特征,“每次试验事件发生的概率都相等”是二项分布的本质特
征.判断随机变量是否服从二项分布,要看在一次试验中是否只有两种试验结果,且两种试验结果发生
的概率分别为p,1-p,还要看是否为n次独立重复试验,随机变量是否为某事件在这n次独立重复试验
中发生的次数.
2、定参,确定二项分布中的两个参数n和p,即试验发生的次数和试验中事件发生的概率.
3、列表,根据离散型随机变量的取值及其对应的概率,列出分布列.
4、求值,根据离散型随机变量的期望和方差公式,代入相应数据求值.
相关公式:已知X~B(n,p),则P(X=k)=C pk(1-p)n-k(k=0,1,2,…,n),E(X)=np,D(X)=np(1-p).
【例8】(2024·安徽合肥·高三合肥一六八中学校联考期末)甲、乙两人进行射击比赛,每次比赛中,甲、
乙各射击一次,甲、乙每次至少射中8环.根据统计资料可知,甲击中8环、9环、10环的概率分别为
,乙击中8环、9环、10环的概率分别为 ,且甲、乙两人射击相互独立.(1)在一场比赛中,求乙击中的环数少于甲击中的环数的概率;
(2)若独立进行三场比赛,其中X场比赛中甲击中的环数多于乙击中的环数,求 的分布列与数学期望.
【答案】(1)0.2;(2)分布列见解析,数学期望为0.6
【解析】(1)设乙击中的环数少于甲击中的环数为事件 ,
则事件 包括:甲击中9环乙击中8环,
甲击中10环乙击中8环,甲击中10环乙击中9环,
则 .
(2)由题可知 的所有可能取值为 ,
由(1)可知,在一场比赛中,甲击中的环数多于乙击中的环数的概率为0.2,则
,
所以 ,
,
故 的分布列为
0 1 2 3
0.51
0.384 0.096 0.008
2
所以 .
【变式8-1】(2022·全国·高三专题练习)某校高三年级数学组长为了了解学生的数学学习情况,对其在
市二诊考试中的数学成绩(满分150分)进行分析,从全年级数学成绩中随机抽取了15人的成绩作为样
本,得到如图所示的茎叶图.若成绩不低于120分,则称为数学成绩优良.
(1)从这15人的成绩中随机抽取3人,求至多有1人数学成绩优良的概率;
(2)以这15人的成绩中成绩优良的频率作为概率,估计该校高三年级在市三诊、省一、二诊未来3次诊
断考试数学成绩优良的人数,从而估计该校今年高考数学成绩.记随机变量 为未来这3次考试中优良学
生的人数,求 的分布列和数学期望.
【答案】(1) ;(2)分布列见解析,数学期望为
【解析】(1)记“从这15人的成绩中随机抽取3人,求至多有1人数学成绩优良”为事件 ,
由题知分数不低于120分有3人,则 .
(2)以这15人的成绩中成绩优良的频率作为概率,易得数学成绩优良的概率为 ,
的所有可能取值为0,1,2,3,由题意得 ,
则 , ,
, ,
随机变量 的分布列为
0 1 2 3
.
【变式8-2】(2022·河南·高三专题练习)甲、乙两队要举行一场排球比赛,双方约定采用“五局三胜”制
赛规,即一场比赛全程最多打五局,比赛双方只要有一个队先胜三局,则比赛就此结束,且该队为获胜
方.根据以往大量的赛事记录可知甲、乙两队在比赛中每局获胜的概率分别为 .
(1)若在首局比赛中乙队以 的比分暂时领先,求最后甲队、乙队各自获胜的概率;
(2)求乙队以 的比分获胜的概率;
(3)设确定比赛结果需要比赛 局,求 的分布列及数学期望.
【答案】(1) ; ;(2) ;(3)分布列见解析,
【解析】(1)由题意,首局比赛已经结束,乙队以 的比分暂时领先为必然事件,
若甲队要最后获胜有两种情况:
第一种情况:甲队在第二、三、四局比赛中胜;
第二种情况:甲队在第二、三、四局比赛中胜且只胜其中两局,且第五局再胜.
故最后甲队获胜的概率为 ;
而最后乙队获胜的概率为 .
(2)乙队以 的比分获胜,这表明在前四局比赛中甲、乙队双方各胜两局,且第五局乙队胜,
故乙队以 的比分获胜的概率为 .
(3)由题意, ,
且 ;
;
.
所以 的分布列为
X 3 4 5P
所以数学期望 .
【变式8-3】(2024·湖北十堰·高三统考期末)某市为提高市民对文明城市创建的认识,举办了“创建文明
城市”知识竞赛,从所有答卷中随机抽取 份作为样本,将 个样本数据按 、 、
、 、 、 分成 组,并整理得到如下频率分布直方图.
(1)请通过频率分布直方图估计这 份样本数据的平均值(同一组中的数据用该组区间的中点值作代
表).
(2)以样本频率估计概率,若竞赛成绩不低于 分,则被认定为成绩合格,低于 分说明成绩不合格.
从参加知识竞赛的市民中随机抽取 人,用 表示成绩合格的人数,求 的分布列及数学期望.
【答案】(1) ;(2)分布列见解析,
【解析】(1)由频率分布直方图可知, 份样本数据的平均值为
.
(2)竞赛成绩不低于 分的频率为 ,
低于 分的频率为 .
由题意可知 , ,
,
,
,
, ,
所以 的分布列为期望 .
【变式8-4】(2024·北京昌平·高三统考期末)某汽车生产企业对一款新上市的新能源汽车进行了市场调
研,
统计该款车车主对所购汽车性能的评分,将数据分成5组:
,并整理得到如下频率分布直方图:
(1)求 的值;
(2)该汽车生产企业在购买这款车的车主中任选3人,对评分低于110分的车主送价值3000元的售后服
务项目,对评分不低于110分的车主送价值2000元的售后服务项目.若为这3人提供的售后服务项目总
价值为 元,求 的分布列和数学期望 ;
(3)用随机抽样的方法从购买这款车的车主中抽取10人,设这10人中评分不低于110分的人数为 ,
问 为何值时, 的值最大?(结论不要求证明
【答案】(1) ;(2)分布列见解析,期望6900;(3) .
【解析】(1)由频率分布直方图可知 ;
(2)根据频率分布直方图可知评分低于110分的占比 ,评分不低于110分的占比 ,
任选3人中其评分情况有四种:3人均低于110分;
2人低于110分,1人不低于110分;1人低于110分,
2人不低于110分;3人均不低于110分,
所以 可取 四种情况,
, ,
, ,
故 的分布列为:
9000 8000 7000 6000
0.027 0.189 0.441 0.343
则 ;
(3)由题意可知 ,可知当 时 取得最大值.
证明如下:设 最大,即 ,
所以 ,
化简得 ,因为 ,故 .
【题型9 超几何分布】
满分技巧
超几何分布的适用范围及本质
(1)适用范围:考察对象分两类;已知各类对象的个数;从中抽取若干个个题,考察某一类个题个数的
概率分布;
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的。
2、超几何分布与二项分布的区别
(1)超几何分布需要知道总体的容量,而二项分布不需要;
(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的,而二项分布是“有放
回”的抽取(独立重复),在每次试验中某一事件发生的概率是相同点。
【例9】(2024·山东·高三山东省实验中学校考开学考试)盒中有大小颜色相同的6个乒乓球,其中4个
未使用过(称之为新球),2个使用过(称之为旧球).每局比赛从盒中随机取2个球作为比赛用球,比赛
结束后放回盒中.使用过的球即成为旧球.
(1)求一局比赛后盒中恰有3个新球的概率;
(2)设两局比赛后盒中新球的个数为 ,求 的分布列及数学期望.
【答案】(1) ;(2)分布列见解析,
【解析】(1)由题意可知当比赛使用1个新球,1个旧球时,盒中恰有3个新球,
使用一局比赛后盒中恰有3个新球的概率 .
(2)由题意可知 的可能取值为 ,
, ,
,
, ,
所以 的分布列为
0 1 2 3 4.
【变式9-1】(2024·辽宁·高三校联考期末)某企业打算处理一批产品,这些产品每箱10件,以箱为单位
销售,已知这批产品中每箱都有废品.每箱的废品率只有 或者 两种可能,且两种可能的产品市场占有
率分别为 .假设该产品正品每件市场价格为100元,废品不值钱,现处理价格为每箱840元,遇到废
品不予更换,以一箱产品中正品的价格期望值作为决策依据.(运算结果保留分数)
(1)在不开箱检验的情况下,判断是否可以购买;
(2)现允许开箱,不放回地随机从一箱中抽取2件产品进行检验,已发现在抽取检验的2件产品中,其
中恰有一件是废品
①求此箱是废品率为 的概率;
②判断此箱是否可以购买,并说明理由.
【答案】(1)可以购买;(2)① ;②可以购买.
【解析】(1)在不开箱检验的情况下,一箱产品中正品的价格期望值为:
,
所以在不开箱检验的情况下,可以购买.
(2)①设事件A:发现在抽取检验的2件产品中,其中恰有一件是废品,
则 ,
设事件 :抽取的是废品率为 的一箱,则 ,
所以发现在抽取检验的2件产品中,其中恰有一件是废品的条件下,
此箱是废品率为 的一箱的概率为 ;
②设正品价格的期望值为 ,则 ,
事件 :抽取的是废品率为 的一箱,则 ,
所以 ,
所以在已发现抽取检验的2件产品中恰有一件是废品的情况下,此箱可以购买.【变式9-2】(2024·安徽黄山·统考一模)某校高三年级 名学生的高考适应性演练数学成绩频率分布
直方图如图所示,其中成绩分组区间是 、 、 、 、 、 .
(1)求图中 的值,并根据频率分布直方图,估计这 名学生的这次考试数学成绩的第 百分位数;
(2)从这次数学成绩位于 、 的学生中采用比例分配的分层随机抽样的方法抽取 人,再
从这 人中随机抽取 人,该 人中成绩在区间 的人数记为 ,求 的分布列及数学期望.
【答案】(1) ,第 分位数为 ;(2)分布列答案见解析,
【解析】(1)由频率分布直方图可得 ,解得 .
前四个矩形的面积之和为 ,
前五个矩形的面积之和为 ,
设这 名学生的这次考试数学成绩的第 百分位数为 ,
则 ,解得 ,
因此,这 名学生的这次考试数学成绩的第 百分位数为 .
(2)数学成绩位于 、 的学生人数之比为 ,
所以,所抽取的 人中,数学成绩位于 的学生人数为 ,
数学成绩位于 的学生人数为 人,
由题意可知,随机变量 的可能取值有 、 、 、 ,
则 , ,
, ,
所以,随机变量 的分布列如下表所示:
所以, .
【变式9-3】(2024·浙江湖州·高三统考期末)杭州第 届亚运会,是继 年北京亚运会、 年广州
亚运会之后,中国第三次举办亚洲最高规格的国际综合性体育赛事. 年 月 日,杭州亚运会开幕式
隆重举行.某电商平台亚运周边文创产品直播间,主播为当晚 点前登录该直播间的前 名观众设置了两轮“庆亚运、送吉祥物”的抽奖活动.每轮抽奖都是由系统独立、随机地从这 名观众中抽取 名幸运观
众,抽中者平台会有亚运吉祥物玩偶赠送.而直播时这 名观众始终在线,记两次抽奖中被抽中的幸运观
众总人数为 (幸运观众总人数不重复计数,例如若某幸运观众两次都被抽中,但只记为 人).
(1)已知小杭是这前 名观众中的一人,若小杭被抽中的概率为 ,求 的值;
(2)当 取到最大值时,求 的值.
【答案】(1) ;(2)
【解析】(1)记“小杭被抽中”为事件 ,“小杭第 次被抽中”为事件 .
,
整理可得 ,即 ,
又因为 且 ,解得 .
(2)“ ”表示第一次在 个人中抽取 个,
第二次抽取的 个人中,有 人在第一次抽取的 人以外,
另外的 个人在第一次抽取的 人中,
,记 ,
由
,
解得 ,又 ,所以 时, 取最大值.
【题型10 正态分布】
满分技巧
关于正态总体在某个区间内取值的概率求法
(1)熟记P(μ-σ