文档内容
第 09 讲 高考中的概率与统计 (精讲)
目录
第一部分:典型例题剖析
题型一:频率分布直方图
题型二:成对数据的统计分析
角度1:经验回归线性方程及其应用
角度2:经验回归非线性方程及其应用
角度3:独立性检验
题型三:概率与统计
角度1;离散型随机变量及其分布列
角度2:概率与统计的综合问题
角度3:正态分布的综合问题
第二部分:高考真题感悟
第一部分:典 型 例 题 剖 析
题型一:频率分布直方图
1.(2022·河南省杞县高中模拟预测(理))在全民抗击新冠肺炎疫情期间,某市教育部门开展了“停课
不停学”活动,为学生提供了多种网络课程资源.活动开展一个月后,某学校随机抽取了高二年级的学生
若干进行网络问卷调查,统计学生每天的学习时间(单位:小时),将样本数据分成 , , ,
, 五组(全部数据都在 内),并整理得到如图所示的频率分布直方图.(1)已知该校高二年级共有800名学生,根据统计数据,估计该校高二年级每天学习时间不低于5小时的学
生人数;
(2)利用统计数据,估计该校高二年级学生每天平均学习时间;
(3)若样本容量为40,从学习时间在 的学生中随机抽取3人,X为所抽取的3人中来自学习时间在
内的人数,求X的分布列和数学期望.
【答案】(1)640人
(2)5.6小时
(3)分布列见解析;期望为
(1)根据统计数据估计该校高二年级每天学习时间不低于5小时的学生人数为 .
所以估计该校高二年级每天学习不低于5小时的人数为640人.
(2)样本中学生每天学习时间的各组频率分别为0.05,0.15,0.50,0.25,0.05.
样本中学生每天平均学习时间为
(小时).
所以估计该校高二年级学生每天平均学习时间为5.6小时.
(3)由题意知样本中每天学习时间不足4小时的人数为 ,样本中每天学习时间在 上的学生人
数为 .
所以X的取值为0,1,2,
所以 , , ,
故X的分布列为
X 0 1 2
P
所以 .
2.(2022·新疆·三模(文))阿克苏冰糖心苹果主要产地位于天山托木尔峰南麓,因为冬季寒冷,所以果
品生长期病虫害发生少,加上昼夜温差大、光照充足,用无污染的冰川雪融水浇灌、沙性土壤栽培、高海
拔的生长环境,使苹果的果核部分糖分堆积成透明状,形成了世界上独一无二的“冰糖心”,某果园秋季
新采摘了一批苹果,从中随机加取50个作为样本,称出它们的重量(单位:克),将重量按照
进行分组,得到频率分布直方图如图所示(同一组中的数据以该组
区间的中点值为代表).(1)估计这批苹果中每个苹果重量的平均数、中位数、众数;
(2)该果园准备把这批苹果销售出去,据市场行情,有两种销售方案:
方案一:所有苹果混在一起,价格为3元/千克;
方案二:将不同重量的苹果分开,重量不小于160克的苹果的价格为4元/千克,重量小于160克的苹果的
价格为2.4元/千克,但每1000个苹果果园需支付10元分拣费.
试比较分别用两种方案销售10000个苹果的收入高低.
【答案】(1)平均数 克,中位数 ,众数 ;
(2)方案二的销售收入更高.
(1)由题意可得: ,解得 ,
故每个苹果重量的平均数为:
(克),
又 ,所以中位数刚好为160;
众数为最高矩形对应区间的中点值,即为170;
故估计这批苹果中每个苹果重量的平均数、中位数、众数分别为 ;
(2)若采用方案一,估计收入约为 (元);
若采用方案二,重量小于160克的苹果的总重量约为: (千
克),
重量不小于160克的苹果的总重量约为: (千克),
故估计收入约为 (元),
因此,方案二的销售收入更高.
3.(2022·全国·模拟预测)2022年河南电视台春节联欢晚会以其独特的风格受到广泛关注.某网站为了解
观众对河南电视台春晚的满意程度,随机抽取了100位观众进行问卷调查,并统计了这100位观众对河南
电视台春晚的评分(单位:分,满分100分),得到如下的频率分布直方图:(1)若评分不低于80分的观众对河南电视台春晚的态度为“喜欢”,以样本估计总体,以频率估计概率,
从看过2022年河南电视台春晚的观众中随机抽取3人,求这3人中恰好有2人的态度为“喜欢”的概率;
(2)若从样本中评分不低于70分的观众中按照分层抽样的方法抽取9人进行座谈,再从这9人的中随机抽取
3人进行深入调研,记这3人中评分不低于90分的人数为 ,求 的分布列与数学期望.
【答案】(1)
(2)分布列答案见解析,数学期望:
(1)解:由频率分布直方图可知,随机抽取一名观众,该观众的态度是“喜欢”的概率为
,
所以这3人中恰好有2人的态度为“喜欢”的概率为 .
(2)解:抽取的9人中,评分在 , , 内的人数分别为2,4,3,
故 的所有可能取值为0,1,2,3,
, ,
, ,
所以 的分布列为
0 1 2 3
的数学期望 .
4.(2022·四川·仁寿一中二模(理))近年来,我国电子商务蓬勃发展,某创业者对过去100天,某知名
A产品在自己开的网店和实体店的销售量(单位:件)进行了统计,制成如下频率分布直方图,已知网店
与实体店销售量相互独立.(1)写出频率分布直方图a的值,记实体店和网店的销售量的方差分别为 , ,试比较 , 的大小;
(不要求计算出具体值,给出结论即可);
(2)网店回访服务,若查知某天该网店所销售的A产品被10名不同的顾客(其中2名男性)购买,现从这
10名顾客中随机选2人进行服务回访,求恰好选到一人是男性的概率;
(3)若将上述频率视为概率,已知实体店每天销售量不低于30件可盈利,记“未来三天实体店盈利的天
数”为X,求随机变量X的分布列和数学期望.
【答案】(1) ,
(2)
(3)分布列见解析,期望为
(1)解:由频率分布直方图的性质,可得 ,
解得 ,
通过比较两个频率分布直方图可知,实体店销售量比网店更集中、稳定,故 .
(2)解:由题意,从这10名顾客中随机选2人进行服务回访,设恰好选到一人是男性为事件A,可得
,即恰好选到一人是男性的概率 .
(3)解:由题意,实体店销售量不低于30件的概率为0.4,所以盈利的概率为0.4,
故 的可能取值为0,1,2,3.
可得相应的概率为: , ,
, ,
随机变量 分布列为
X 0 1 2 3P
因为 ,所以期望为 .
5.(2022·云南昆明·模拟预测(文))《中共中央国务院关于深入打好污染防治攻坚战的意见》提出“构
建智慧高效的生态环境管理信息化体系”,下一步,需加快推进5G、物联网、大数据、云计算等新信息技
术在生态环境保护领域的建设与应用,实现生态环境管理信息化、数字化、智能化.某科技公司开发出一
款生态环保产品,已知该环保产品每售出1件预计利润为0.4万元,当月未售出的环保产品,每件亏损0.2
万元.根据市场调研,该环保产品的市场月需求量在 内取值,将月需求量区间平均分成5组,画
出频率分布直方图如下.
(1)请根据频率分布直方图,估计该环保产品的市场月需求量的平均值 和方差 .
(2)若该环保产品的月产量为185件,x(单位:件, , )表示该产品一个月内的市场
需求量,y(单位:万元)表示该公司生产该环保产品的月利润.
①将y表示为x的函数;
②以频率估计概率,标准差s精确到1,根据频率分布直方图估计 且y不少于68万元的概
率.
【答案】(1) ; .
(2)① ;② .
(1) ,
,
(2)①当 ,且 时, 万元;
当 ,且 时, 万元,
所以 ,② , , ,所以 ,
当 时, 万元,
当 时,由 得 ,
故当 万元时, ,
综上所述: ,
所以 .
所以估计 且y不少于68万元的概率为 .
6.(2022·四川南充·三模(文))某企业主管部门为了解企业某产品年营销费用x(单位:万元)对年销
售量)(单位:万件)的影响,对该企业近5年的年营销费用 和年销售量 做了初步处理,
得到的散点图及一些统计量的值如下:
150 525 1800 1200
根据散点图判断,发现年销售量y(万件)关于年营销费用x(万元)之间可以用 进行回归分析.
(1)求y关于x的回归方程;
(2)从该产品的流水线上随机抽取100件产品,统计其质量指标值并绘制频率分布直方图:规定产品的质量
指标值在 的为劣质品,在 的为优等品,在 的为特优品,销售时劣质品每件亏损
0.8元,优等品每件盈利4元,特优品每件盈利6元,以这100件产品的质量指标值位于各区间的频率代替
产品的质量指标值位于该区间的概率.如果企业今年计划投入的营销费用为80万元,请你预报今年企业该
产品的销售总量和年总收益.附:①收益=销售利润-营销费用;
②对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为
, .
【答案】(1) ;
(2)今年企业该产品的销售总量估计为180万件,年总收益估计为460万元.
(1)根据题意得 , ,
, ,
y关于x的回归方程为 .
(2)
由(1)可知:当 时, ,即营销费用为80万元,该产品的销售总量约为180万
件,
由频率分布直方图知,产品的质量指标值在 、 、 的频率分别为 、 、 ,
以频率为概率可以估计:销售的180万件产品中,劣质品约为180×0.25=45(万件),
优等品约为180×0.65=117(万件),特优品约为180×0.1=18(万件),
估计今年企业该产品的总收益为: (万元),
所以,今年企业该产品的销售总量估计为180万件,年总收益估计为460万元.
7.(2022·新疆克拉玛依·三模(文))第 届北京冬季奥林匹克运动会于 年 月 日至 月 日在
北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.
某市举办了中学生滑雪比赛,从中抽取 名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎
叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中 的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据
以这组数据所在区间中点的值作代表,结果保留一位小数);
(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你
用样本来估计总体,给出这个分数线的估计值.
【答案】(1) ,平均数为 (2)
(1)解:由频率分布直方图可知,测试分数位于 的频率为 ,
则测试分数位于 个数为 ,
所以,测试分数位于 的个数为 ,
所以 .
估计平均数为 .
(2)解:因为测试分数位于 的频率为 ,测试分数位于 的频率为 ,
能够获得“滑雪达人”证书的中学生测试分数要在前 ,
故设能够获得证书的测试分数线为 ,则 ,
由 ,可得 ,所以分数线的估计值为 .
8.(2022·北京市第九中学模拟预测)《黄帝内经》中十二时辰养生法认为:子时的睡眠对一天至关重要
(子时是指 点到次日凌晨 点).相关数据表明,入睡时间越晚,沉睡时间越少,睡眠指数也就越低.根据
某次的抽样数据,对早睡群体和晚睡群体睡眠指数的统计如下表:
组别 睡眠指数 早睡人群占比 晩睡人群占比注:早睡人群为 前入睡的人群,晚睡人群为 后入睡的人群.
(1)根据表中数据,估计早睡人群睡眠指数 分位数与晚睡人群睡眠指数 分位数分别在第几组?
(2)据统计,睡眠指数得分在区间 内的人群中,早睡人群约占 .从睡眠指数得分在区间 内
的人群中随着抽取 人,以 表示这 人中属于早睡人群的人数,求 的分布列与数学期望 ;
(3)根据表中数据,有人认为,早睡人群的睡眠指数平均值一定落在区间 .试判断这种说法是否正确,
并说明理由.
【答案】(1)答案见解析
(2)分布列答案见解析,
(3)这种说法不正确,理由见解析
(1)解:早睡人群睡眠指数 分位数估计在第 组,晚睡人群睡眠指数 分位数估计在第 组.
(2)解:由题意可知, ,随机变量 的可能取值有 、 、 、 , ,
, , ,所以, 随机变量 的
分布列如下表所示:
.
(3)解:这种说法不正确,理由如下:抽样数据可以反映整体数据,但是不是完全代表整体,故早睡的
人群不一定落在 范围内.
题型二:成对数据的统计分析
角度1:经验回归线性方程及其应用
1.(2022·云南师大附中模拟预测(理))某中学有学生近600人,要求学生在每天上午7:30之前进校,
现有一个调查小组调查某天7:00~7:30进校人数的情况,得到如下表格(其中纵坐标 表示第 分钟
至第 分钟到校人数, , ,如当 时,纵坐标 表示在7:08~7:09这一分钟内进
校的人数为4人).根据调查所得数据,甲同学得到的回归方程是 (图中的实线表示),乙同
学得到的回归方程是 (图中的虚线表示),则下列结论中错误的是( )2 2
1 5 9 15 19 24 28 29 30
1 7
2 6 10
1 3 4 4 11 36 94 106
1 6 1
A.7:00~7:30内,每分钟的进校人数 与相应时间 呈正相关
B.乙同学的回归方程拟合效果更好
C.根据甲同学得到的回归方程可知该校当天7:09~7:10这一分钟内的进校人数一定是9人
D.该校超过半数的学生都选择在规定到校时间的前5分钟内进校
【答案】C
【详解】对于A,根据散点图知,7:00~7:30内,每分钟的进校人数 与相应时间 呈正相关,故A正
确;
对于B,由图知,曲线 的拟合效果更好,故乙同学的回归方程拟合效果更好,故B正确;
对于C,表格中并未给出对应的值,而由甲的回归方程得到的只能是估计值,不一定就是实际值,故C错
误;
对于D,全校学生近600人,从表格中的数据知,7:26~7:30进校的人数超过300,故D正确,
故选:C.
2.(2022·宁夏·银川一中模拟预测(文))已知下列命题:
①回归直线 恒过样本点的中心 ;
②两个变量线性相关性越强,则相关系数 就越接近于1;
③两个模型中残差平方和越小的模型拟合的效果越好.
则正确命题的个数是( ).
A.0 B.1 C.2 D.3
【答案】D
【详解】由回归方程的性质可得,回归直线 恒过样本点的中心 ,①对,
由相关系数的性质可得,两个变量线性相关性越强,则相关系数 就越接近于1,②对,
根据残差的定义可得,两个模型中残差平方和越小的模型拟合的效果越好,③对,
故正确命题的个数为3,故选:D.
3.(2022·河南·三模(文))随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济
发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该
超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中 表示开设网店数量, 表
示这 个分店的年销售额总和),现已知 ,求解下列问题;
(1)经判断,可利用线性回归模型拟合 与 的关系,求解 关于 的回归方程;
(2)按照经验,超市每年在网上销售获得的总利润 (单位:万元)满足 ,请根据(1)
中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.
参考公式;线性回归方程 ,其中
【答案】(1) ;(2)开设8或9个分店时,才能使得总利润最大.
【详解】(1)由题意得 ,
所以 .
(2)由(1)知, ,
所以当 或 时能获得总利润最大.
4.(2022·吉林·东北师大附中模拟预测(文))2015年7月31日,在吉隆坡举行的国际奥委会第128次
全会上,北京获得2022年冬奥会举办权.在申冬奥过程中,中国正式向国际社会作出“带动三亿人参与冰
雪运动”的庄严承诺.这一承诺,既是我国为国际奥林匹克运动做出重大贡献的大国担当展现,也是根据我
国经济水平和全民健身需求做出的群众性运动的战略部署.从北京冬奥会申办成功到2021年10月,全国参
与冰雪运动人数累计达到3.46亿,实现了“带动三亿人参与冰雪运动”的目标,这是北京冬奥会给予全球
冬季体育运动和奥林匹克运动的最为重要的遗产,可以说是2022年北京冬奥会的第一块金牌.“冬奥热”带
动“冰雪热”,也带动了冰雪经济,以冰雪运动为主要内容的冰雪旅游近年来发展迅速,2016至2022六个冰雪季的旅游人次y(单位亿)的数据如下表:
年度 2016—2017 2017—2018 2018—2019 2019—2020 2020—2021 2021—2022
年度代号t 1 2 3 4 5 6
旅游人次y 1.7 1.97 2.24 0.94 2.54 3.15
(1)求y与t的相关系数(精确到0.01),并回答y与t的线性相关关系的强弱;
(2)因受疫情影响,现将2019—2020年度的异常数据剔除,用剩下的5个年度数据(年度代号不变),求y
关于t的线性回归方程(系数精确到0.01),并推测没有疫情情况下,2019—2020年度冰雪旅游人次的估
计值.
附注:参考数据: , , , ,
.参考公式:相关系数 ,回归
直线的斜率和截距的最小二乘估计公式分别为: ,
【答案】(1) ,线性相关性不强
(2) , 亿
(1)由参考数据计算得
所以 ,
因为 ,所以线性相关性不强.
(2)五组数据的均值分别为 ,
,关于 的线性回归方程为
令 ,则 ,
因此,在没有疫情情况下,2019-2020年度冰雪旅游人次的估计值为 亿.
5.(2022·河南安阳·二模(理))小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调
查了20家服装店,统计得到了它们的面积x(单位: )和日均客流量y(单位:百人)的数据
,并计算得 , , , .
(1)求y关于x的回归直线方程;
(2)已知服装店每天的经济效益 ,该商场现有 的商铺出租,根据(1)
的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?
附:回归直线 的斜率和截距的最小二乘估计分别为: , .
【答案】(1)
(2)小李应该租 的商铺
(1)由已知可得 , ,
,
,
所以回归直线方程为 .
(2)根据题意得 , .
设 ,令 , ,
则 ,
当 ,即 时, 取最大值,
又因为k, ,所以此时Z也取最大值,
因此,小李应该租 的商铺.
角度2:经验回归非线性方程及其应用1.(2022·广西河池·高二期末(文))一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据,y
(单位:个)与温度x(单位:℃)得到样本数据 ( ,2,3,4,5,6),令 ,并将
绘制成如图所示的散点图.若用方程 对y与x的关系进行拟合,则( )
A. , B. ,
C. , D. ,
【答案】A
【详解】因为 ,令 ,则z与x的回归方程为 .
根据散点图可知z与x正相关,所以 .
由回归直线图象可知:回归直线的纵截距大于0,即 ,
所以 ,
故选:A.
2.(2022·河南南阳·高二期末(文))用模型 拟合一组数据时,令 ,将其变换后
得到回归直线方程 ,则 ( )
A.e B. C. D.2
【答案】D
【详解】对 两边同时取对数,则
,令 ,
则 ,所以 ,
所以 .
故选:D.
3.(2022·福建省福州第一中学高二期末)在一组样本数据 , , , 的散点图中,
若所有样本点 ( ,2, ,7)都在曲线 附近波动,经计算
, , ,则实数 ( )A. 0.5 B.0.5 C. 1 D.1
【答案】A
【详解】因为 , ,
所以 ,解得 .
故选:A.
4.(2022·重庆南开中学高三阶段练习)近年来,美国方面滥用国家力量,不择手段打压中国高科技企业,
随着贸易战的不断升级,中国某科技公司为了不让外国“卡脖子”,决定在企业预算中减少宣传广告预算,
增加对技术研究和人才培养的投入,下表是的连续7年研发投入x和公司年利润y的观测数据,根据绘制
的散点图决定用回归模型: 来进行拟合.
表I
研发投入 (亿
20 22 25 27 29 31 35
元)
年利润 (亿元) 7 11 21 24 65 114 325
表II(注:表中 )
189 567 162 78106
3040
(1)请借助表II中的数据,求出回归模型的方程;(精确到0.01)
(2)试求研发投入为20亿元时年利润的残差.
参考数据: ,附:回归方程中 和
,残差
【答案】(1) (2)
(1)由 得 ,令 ,得 ,
由表II数据可得:, .
所以回归方程为: .
(2)在 时的残差: .
5.(2022·河南商丘·高二期末(文))5G网络是指第五代移动网络通讯技术,它的主要特点是传输速度
快,峰值传输速度可达每秒钟数十GB.作为新一代移动通讯技术,它将要支持的设备远不止智能手机,而
是会扩展到未来的智能家居,智能穿戴等设备.某科技创新公司基于领先技术的支持,经济收入在短期内逐
月攀升,该公司1月份至6月份的经济收入y(单位:万元)关于月份x的数据如下表所示,并根据数据绘
制了如图所示的散点图.
月份x 1 2 3 4 5 6
1 3
收入y 6 23 72 124
1 7
(1)根据散点图判断, 与 (a,b,c,d均为常数)哪一个更适合作为经济收入y关于月份x
的回归方程类型(给出判断即可,不必说明理由)?
(2)根据(1)的结果及表中数据,求出y关于x的回归方程(结果保留两位小数);
(3)根据(2)所求得的回归方程,预测该公司7月份的经济收入(结果保留两位小数).
参考公式及参考数据:回归方程 中斜率和截距的最小二乘估计公式为:
, ;
3.5 45.5 3.34 17.5 393.5 10.63 239.85
其中 , ( ).
【答案】(1) 更适合(2)
(3)239.85万元
(1)由散点图可知, 更适合作为经济收入y关于月份x的回归方程类型.
(2) 的两边取自然对数,得 .因为 , , ,
,所以 ,
,所以 ,所以经济收入y关于月份x的回归方程为
.
(3)当 时, .预测该公司7月份的经济收入约为239.85万元.
6.(2022·四川雅安·高二期末(理))某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第
x天的高度为y cm,测得一些数据如下表所示:
1 3
第x天 1 4 9 25 49
6 6
1
高度y/cm 0 4 7 9 11 13
2
作出这组数的散点图如下
(1)请根据散点图判断, 与 中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?
(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第196天这株幼苗的高度(结果保
留整数).
附: , 参考数据:140 28 56 283
【答案】(1) 更适宜
(2) ;预测第196天幼苗的高度大约为29cm
(1)根据散点图, 更适宜作为幼苗高度y关于时间x的回归方程类型;
(2)令 ,则 构造新的成对数据,如下表所示:
x 1 4 9 16 25 36 49
1 2 3 4 5 6 7
y 0 4 7 9 11 12 13
容易计算, , .通过上表计算可得:
因此
∵回归直线 过点 ,∴ ,
故y关于 的回归直线方程为
从而可得:y关于x的回归方程为
令 ,则 ,所以预测第196天幼苗的高度大约为29cm.
7.(2022·福建三明·高二期末)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速
增长.已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
201
年份(年) 2014 2015 2016 2018 2019 2020 2021
7
年份代码x 1 2 3 4 5 6 7 8
保有量y/千辆 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
(1)根据统计表中的数据判断, 与 哪一个更适合作为 关于 的经验回归方程(给出判断
即可,不必说明理由),并根据你的判断结果建立 关于 的经验回归方程;
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比
相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考数据:
, , ,其中 , , ,
.
参考公式:
对于一组数据( , ),( , ),…,( , ),其经验回归直线 的斜率和截距的
最小二乘估计公式分别为 ;
【答案】(1) ,
(2)2028年底新能源汽车的数量将超过传统能源汽车
(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是
令 ,则 ,
因为 , ,
所以 ,
.
所以 .
(2)设传统能源汽车保有量每年下降的百分比为r,
依题意得, ,解得 ,
设从2021年底起经过x年后的传统能源汽车保有量为y千辆,
则有 ,
设从2021年底起经过x年后新能源汽车的数量将超过传统能源汽车,则有
.
所以 ,
解得
故从2021年底起经过7年后,即2028年底新能源汽车的数量将超过传统能源汽车.角度3:独立性检验
1.(2022·重庆·高二阶段练习)第24届冬季奥林匹克运动会( ),即
2022年北京冬季奥运会,是由中国举办的国际性奥林匹克赛事,于2022年2月4日开幕,2月20日闭
幕.2022年北京冬季奥运会共设7个大项,15个分项,109个小项.北京赛区承办所有的冰上项目,延庆赛
区承办雪车、雪橇及高山滑雪项目,张家口赛区承办除雪车、雪橇、高山滑雪之外的所有雪上项目.为调查学
生对冬季奥运会项目的了解情况,某中学进行了一次抽样调查,统计得到以下 列联表.
了解 不了解 合计
男生 60 200
女生 110 200
合计
(1)先完成 列联表,并依据 的独立性检验,分析该校学生对冬季奥运会项目了解情况与性别是
否有关;
(2)①为弄清学生不了解冬季奥运会项目的原因,按照性别采用分层抽样的方法,从样本中不了解冬季奥运
会项目的学生中随机抽取5人,再从这5人中抽取3人进行面对面交流,求“男、女生至少各抽到一名”的
概率;
②用样本估计总体,若再从该校全体学生中随机抽取40人,记其中对冬季奥运会项目了解的人数为 ,
求 的数学期望.
附表:
附:
【答案】(1)列联表答案见解析,该校学生对冬季奥运会项目了解情况与性别有关
(2)① ;②
(1)零假设 :该校学生对冬季奥运会项目了解情况与性别无关(独立),
了解 不了解 合计
男生 140 60 200
女生 110 90 200
合计 250 150 400根据所给数据得 ,
并依据 的独立性检验,零假设 不成立,
即该校学生对冬季奥运会项目了解情况与性别有关,该推断犯错误的概率不超过 .
(2)①采用分层抽样的方法,从样本中不了解冬季奥运会项目的学生中随机抽取5人,由题可得不了解冬
季奥运会项目的学生中男女比例为 ,
故这5人中包含3名女生,2名男生,再从这5人中抽取3人进行面对面交流,
则“男、女生至少各抽到一名”的概率为 ;
②由题意得学生了解冬季奥运会项目的概率为 ,
可知 ,故 .
2.(2022·贵州·贵阳市白云区第二高级中学高二期末(理))某校设置了篮球挑战项目,现在从本校学生
中随机抽取了60名男生和40名女生共100人进行调查,统计出愿意接受挑战和不愿意接受挑战的男女生
比例情况,具体数据如图表:
(1)根据条件完成下列 列联表:
愿意 不愿意 总计
男生
女生
总计
(2)判断是否在犯错误的概率不超过1%的情况下愿意接受挑战与性别有关;
(3)挑战项目共有两关,规定:挑战过程依次进行,每一关都有两次机会挑战,通过第一关后才有资格参与
第二关的挑战,若甲参加每一关的每一次挑战通过的概率均为0.5,记甲通过的关数为 ,求 的分布列
和数学期望.
参考公式与数据:0.1 0.05 0.025 0.01
2.706 3.841 5.024 6.635
【答案】(1)答案见解析
(2)不能认为犯错误的概率不超过1%的情况下愿意接受挑战与性别有关
(3)分布列见解析,
(1)根据条件 列联表如下:
愿意 不愿意 总计
男生 15 45 60
女生 20 20 40
总计 35 65 100
(2) ,
则不能认为犯错误的概率不超过1%的情况下愿意接受挑战与性别有关;
(3)记甲第 次通过第一关为 ,第 次通过第二关为 ,
的可能取值为 , ,
,
,
的分布列
0 1 2
数学期望 .
3.(2022·云南省下关第一中学高三开学考试)今年两会期间国家对学生学业与未来发展以及身体素质的
重要性的阐述引起了全社会的共鸣.某中学体育组对高三的400名男生做了单次引体向上的测试,得到了
如图所示的频率分布直方图(引体向上个数只记整数),体育组为进一步了解情况,组织了两个研究小组
进行研究.(1)第一小组决定从单次完成1-15个的引体向上的男生中,按照分层抽样抽取11人进行全面的体能测试,
该小组又从这11人中抽取3人进行个别访谈,记3人中抽到“单次完成引体向上1-5个”的人数为随机变
量X,求X的分布列和数学期望;
(2)第二小组从学生的成绩与体育锻炼相关性角度进行研究,得到了这400人的学业成绩与体育成绩之间的
列联表.
学业优秀 学业不优秀 总计
体育成绩不优秀 100 200 300
体育成绩优秀 50 50 100
总计 150 250 400
根据小概率值 的独立性检验,分析是否有99.5%的把握认为体育锻炼与学业成绩有关.
参考公式:独立性检验统计量 ,其中 .
下面的临界值表供参考:
a 0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)分布列见解析;期望为
(2)有99.5%的把握认为体育锻炼与学业成绩有关
(1)如图, ,
即从1-5个中选2个,6-10个中选3个,11-15个中选6个,
所以X的所有可能取值有0、1、2,
且 , ,所以X的分布列为
X 0 1 2
P
.
(2)零假设为 :体育锻炼与学业成绩独立,根据列联表中的数据得
可推断零假设 不成立,且该推断犯错误的概率不超过0.005.
所以有99.5%的把握认为体育锻炼与学业成绩有关.
4.(2022·广东广州·高三开学考试)某校所在省市高考采用新高考模式,学生按“ ”模式选科参加
高考:“3”为全国统一高考的语文、数学、外语3门必考科目;“1”由考生在物理、历史2门中选考1门科目;
“2”由考生在思想政治、地理、化学、生物学4门中选考2门科目.
(1)为摸清该校本届考生的选科意愿,从本届750位学生中随机抽样调查了100位学生,得到如下部分数据
分布:
选物理方向 选历史方向 合计
男生 30 40
女生
合计 50 100
请在答题卡的本题表格中填好上表中余下的5个空,并判断是否有99.9%的把握认为该校“学生选科的方
向”与“学生的性别”有关;
(2)记已选物理方向的甲、乙两同学在“4选2”的选科中所选的相同的选科门数为 ,求 的分布列及数学期
望.
附: , .
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)填表答案见解析,有99.9%的把握认为该校“学生选科的方向”与“学生的性别”有关
(2)分布列见解析,数学期望:
(1)根据题意可得列联表,如图:选物理方向 选历史方向 合计
男生 30 10 40
女生 20 40 60
合计 50 50 100
则 ,
由于 ,故而有99.9%的把握认为该校“学生选科的方向”与“学生的性别”有关
(2) 可能取值为0,1,2,则 ; ;
(或 ), ;
分布列如下表:
0 1 2
所以 .
5.(2022·全国·高二单元测试)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的
玩偶.由于盒子上没有标注,购买者只有打开后才会知道自己买到了什么,因此这种惊喜吸引了众多年轻
人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A,B,C三种样式,且每个盲盒只装一个.
(1)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人
购买了该款盲盒,在这些购买者当中,女生占 ;而在未购买者当中,男生、女生各占50%.请根据以上
信息填写下表,并分析是否有95%的把握认为购买该款盲盒与性别有关.
女生 男生 总计
购买
未购买
总计
参考公式: ,其中 .
参考数据:0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(2)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:
周数x 1 2 3 4 5 6
盒数y 16 ______ 23 25 26 30
由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4,5,6周的数据求线性回归方程,再
用第1,3周数据进行检验.
①若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方
程是可靠的.请用4,5,6周的数据求出y关于x的线性回归方程 ,并说明所得的线性回归方程
是否可靠.
(参考公式: , )
②如果通过①的检验得到的线性回归方程可靠,我们可以认为第2周卖出的盒数误差也不超过2盒,请你
求出第2周卖出的盒数的可能取值;如果不可靠,请你设计一个估计第2周卖出的盒数的方案.
【答案】(1)表格见解析,有95%的把握认为“购买该款盲盒与性别有关”
(2)① ,可靠;②可能值为18,19,20,21
(1) 女生 男生 总计
购买 40 20 60
未购买 70 70 140
总计 110 90 200
根据列联表中的数据,可得 ,
因为 ,所以有95%的把握认为“购买该款盲盒与性别有关”
(2)①由数据,求得 , , ,
,则所求线性回归方程为 .
当 时, , ,
当 时, , ,
所以所得到的线性回归方程是可靠的②由①可知线性回归方程可靠, 时, .
设第2周卖出的盒数为 ,则 ,即 ,
所以n能取18,19,20,21,即第2周卖出的盒数的可能值为18,19,20,21.
6.(2022·河南信阳·高二期末(文))随着人们生活水平的提高,国家倡导绿色安全消费,菜篮子工程从
数量保障型转向质量效益型.为了测试甲、乙两种不同有机肥料的使用效果,某科研单位用西红柿做了对
比实验,分别在两片实验区各摘取100个,对其质量的某项指标值进行检测,质量指数值达到35及以上的
为“质量优等”,由测量结果绘成如下频率分布直方图,其中质量指数值分组区间是: , ,
, , .
(1)分别求甲片实验区西红柿的质量指数的平均值和中位数,并从统计学的角度说明平均值、中位数哪一个
更能代表甲片实验区西红柿的质量指数;
(2)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“质量优等”与使用不同的肥料有
关;
甲有机肥
乙有机肥料 合计
料
质量优等
质量非优等
合计
.
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)平均值为 ,中位数为35.91,中位数更能代表甲片实验区西红柿的质量指数;
(2)表格见解析,有99.9%的把握认为,“质量优等”与使用不同的肥料有关
(1)解:甲片实验区西红柿的质量指数的平均值为
,设甲片实验区西红柿的质量指数的中位数为x,则 ,所以 ,故甲片实验区西红柿的质量指数的中位数为
35.91,从统计学的角度中位数更能代表甲片实验区西红柿的质量指数.
(2)由题意可得 列联表为
甲有机肥料 乙有机肥料 合计
质量优等 60 30 90
质量非优等 40 70 110
合计 100 100 200
,因为 ,所以有99.9%
的把握认为,“质量优等”与使用不同的肥料有关.
题型三:概率与统计
角度1;离散型随机变量及其分布列
1.(2022·湖南·永州市第一中学高三开学考试)我国为全面建设社会主义现代化国家,制定了从 年到
年的“十四五”规划 某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金 该
企业为了了解研发资金的投入额 单位:百万元 对年收入的附加额 单位:百万元 的影响,对往年研
发资金投入额 和年收入的附加额 进行研究,得到相关数据如下:
投入额
年收入的附加额
(1)求年收入的附加额 与投入额 的线性回归方程
(2)在(1)的条件下,若投入额为 百万元,估计年收入的附加额为多少
(3)若年收入的附加额与投入额的比值大于 ,则称对应的投入额为“优秀投资额”,现从上面 个投入额
中任意取 个,用 表示这 个投入额为“优秀投资额”的个数,求 的分布列及数学期望.
【参考数据】 , , .
【附】在线性回归方程 中, , .
【答案】(1) ;(2) 百万元;(3)分布列见解析,期望为 .
(1)解: , ,,
又因为 ,所以 ,
所以年收入的附加额 与投入额 的线性回归方程为 .
(2)解:由 知, ,
所以随着研发资金投入额的增加,年收入的附加额也增加.
研发资金投入额每增加 百万元,年收入的附加额增加 百万元.
所以 ,所以当 时, ,
所以当投入额为 百万元时,估计年收入的附加额为 百万元.
(3)解: 个投入额中,“优秀投资额”的个数为 个,
故 的所有可能取值为 , , , ,
则 的分布列为
则 .
2.(2022·湖北·襄阳五中高三阶段练习)有9个外观相同的同规格砝码,其中1个由于生产瑕疵导致质量
略有增加,小明想通过托盘天平称量出这个有瑕疵的砝码,设计了如下两种方案:方案一:每次从待称量
的砝码中随机选2个,按个数平分后分别放在天平的左、右托盘上,若天平平衡,则选出的2个砝码是没有
瑕疵的;否则,有瑕疪砝的砝码在下降一侧.按此方法,直到找出有瑕疵的砝码为止.方案二:从待称量的
砝码中随机选8个,按个数平分后分别放在天平的左、右托盘上,若天平平衡,则未被选出的那个砝码是有
瑕疵的;否则,有瑕疵的砝码在下降一侧,每次再将该侧砝码按个数平分,分别放在天平的左、右托盘上,
,直到找出有瑕疵的砝码为止.
(1)记方案一的称量次数为随机变量 ,求 的概率分布;
(2)上述两种方案中,小明应选择何种方案可使称量次数的期望较小?并说明理由.
【答案】(1)分布列见解析;
(2)小明应选择方案一可使称量次数的期望较小,理由见解析.
(1)由题知: ,,
,
分布列为:
1 2 3 4
(2)由(1)知: ,
设方案二的称量次数为随机变量为 ,则 ,
,
,
所以小明应选择方案一可使称量次数的期望较小.
3.(2022·广东·深圳外国语学校高三阶段练习)某市移动公司为了提高服务质量,决定对使用A,B两种
套餐的集团用户进行调查,准备从本市n( )个人数超过1000人的大集团和4个人数低于200人的
小集团中随机抽取若干个集团进行调查,若一次抽取2个集团,全是小集团的概率为 .
(1)在取出的2个集团是同一类集团的情况下,求全为大集团的概率;
(2)若一次抽取3个集团,假设取出小集团的个数为X,求X的分布列和期望.
【答案】(1)
(2)X的分布列见解析,
(1)由题意知共有 个集团,取出2个集团的方法总数是 ,其中全是小集团的情况有 ,故全是
小集团的概率是 ,
整理得到 即 ,解得 .
若2个全是大集团,共有 种情况;
若2个全是小集团,共有 种情况;
故在取出的2个集团是同一类集团的情况下,全为大集团的概率为 .
(2)由题意知,随机变量 的可能取值为 ,计算 , ,
, ,
故 的分布列为:
0 1 2 3
数学期望为 .
4.(2022·全国·高二单元测试)2021年新高考数学试卷中对每道多选题的得分规定:全部选对的得5分,
部分选对的得2分,有选错的得0分.小明在做多选题的第11题、第12题时通常有两种策略:
策略 为避免选错只选出一个最有把握的选项.这种策略每个题耗时约3min.
策略 选出自己认为正确的全部选项.这种策略每个题耗时约6min.
某次数学考试临近,小明通过前期大量模拟训练得出了两种策略下第11题和第12题的作答情况如下:
第11题:如果采用策略 ,选对的概率为0.8,采用策略 ,部分选对的概率为0.5,全部选对的概率为
0.4.
第12题:如果采用策略 ,选对的概率为0.7,采用策略 ,部分选对的概率为0.6,全部选对的概率为
0.3.
如果这两题总用时超过10min,其他题目会因为时间紧张少得2分.假设小明作答两题的结果互不影响.
(1)若小明同学此次考试中决定第11题采用策略 、第12题采用策略 ,设此次考试他第11题和第12题
总得分为 ,求 的分布列.
(2)小明考前设计了以下两种方案:
方案1:第11题采用策略 ,第12题采用策略 ;
方案2:第11题和第12题均采用策略 .
如果你是小明的指导老师,从整张试卷尽可能得分更高的角度出发,你赞成他的哪种方案?并说明理由.
【答案】(1)分布列见解析
(2)赞成小明的方案1,理由见解析
(1)解:设事件 为“第11题得0分”, 为“第11题得2分”, 为“第11题得5分”, 为“第
12题得2分”, 为“第12题得0分”,
所以 , , , , .
由题意可知 的可能取值为 、 、 、 、 ,
,
,,
,
,
所以 的分布列为:
0 2 4 5 7
0.03 0.22 0.35 0.12 0.28
(2)解:设随机变量 为第11题采用策略 的得分, 为第 题采用策略 的得分, 为第12题采用
策略 的得分.
的分布列为
0 2 5
0.1 0.5 0.4
所以 .
的分布列为
0 2
0.3 0.7
所以 .
的分布列为
0 2 5
P 0.1 0.6 0.3
所以 .
若采用方案1,两题总得分均值为 (分),
若采用方案2,两题总得分均值为 (分),
但方案2因时间超过10min,后面的题得分少 分,相当于得分均值为 分.
因为 ,所以我赞成小明的方案1.
5.(2022·全国·高二课时练习)在10件产品中,有3件一等品、4件二等品、3件三等品.
(1)若从这10件产品中任意抽取1件,设抽取到一等品的件数为 ,求 的分布列.
(2)若从这10件产品中随机连续抽取3次,每次抽取1件,每次抽取后都放回,设抽取到一等品的件数为 ,
求 的分布列,
(3)若从这10件产品中随机连续抽取3次,每次抽取1件,每次抽取后都不放回,设抽取到一等品的件数为
X,求①X的分布列;
②抽取到的3件产品中一等品件数多于二等品件数的概率.
【答案】(1)分布列见解析
(2)分布列见解析
(3)①分布列见解析;②
(1)解:由题意知 的可能取值为0,1,所以 服从两点分布,
,则 ,
因此 的分布列为
0 1
P
(2)解:若每次抽取后都放回,则每次抽到一等品的概率均为 ,
3次抽取可以看成3次独立重复试验,因此 ,
它的分布列为 , ,1,2,3,如表:
0 1 2 3
P
(3)①若每次抽取后都不放回,则随机抽取3次可看成随机抽取1次,且1次抽取了3件,
因此一等品件数X服从超几何分布,
所以从10件产品中任意抽取3件,其中恰有m件一等品的概率为 , ,1,2,3.
所以X的分布列为
X 0 1 2 3
P
②设事件 “抽取到的3件产品中一等品件数多于二等品件数”,
“抽取到的3件产品中恰好有1件一等品和2件三等品”,
“抽取到的3件产品中恰好有2件一等品”,“抽取到的3件产品均为一等品”,则事件 , , 彼此互斥,且 .
因为 , , ,
所以 ,
即抽取到的3件产品中一等品件数多于二等品件数的概率为 .
角度2:概率与统计的综合问题
1.(2022·全国·高二课时练习)中国科研团队在研发“新冠疫苗”的过程中,为了测试疫苗的效果,科研
人员以小白鼠为实验对象,进行了一些实验.
(1)实验一:选取10只健康小白鼠,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒
的环境中.实验结果发现,除2号、3号和7号小白鼠仍然感染了新冠病毒,其他小白鼠未被感染.现从
这10只小白鼠中随机抽取4只进行研究,将仍被感染的小白鼠只数记作X,求X的分布列和数学期望.
(2)科研人员在另一个实验中发现,疫苗可多次连续注射,小白鼠多次注射疫苗后,每次注射的疫苗对小白
鼠是否有效互相不影响,相互独立.若将实验一中未感染新冠病毒的小白鼠的频率当做疫苗的有效率,那
么一只小白鼠注射两次疫苗能否保证有效率达到96%?若可以请说明理由;若不可以,请问每支疫苗的有
效率至少要达到多少才能满足以上要求.
【答案】(1)分布列见解析,
(2)每支疫苗的有效率至少要达到0.8才能满足以上要求
(1)因为X的所有可能取值为0,1,2,3,且X服从 的超几何分布,
所以 , ,
, ,
X的分布列如下:
X 0 1 2 3
P
(或 ).
(2)因为实验一中未感染新冠病毒的小白鼠的频率为0.7,所以注射一次疫苗的有效率为0.7.
又每次注射的疫苗对小白鼠是否有效相互独立,所以一只小白鼠注射两次疫苗的有效率为
,
所以注射两次疫苗无法保证有效率达到96%,设每支疫苗有效率至少达到t才能满足要求,则 ,解得 ,
所以每支疫苗的有效率至少要达到0.8才能满足以上要求.
2.(2022·四川绵阳·高二期末(理))某校高一,高二年级的学生参加书法比赛集训,高一年级推荐了4
名男生,2名女生,高二年级推荐了3名男生,5名女生,从参加集训的男生中随机抽取3人,女生中随机
抽取3人组成代表队参加市上比赛.
(1)求高一恰好有1名学生入选代表队的概率;
(2)正式比赛时,从代表队的6名队员中随机抽取2人参赛,设 表示参赛的男生人数,求 的分布列和数
学期望
【答案】(1) ;
(2) 的分布列见解析, .
(1) 从参加集训的男生中随机抽取 人,
女生中随机抽取 人组成代表队的抽取方法数为 ,
代表队中恰好有 名高一学生的抽取方式中,
恰有 名高一学生,若学生为男生,则抽取方法数为 ,
若学生为女生,则抽取方法数为 ,
高一恰好有1名学生入选代表队的概率 ;
(2)依题意得, 的所有可能取值为 ,
则 ,
,
,
的分布了如下:
.
3.(2022·湖南·邵阳市第二中学模拟预测) 年冬季奥林匹克运动会主办城市是北京,北京成为第一
个举办过夏季奥林匹克运动会和冬季奥林匹克运动会以及亚洲运动会三项国际赛事的城市!为迎接冬奥会
的到来,某地很多中小学开展了模拟冬奥会赛事的活动,为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了 所学校进行研究,得到如下数据:
(1)“单板滑雪”与“自由式滑雪”每项参与人数都超过 人的学校可以作为“参与冬奥运动积极学校”,
现在从这 所学校中随机选出 所,记 为选出“参与冬奥运动积极学校”的学校个数,求 的分布列和
数学期望;
(2)现在有一个“单板滑雪”集训营,对“滑行、转弯、跳跃、停止”这 个动作技巧进行集训,且在集训
中进行了多轮测试.规定:在一轮测试中,这 个动作中至少有 个动作达到“优秀”,则该轮测试记为
“优秀”.在集训测试中,小明同学“滑行”这个动作达到“优秀”的概率均为 ,其余每个动作达到
“优秀”的概率都为 ,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得
“优秀”的次数的平均值达到 次,那么理论上至少要进行多少轮测试?
【答案】(1)分布列见解析,期望为
(2) 轮
(1)解:“单板滑雪”与“自由式滑雪”每项参与人数超过 人的学校共 所, 的所有可能取值为 、 、
、 ,
所以 , , , ,
所以 的分布列如下表:
所以 .
(2)解:记“小明同学在一轮测试中要想获得优秀”为事件 ,
,由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布 ,
由题意可得 ,得到 ,因为 ,所以 的最小值为 ,故至少要进行27轮测试.
4.(2022·广东·佛山市第四中学高二期末)一个袋子里装有除颜色以外完全相同的白球和黑球共10个.若
从中不放回地取球,每次取1个球,在第一次取出黑球的条件下,第二次取出白球的概率为 .
(1)求白球和黑球各有多少个;
(2)若有放回地从袋中随机摸出3个球,求恰好摸到2个黑球的概率;
(3)若不放回地从袋中随机摸出2个球,用 表示摸出的黑球个数,求 的分布列和期望.
【答案】(1)白球有4个,黑球有6个
(2)
(3)分布列见解析,
(1)解:设袋中由黑球x个,则白球有10-x个,设取出黑球为事件A,取出白球的事件为B,则
,解得 ,所以白球有4个,黑球有6个;
(2)由(1)知摸出黑球的概率是 ,则有放回地从袋中随机摸出3个球,恰好摸到2个黑球的
概率为 ;
(3) 的可能取值为0,1,2,则 , , , 的
分布列为:
X 0 1 2
P
.
5.(2022·江西·丰城九中高二期末(理))为服务文明城市创建工作,丰城九中校团委暑期计划招募志愿
者,对前来报名者先后进行笔试和面试两个环节测试.笔试共有备选题6道,规定每次测试都从备选题中
随机挑选出4道题进行测试,答对3道或4道题者,直接录用为志愿者,否则进入面试环节;面试共有100
分,面试分只有高于90分者录用为志愿者.已知高一、高二年级学生报名参加测试,在这6道笔试题中,
高一年级学生能答对每道题的概率均为 ,高二年级学生能答对其中的4道;在面试环节,高一、高二学生面试成绩高于90分的概率均为 .
(1)分别求高一年级学生、高二年级学生录用为志愿者的概率;
(2)现有3名高二年级学生参加志愿者选拔,记这3名学生录用为志愿者的人数为 ,求 的分布列及数学
期望.
【答案】(1)高一年级学生录用为志愿者的概率为 ,高二年级学生录用为志愿者的概率为 ;
(2)分布列见解析,
(1)解:设事件 为高二年级学生录用为志愿者,事件 为高一年级学生录用为志愿者.
依题意可得 ,
.
(2)解:依题意可得 ,则 的可能取值为 、 、 、 ,
所以 , ,
, ,
故 的分布列为:
所以 .
6.(2022·福建·漳州市第一外国语学校高二期末)为普及传染病防治知识,增强学生的疾病防范意识,提
高自身保护能力,校委会在全校学生范围内,组织了一次传染病及个人卫生相关知识有奖竞赛(满分100
分),竞赛奖励规则如下:得分在 内的学生获三等奖,得分在 内的学生获二等奖,得分在
内的学生获一等奖,其它学生不得奖.教务处为了解学生对相关知识的掌握情况,随机抽取了100
名学生的竞赛成绩,并以此为样本绘制了如图所示的频率分布表.
竞赛成
绩
人数 6 12 18 34 16 8 6
(1)从该样本中随机抽取2名学生的竞赛成绩,求这2名学生恰有一名学生获奖的概率;(2)若该校所有参赛学生的成绩X近似地服从正态分布 ,若从所有参赛学生中(参赛学生人数大
于10000)随机抽取4名学生进行座谈,设其中竞赛成绩在64分以上的学生人数为 ,求随机变量 的分
布列和数学期望.
【答案】(1)
(2) 的分布列见解析,
(1)由样本频率分布表可知,样本中获一等奖的6人,获二等奖的8人,获三等奖的16人,共30人,则
70人没有获奖,所以从该样本中随机抽取2名学生的竞赛成绩,这2名学生恰有一名学生获奖的概率为
(2)因为该校所有参赛学生的成绩X近似地服从正态分布 ,所以 ,所以 ,
即从所有参赛学生中随机抽取1名学生,该生成绩在64分以上的概率为 ,所以随机变量 ,
所以 ,所以 ,
, , , ,所以
的分布列为
0 1 2 3 4
所以
7.(2022·北京东城·高二期末)毛猴是老北京的传统手工艺品,制作材料都取自中药材,工序大致分为三
步,第一步用蝉蜕做头和四肢;第二步用辛夷做身子:第三步用木通做道具.已知小萌同学在每个环节制作
合格的概率分别为 , , ,只有当每个环节制作都合格时.这件作品才算制作成功,(1)求小萌同学制作一件作品成功的概率;
(2)若小萌同学制作了3件作品,假设每次制作成功与否相互独立.设其中成功的作品数为 .求 的分布列
及期望.
【答案】(1)
(2) 的分布列见解析,
(1)根据题意知,由相互独立事件的概率乘法公式得小萌同学学制作一作品成功的概率 为:
.
(2)根据题意知, 的可能值为: 显然 ,则
所以 的分布列为:
0 1 2 3
的数学期望:
角度3:正态分布的综合问题
1.(2022·湖北武汉·高三开学考试)为应对气候变化,我国计划在2030年前实现碳排放量到达峰值,
2060年前实现“碳中和”.某市为了解本市企业碳排放情况,从本市320家年碳排放量超过2万吨的企业中
随机抽取50家企业进行了调查,得到如下频数分布表,并将年碳排放量大于18万吨的企业确定为“超
标”企业:
硫排放量 [5.5, [8.5, [115, [175,
[2.55.5) [14.5.175) [20.523.5)
X 8.5) 115) 14.5) 20.5)
频数 5 6 9 12 8 6 4
(1)假设该市这320家企业的年碳排放量大致服从正态分布 ,其中 近似为样本平均值 , 近似为样本方差 ,经计算得 , .试估计这320家企业中“超标”企业的家数;
(2)通过研究样本原始数据发现,抽取的50家企业中共有8家“超标”企业,市政府决定对这8家“超标”
企业进行跟踪调查,现计划在这8家“超标”企业中任取5家先进行跟踪调查,设Y为抽到的年碳排放量
至少为20.5万吨的企业家数,求Y的分布列与数学期望.
(参考数据:若X~ ,则 , ,
.)
【答案】(1)51
(2)分布列答案见解析,数学期望:
(1)由已知,得 , ,所以 因为
所以这320家企业中“超标”企业的家数约为51.
(2)由频数分布表可知,8家“超标”企业中碳排放量至少为20.5万吨的企业有4家,所以Y的可能取值
为1,2,3,4,且 所
以Y的分布列为
Y 1 2 3 4
P
所以
2.(2022·福建省福州第一中学高二期末)某共享单车集团为了进行项目优化,对某市月卡用户随机抽取
了200人,统计了他们在同一月的使用次数(假设每月使用次数均在8至36之间).将样本数据分成 ,
, , , , , 七组,绘制成如图所示的频率分布直方图,并用
样本的频率分布估计总体的频率分布.
(1)求图中的a的值;
(2)设该市月卡用户每月使用次数近似服从正态分布 ,其中 近似为样本的平均数(各区间数据用中点值近似计算),取 ,若该城市恰有1万个用户,试估计这些用户中,月使用次数X位于区间
内的人数:
(3)现从该市月卡用户中随机抽取10人,其中月使用次数在 的有Y人,记“事件 ”的概率为
,其中 ,1,2,…,10,当 最大时,求k的值.
参考数据:若随机变量 服从正态分布 ,则 ,
, .
【答案】(1) ;
(2)8400;
(3) .
(1)由 ,解得 ;
(2) ,又 ,
,所以估计1万个用户中,月使用次数
X位于区间 内的人数为8400;
(3)依题意知 ,则 ,其中 ,1,2, ,10,且
, ,当 时, ,则 当
时, ,则 所以当 时, 最大.
3.(2022·广东北江实验学校模拟预测)教育部门最近出台了“双减”政策.即有效减轻义务教育阶段学生
过重作业负担和校外培训负担,持续规范校外培训(包括线上培训和线下培训).“双减”政策的出合对校
外的培训机构经济效益产生了严重影响.某大型校外培训机构为了规避风险,寻求发展制定科学方案,工作
人员对2021年前200名报名学员的消费金额进行了统计整理,其中数据如表.
消费金额(千元)
人数 30 50 60 20 30 10
(1)该大型校外培训机构转型方案之一是将文化科主阵地辅导培训向音体美等兴趣爱好培训转移,为了深入
了解当前学生的兴趣爱好,工作人员利用分层抽样的方法在消费金额为 和 的学员中抽取了5
人,再从这5人中选取3人进行有奖问卷调查,求抽取的3人中消费金额为 的人数的分布列和数学
期望;
(2)以频率估计概率,假设该大型校外培训机构2021年所有学员的消费金额可视为服从正态分布 ,
, 分别为报名前200名学员消费的平均数x以及方差 (同一区间的花费用区间的中点值替代).
①试估计该机构学员2021年消费金额为 的概率(保留一位小数);②若从该机构2021年所有学员中随机抽取4人,记消费金额为 的人数为 ,求 的方差.
参考数据: ;若随机变量 ,则 ,
, .
【答案】(1)X的分布列为:
X 1 2 3
P
;
(2)① .② .
(1)由题意得,抽中的5人中消费金额为 的人数为 ,
消费金额为 的人数为 ,设消费金额为 的人数为X,则 ,
所以 , , ,
所以X的分布列为:
X 1 2 3
P
;
(2)①由题意得 ,
所以 ,
所以 .
②由题意及①得 , , ,所以 .
4.(2022·四川眉山·高二期末(理))某收费APP(手机应用程序)自上架以来,凭借简洁的界面设计、
方便的操作方式和实用的强大功能深得用户喜爱.为回馈市场并扩大用户量,该APP在2022年以竞价形式
做出优惠活动,活动规则如下:①每月1到15日,大家可通过官网提交自己的报价(报价低于原价),但
在报价时间截止之前无法得知其他人的报价和当月参与活动的总人数;②当月竞价时间截止后的第二天,
系统将根据当期优惠名额,按出价从高到低的顺序给相应人员分配优惠名额,获得优惠名额的人的最低出
价即为该APP在当月的下载优惠价,出价不低于优惠价的人将获得数额为原价减去优惠价的优惠券,并可在当月下载该APP时使用.小明拟参加2022年7月份的优惠活动,为了预测最低成交价,他根据网站的公
告统计了今年2到6月参与活动的人数,如下表所示:
时间t(月) 2 3 4 5 6
参与活动的人数y(万人) 0.5 0.6 1 1.4 1.7
(1)若可用线性回归模型拟合参与活动的人数y(单位:万人)与时间t(单位:月)之间的关系,请用最小
二乘法求y关于t的回归方程 ,并预测今年7月参与活动的人数;
(2)某自媒体对200位拟参加今年7月份活动的人进行了一个抽样调查,得到如表所示的频数表:
报价X(单位:
元)
频数 20 60 60 30 20 10
①求这200人的报价X(单位:元)的平均值 和方差 (同一区间的报价用该价格区间的中点值代替);
②假设所有参与活动的人的报价X(单位:元)可视为服从正态分布 ,且 与 可分别由①中所
求的样本平均数 及 估计,若2022年7月计划发放优惠名额数量为3173,请你合理预测该APP在当月
的下载优惠价,并说明理由.
参考公式及数据:①回归方程 , , ;② , ,
;③若随机变量X服从正态分布 ,则 ,
, .
【答案】(1) ,预计今年7月参与活动的人数为 万人;
(2)① , ;② 元.
(1)解:由题意可得 ,
,
又因为 , ,
所以 ,
,所以回归直线方程为: ,
当 时,可得 (万人),
故预计今年7月参与活动的人数为 万人;
(2)解:①依题意可得这200人的报价 (单位:元)的平均值
,
方差
;
②由①可知 ,依题意发放的优惠名额为 张,预测参加的人数为 人,
所以能够得到优惠名额的概率 ,设下载优惠价为 ,则
又 , ,因为 ,
所以 ,
则 ,
所以预测该APP在当月的下载优惠价为 元.
5.(2022·湖南·高二期末)若 ,从X的取值中随机抽取 个数据,记这k个数
据的平均值为Y,则随机变量 以下问题的求解中可以利用这一结论.
根据以往的考试数据,某学校高三年级数学模考成绩 ,设从X的取值中随机抽取25个数据
的平均值为随机变量Y.现在从X的取值中随机抽取25个数据从小到大排列为 ,
, ,其余5个数分别为97,97,98,98,98.
(1)求 的中位数及平均值;
(2)求 .
附:随机变量 服从正态分布 ,则 , ,
.
【答案】(1)中位数为98,平均值为
(2)
(1)解:由已知得,有10个数不超过97,有10个数不低于98,中间的5个数为97,97,98,98,98,
所以 的中位数为98,
进一步由已知得, 的平均值为.
故中位数为98,平均值为 .
(2)解:由题意知 ,即 ,
因为 , ,
所以
. 第二部分:高考真题感悟
1.(2022·全国·高考真题(文))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区
某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量
(单位: ),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积
0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已
知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数 .
【答案】(1) ;
(2)
(3)
(1)样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为 ,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为 ,
又已知树木的材积量与其根部横截面积近似成正比,
可得 ,解之得 .
则该林区这种树木的总材积量估计为
2.(2022·全国·高考真题(文))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公
司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附: ,
0.100 0.050 0.010
2.706 3.841 6.635
【答案】(1)A,B两家公司长途客车准点的概率分别为 , (2)有
(1)根据表中数据,A共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
则 ;
B共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,
则 .
A家公司长途客车准点的概率为 ;
B家公司长途客车准点的概率为 .
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500
= ,
根据临界值表可知,有 的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
3.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分
为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患
该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良
良好
好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该
疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标
为R.
(ⅰ)证明: ;
(ⅱ)利用该调查数据,给出 的估计值,并利用(ⅰ)的结果给出R的估计值.
附 ,0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii) ;
(1)由已知 ,
又 , ,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为 ,
所以
所以 ,
(ii) 由已知 , ,
又 , ,
所以