文档内容
专题 10-2 概率统计(解答题)
目录
专题10-2概率统计(解答题)..............................................................................................................1
.....................................................................................1
题型一:回归直线方程............................................................................................................................1
题型二:非线性回归................................................................................................................................8
题型三:独立性检验..............................................................................................................................18
题型四:超几何分布..............................................................................................................................25
题型五:二项分布..................................................................................................................................35
题型六:正态分布..................................................................................................................................45
题型七:概率综合..................................................................................................................................55
题型八:概率统计与数列......................................................................................................................61
题型九:概率统计与导数......................................................................................................................70
题型一:回归直线方程
【典例分析】
例题1.(2022春·全国·高三校联考阶段练习)已知某绿豆新品种发芽的适宜温度在
6℃~22℃之间,一农学实验室研究人员为研究温度 (℃)与绿豆新品种发芽数 (颗)
之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,
得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合 与 的关系,请用相关系数加以说明;
(2)建立 关于 的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据: , , , .参考公式:相关系数 ,回归直线方程 中斜率和截距的
最小二乘估计公式分别为
, .
【答案】(1)答案见解析;
(2)44.
【详解】(1)由题意可知: .
.又 ,所以相关系数 .
因为相关系数 ,所以 与 的线性相关性较高,可以利用线性回归模型拟合 与
的关系.
(2)由(1)知 , , , .
所以 ,
所以 .
所以 与 的回归直线为 .
当 时, .即在19℃的温度下,种子发芽的颗数为44.
例题2.(2022春·陕西·高三陕西省榆林中学校联考阶段练习)随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们
喜爱.某新能源汽车销售企业在2017年至2021年的销售量 (单位:万辆)数据如下表:
年份 2017年 2018年 2019年 2020年 2021年
年份代号 1 2 3 4 5
销售量 (万辆) 75 84 93 98 100
(1)请用相关系数判断 关于 的线性相关程度(参考:若 ,则线性相关程度
一般,若 ,则线性相关程度较高,计算 时精确到小数点后两位);
(2)求出 关于 的线性回归方程,并预计2022年该新能源汽车企业的销售量为多少万辆?
参考数据: , ,
附:相关系数 ,回归直线方程的斜率 ,截
距
【答案】(1) 与 有很强的线性相关性;
(2) ,109.2万辆.
【详解】(1)解:由表中数据可得 , ,∴ ,
又 , ,
∴ ,
所以 与 有很强的线性相关性;(2)解:由表中数据可得 ,
则 ,
∴ ,
又2022年对应的代号为6,故 ,
由此预计2022年该新能源汽车企业的销售量为109.2万辆.
【提分秘籍】
回归直线方程过样本点的中心 ,是回归直线方程最常用的一个特征;
我们将 称为 关于 的线性回归方程,也称经验回归函数或经验回归公式,
其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的
,叫做 , 的最小二乘估计,其中 称为回归系数,它实际上也就是经验回归直线的
斜率, 为截距.
其中
【变式演练】
1.(2022·青海西宁·湟川中学校考一模)某电子产品生产商经理从众多平板电脑中随机抽
取6台,检测它们充满电后的工作时长(单位:分钟),相关数据如下表所示.
平板电脑序号 1 2 3 4 5 6
工作时长/分 220 180 210 220 200 230
(1)从被抽中的6台平板电脑中随机抽出2台,设抽出的2台平板电脑充满电后工作时长小
于210分钟的台数为 ,求随机变量 的分布列及数学期望;
(2)下表是一台平板电脑的使用次数与当次充满电后工作时长的相关数据.求该平板电脑工作时长 与使用次数 之间的回归直线方程,并估计该平板电脑使用第200次时充满电后
的工作时长.
12
使用次数 /次 20 40 60 80 100 140
0
20 18
工作时长 /分 210 206 196 191 186
2 8
附: , , .
【答案】(1)分布列见解析,数学期望为
(2) ,估计该平板电脑使用第200次时充满电后的工作时长为171.5分钟
【详解】(1)(1)由题意可知,X可能取值为0,1,2,则
, , .
则随机变量X的分布列为
X 0 1 2
P
数学期望为 .
(2) ,
, ,故
,所以线性回归方程为 ,
当 时, ,
所以估计该平板电脑使用第200次时充满电后的工作时长为171.5分钟.
2.(2022春·河南·高三信阳高中校联考期末)随着电池充电技术的逐渐成熟,以锂电池为
动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工
作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电
动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研
发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,
如下图:
2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)
(1)根据条形统计图中数据,计算该公司研发人数 与年份代码 的相关系数 ,并由此判
断其相关性的强弱;
(2)试求出 关于 的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)
参考数据: , .参考公式:相关系数
.线性回归方程的斜率 ,截距 .
附:相关性 弱 一般 强
【答案】(1) , 与 具有很强的线性相关关系
(2) ,预测2023年该公司的研发人数约为613人
【详解】(1)由条形统计图,得 ,
,
所以
,
.
所以 .
因为相关系数 ,所以 与 具有很强的线性相关关系,且为正相关.
(2) ,
所以 ,
所以 .
由题意知,2023年对应的年份代码 ,
当 时, ,
故预测2023年该公司的研发人数约为613人.题型二:非线性回归
【典例分析】
例题1.(2022·黑龙江哈尔滨·哈师大附中校考三模)为了构筑“绿色长城”,我国开
展广泛的全民义务植树活动,有力推动了生态状况的改善.森林植被状况的改善,不仅美化
了家园,减轻了水土流失和风沙对农田的危害,而且还有效提高了森林生态系统的储碳能
力.某地区统计了2011年到2020年十年中每年人工植树成活数 ( ,2,3,…,10)
(单位:千棵),用年份代码 ( ,2,3,…,10)表示2011年,2012年,2013年,
…,2020年,得到下面的散点图:
对数据进行回归分析发现,有两个不同的回归模型可以选择,模型一: ,模型
二; ,其中 是自然对数的底数.
(1)根据散点图,判断所给哪个模型更适宜作为每年人工植树成活数 与年份代码 相关关
系的回归分析模型(给出判断即可,不必说明理由);
(2)根据(1)中选定的模型,求出 关于 的回归方程;
(3)利用(2)中所求回归方程,预测从哪一年开始每年人工植树成活棵数能够超过5万棵?
附:对于一组数据 , , , ,其回归直线 的斜率和截距
的最小二乘估计公式分别为: , .参考数据: ,
, ,设 ( ,2,3,…,10), , ,
, .
【答案】(1)模型二(2)
(3) 年
(1)
根据散点图可知,呈指数式增长,故应选模型二 ,其中 是自然对数的底数;
(2)
由已知 得,两边同时取对数可得 ,
令 ,则 ,
由 , , , 可知,
,
,
∴ ,∴ ;
(3)
令 ,即 ,
解得 ,预测从 年开始人工植树成活棵树能超过 万棵.
例题2.(2022·安徽·安徽省含山中学校联考三模)2020年新冠肺炎疫情突如其来,在
党中央的号召下,应对疫情,我国采取特殊的就业政策、经济政策很好地稳住了经济社会
发展大局.在全世界范围内,我国疫情控制效果最好,经济复苏最快.某汽车销售公司
2021年经济收入在短期内逐月攀升,该公司在第1月份至6月份的销售收入 (单位:百
万元)关于月份 的数据如表:
时间(月份) 1 2 3 4 5 6
收入(百万元) 6.6 8.6 16.1 21.6 33.0 41.0根据以上数据绘制散点图,如图所示.
(1)根据散点图判断, 与 ( , , , 均为常数)哪一个适宜作为该
公司销售收入 关于月份 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中数据,求出 关于 的回归方程,并预测该公司8月份的销售
收入.(结果近似到小数点后第二位)
参考数据:
3.50 21.15 2.85 17.50 125.35 6.73
其中设
参考公式和数据:对于一组具有线性相关关系的数据 ,其回归直线
的解率和截距的最小二乘法估计公式分别为: ,
.
【答案】(1)用 表示更合适(2) ,95.58百万元
(1)
解: ,散点图中点的分布不是一条直线,相邻两点在y轴上差距是增大的趋势,
故用 表示更合适;
(2)
解:由 ,得 ,
设 ,
∴ ,
∵ , ,
∴ ,
,
∴ ,
即 ,则回归方程为 ,
预测该公司8月份的销售收入 百万元.
【提分秘籍】
非线性回归最重要的方法就是通过换元,将非线性问题,转化为线性问题求解;
换元后注意代入数据不要出错。
【变式演练】
1.(2022春·湖北襄阳·高三襄阳五中校考阶段练习)多年来,清华大学电子工程系黄翔东
教授团队致力于光谱成像芯片的研究,2022年6月研制出国际首款实时超光谱成像芯片,
相比已有光谱检测技术,实现了从单点光谱仪到超光谱成像芯片的跨越,为制定下一年的
研发投入计划,该研发团队为需要了解年研发资金投入量x(单位:亿元)对年销售额
(单位:亿元)的影响,结合近12年的年研发资金投入量x,和年销售额 ,的数据(,2, ,12),该团队建立了两个函数模型:① ② ,其中
均为常数,e为自然对数的底数,经对历史数据的初步处理,得到散点图如图,令
,计算得如下数据:
20 66 770 200 14
460 3125000 21500
(1)设 和 的相关系数为 和 的相关系数为 ,请从相关系数的角度,选择一
个拟合程度更好的模型;
(2)(i)根据(1)的选择及表中数据,建立 关于 的回归方程(系数精确到0.01);
(ii)若下一年销售额 需达到80亿元,预测下一年的研发资金投入量 是多少亿元?
附:①相关系数 ,回归直线 中斜率和截距的最小二乘
估计公式分别为: , ;
②参考数据: .【答案】(1)模型 的拟合程度更好
(2)(i) (ii)预测下一年的研发资金投入量是 亿元
【详解】(1)由题意进行数据分析:
则 ,因此从相关系数的角度,模型 的拟合程度更好
(2)(i)先建立 关于 的线性回归方程.
由 ,得 ,即 .
由于
所以 关于 的线性回归方程为 ,
所以 ,则 .
(ii)下一年销售额 需达到80亿元,即 ,代入 得, ,
又
所以 ,解得 ,
所以预测下一年的研发资金投入量是 亿元
2.(2022春·福建三明·高三三明一中校考期中)近年来,美国方面滥用国家力量,不择手
段打压中国高科技企业,随着贸易战的不断升级,中国某科技公司为了不让外国“卡脖
子”,决定在企业预算中减少宣传广告预算,增加对技术研究和人才培养的投入,下表是的连续7年研发投入x和公司年利润y的观测数据,根据绘制的散点图决定用回归模型:
来进行拟合.
表I
研发投入 (亿
20 22 25 27 29 31 35
元)
年利润 (亿元) 7 11 21 24 65 114 325
表II(注:表中 )
189 567 162 78106
3040
(1)请借助表II中的数据,求出回归模型的方程;(精确到0.01)
(2)试求研发投入为20亿元时年利润的残差.
参考数据: ,附:回归方程中 和
,残差
【答案】(1)
(2)
【详解】(1)由 得 ,令 ,得 ,由表II数据可得:
, .
所以回归方程为: .
(2)在 时的残差: .
3.(2022·全国·高三专题练习)某生物研究所为研究某种昆虫的产卵数 和温度 的
关系,经过一段时间观察,收集到如下数据:
产卵数
以该种昆虫的产卵数 和温度 为变量,作出如图所示的散点图,现分别用模型①
与模型② 进行分析.
(1)请利用模型② 建立两个变量之间的函数关系式(系数保留两位小数);
(2)已知模型①的回归直线方程为 ,模型②的样本相关系数 ,请根据
相关系数判断哪个模型的拟合效果更好;
(3)该种昆虫的防治以喷洒杀虫剂为主,其防治成本 与温度 和产卵数 的关系为,用(2)中得出的拟合效果最好的模型计算,当温度 (
取整数)为何值时,昆虫的防治成本的预估值最小?
附:对于一组数据 、 、…、 ,其回归直线 的斜率和截距的
最小二乘估计分别为 , ,样本相关系数
.
参考数据: , ,设 ,则 ,
.
【答案】(1)
(2)模型②的拟合效果更好
(3)
(1)
解:已知 ,则 , ,
则 , ,
所以,模型②的回归方程为 .
(2)
解:已知模型①的回归直线方程为 ,则 ,
所以, ,
所以,模型①的样本相关系数 ,
所以,模型②的拟合效果更好.
(3)
解:该种昆虫的防治成本:
,
当 时,防治成本的预估值最小.
题型三:独立性检验
【典例分析】
例题1.(2022春·安徽·高三校联考阶段练习)近年来中年人的亚健康问题日趋严重,
引起了政府部门和社会各界的高度关切.一研究机构为了解亚健康与锻炼时间的关系,对某
地区的中年人随机调查了 人,得到如下数据:
平均每天锻炼时间 不足半小时 半小时到 小时(含半小时) 小时及以上
亚健康
无亚健康
(1)从这些中年人中任选 人,记 “该中年人亚健康”, “该中年人平均每天锻炼
时间不足半小时”,分别求 和 ;
(2)完成下面的列联表,根据小概率值 的独立性检验,能否认为亚健康与锻炼时间
有关联?平均每天锻炼时间 不足 小时 小时及以上 合计
亚健康
无亚健康
合计
附: , .
【答案】(1) ,
(2)列联表见解析;可以认为亚健康与锻炼时间有关联
【详解】(1)由题意知:中年人亚健康且平均每天锻炼时间不足半小时的人数为 人,
则 ;
中年人无亚健康且平均每天锻炼时间超过半小时(含半小时)的人数为 人,平均每天
锻炼时间超过半小时(含半小时)的人数为 人,
, , .
(2)由已知数据可得列联表如下:
平均每天锻炼时
不足 小时 小时及以上 合计
间
亚健康
无亚健康合计
零假设 :亚健康与锻炼时间无关,
,
依据小概率值 的 独立性检验,我们推断 不成立,即可以认为亚健康与锻炼
时间有关联,该推断犯错误的概率不超过 .
例题2.(2022春·江苏徐州·高三期末)某棉纺厂为了解一批棉花的质量,在该批棉花
中随机抽取了容量为120的样本,测量每个样本棉花的纤维长度(单位:mm,纤维长度是
棉花质量的重要指标),所得数据均在区间 内,将其按组距为2分组,制作成如图
所示的频率分布直方图,其中纤维长度不小于28mm的棉花为优质棉.
(1)求频率分布直方图中 的值;
(2)已知抽取的容量为120的样本棉花产自于 , 两个试验区,部分数据如下2×2列联
表:
试验区 试验区 合计
优质棉 10
非优质棉 30
合计 120将2×2列联表补充完整,并判断是否有99.9%的把握认为优质棉与 , 两个试验区有关
系;
注:①独立性检验的临界值表:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
② ,其中 .
【答案】(1)
(2)列联表见解析,没有99.9%的把握认为优质棉与A,B两个试验区有关系;
【详解】(1)由 ,解得
(2)抽取的优质棉样本数为
则非优质棉样本数为90,
则2×2列联表如下:
A试验区 B试验区 合计
优质棉 10 20 30
非优质棉 60 30 90
合计 70 50 120
则没有99.9%的把握认为优质棉与A,B两个试验区有关系.
【变式演练】
1.(2022·陕西汉中·统考一模)某企业为响应国家在《“十四五”工业绿色发展规划》中
提出的“推动绿色发展,促进人与自然和谐共生”的号召,推进产业结构高端化转型,决
定开始投入生产某新能源配件.该企业初步用甲、乙两种工艺进行试产,为了解两种工艺生产新能源配件的质量情况,从两种工艺生产的产品中分别随机抽取了 件进行质量检测,
得到下图所示的频率分布直方图,规定质量等级包含合格和优等两个等级,综合得分在
的是合格品,得分在 的是优等品.
(1)从这100件甲工艺所生产的新能源配件中按质量等级分层抽样抽取5件,再从这5件中
随机抽取2件做进一步研究,求恰有1件质量等级为优等品的概率;
(2)根据频率分布直方图完成下面的 列联表,并判断是否有 的把握认为新能源配件
的质量等级与生产工艺有关?该企业计划大规模生产这种新能源配件,若你是该企业的决
策者,你会如何安排生产,为什么?
优等
合格品 合计
品
甲生产工艺
乙生产工艺
总计
附: ,其中 .
【答案】(1)(2)列联表答案见解析,有 的把握认为配件的质量和生产工艺有关,选择甲工艺生产新
能源配件,理由见解析
【详解】(1)由甲工艺频率分布直方图可知,合格品、优等品出现的频率分别为
和 ,
所以按分层抽样抽取的5个配件中,有合格品2个、优等品3个,
所以从5个中随机抽取2个,恰有1个质量等级为优等品的概率为:
.
(2)甲生产工艺生产的合格品有 件,优等品有 件,
乙生产工艺生产的合格品有 件,优等品有
件,
所以 列联表为:
优等
合格品 总计
品
甲生产工艺 40 60 100
乙生产工艺 55 45 100
总计 95 105 200
所以
由于 ,所以有 的把握认为配件的质量和生产工艺有关.
应该选择甲工艺生产新能源配件,因为甲的优等品率为 ,乙的优等品率仅为 .
2.(2022·四川广安·广安二中校考模拟预测)第24届冬季奥运会将于2022年2月4日在
北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运
会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为 ,
统计得到以下2×2列联表,经过计算可得 .男生 女生 合计
了解
不了解
合计
(1)求 的值,并判断有多大的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;
(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥
运会项目的学生中随机抽取6人,再从这6人中抽取2人进行面对面交流,“至少抽到一
名男生”的概率;
附表:
0.10 0.05 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
附:
【答案】(1) ,有99%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关.
(2)
【详解】(1)解:由题知:2×2列联表完善如下:
男生 女生 合计
了解
不了解
合计
所以, ,解得 ,所以, ,有99%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关.
(2)解:由题知, ,抽样比为 ,
所以,不了解学生中,男生应抽取 人,分别记为 ;女生应抽取
人,分别记为 ;
所以,这6人中抽取2人进行面对面交流,可能的情况有:
,共15种,
其中,至少抽到一名男生的情况有 共9种情况,
所以,“至少抽到一名男生”的概率为
题型四:超几何分布
【典例分析】
例题1.(2022春·河北衡水·高三校联考阶段练习)随着人们生活水平的提高,国家倡
导绿色安全消费,菜篮子工程从数量保障型转向质量效益型.为了测试甲、乙两种不同有机
肥料的使用效果,某科研单位用西红柿做了对比实验,分别在两片实验区各摘取100个,
对其质量的某项指标值进行检测,质量指数值达到35及以上的为“质量优等”,由测量结
果绘成如下频率分布直方图.其中质量指数值分组区间是: , , ,
, .
(1)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“质量优等”与使
用不同的肥料有关;甲有机肥料 乙有机肥料 合计
质量优等
质量非优等
合计
(2)在摘取的用乙种有机肥料的西红柿中,从“质量优等”中随机选取2个,记区间
中含有的个数为 ,求 的分布列及数学期望.
附: .
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,有99.9%的把握认为,“质量优等”与使用不同的肥料有关
(2)分布列见解析,
(1)
解:由题意可得 列联表为:
甲有机肥
乙有机肥料 合计
料
质量优等 60 30 90
质量非优等 40 70 110
合计 100 100 200
则 .所以有99.9%的把握认为“质量优等”与使用不同的肥料有关.
(2)
由频率分布直方图可得“质量优等”有30个,区间 中含有10个,
随机变量 的可能取值有0,1,2,
, , ,
随机变量 的分布列如下:
0 1 2
.
例题2.(2022春·江苏镇江·高三校考开学考试)为了研究高三年级学生的性别与体重
是否超过55kg的关联性,某机构调查了某中学所有高三年级的学生,整理得到如下列联表.
体重
性别 合计
超过55kg 不超过kg
男 180 120 300
女 90 110 200
合计 270 230 500
参考公式和数据:
,(1)依据小概率值 的独立性检验,能否认为该中学高三年级学生的性别与体重有
关联?
(2)按性别采用分层随机抽样的方式在该中学高三年级体重超过55kg的学生中抽取9人,
再从这9人中任意选取3人,记选中的女生数为 ,求 的分布列与期望.
【答案】(1)认为该中学高三年级学生的性别与体重有关联,此推断犯错误的概率不大于
0.001
(2)分布列见解析;期望为1
(1)
假设为 :该中学高三年级学生的性别与体重无关联,
根据列联表中的数据,经计算得到
,
根据小概率值 的独立性检验,推断 不成立,即认为该中学高三年级学生的性
别与体重有关联,此推断犯错误的概率不大于0.001.
(2)
依题意,抽取的9人中,男生有 人,女生有 人,
从中任意选取3人,X的取值可能为0,1,2,3,
且 , , ,
.
则X的分布列为
X 0 1 2 3P
故 .
【提分秘籍】
一般地,假设一批产品共有 件,其中有 件次品,从 件产品中随机抽取 件
(不放回),用 表示抽取的 件产品中的次品数,则 的分布列为
, .
其中 , , , , .
如果随机变量 的分布列具有上式的形式,那么称随机变量 服从超几何分布.
【变式演练】
1.(2022春·江苏苏州·高三苏州中学校联考阶段练习)文化月活动中,某班级在宣传栏贴
出标语“学好数学好”,可以不同断句产生不同意思,“学/好数学/好”指要学好的数学,
“学好/数学/好”强调数学学习的重要性,假设一段时间后,随机有 个字脱落.
(1)若 ,用随机变量 表示脱落的字中“学”的个数,求随机变量 的分布列及期望;
(2)若 ,假设某同学检起后随机贴回,求标语恢复原样的概率.
【答案】(1)分布列见解析,
(2)0.6
【详解】(1)方法一:
随机变量X的可能取值为0,1,2,
, , ,
随机变量X的分布列如下表:
X 0 1 2P
随机变量X的期望为
法二:
随机变量X服从超几何分布 ,所以 .
(2)设脱落一个“学”为事件 ,脱落一个“好”为事件 ,脱落一个“数”为事件 ,
事件 为脱落两个字 ,
, ,
, , ,
所以某同学捡起后随机贴回,标语恢复原样的概率为
,
法二:
掉下的两个字不同的概率为 ,
所以标语恢复原样的概率为 .
2.(2022春·福建福州·高三福建省福州第一中学校考阶段练习)班主任为了对本班学生的
考试成绩进行分析,决定从本班 名女同学, 名男同学中随机抽取一个容量为 的样本
进行分析.
(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算
出结果)
(2)如果随机抽取的 名同学的数学,物理成绩(单位:分)对应如下表:学生序
1 2 3 4 5 6 7
号i
数学成
60 65 70 75 85 87 90
绩
物理成
70 77 80 85 90 86 93
绩
(i)若规定 分以上(包括 分)为优秀,从这 名同学中抽取 名同学,记 名同学中
数学和物理成绩均为优秀的人数为 ,求 的分布列和数学期望;(结果用最简分数表
示)
(ii)根据上表数据,求物理成绩 关于数学成绩 的线性回归方程(系数精确到 );
若班上某位同学的数学成绩为 分,预测该同学的物理成绩为多少分?
附:线性回归方程 ,
其中 , .
76 83 812 526
【答案】(1)
(2)(i)分布列见解析,期望为 ;(ii) , .
(1)
依据分层抽样的方法,24名女同学中应抽取的人数为 名,
18名男同学中应抽取的人数为 名,故不同的样本的个数为 .
(2)
(ⅰ) 名同学中数学和物理成绩均为优秀的人数为3名,
的取值为0,1,2,3.
, , , ,
的分布列为
0 1 2 3
.
(ⅱ)解: , .
线性回归方程为
当 时, .
可预测该同学的物理成绩为96分.
3.(2022春·四川内江·高三威远中学校校考阶段练习)已知某校高三进行第一次摸底考试,
从全校选考地理的高三学生中,随机抽取 100 名学生的地理成绩制成如图所示的频率分布
直方图,满分为 100 分,其中 80 分及以上为优秀,其他为一般.已知成绩优秀的学生中
男生有 10 名,成绩一般的学生中男生有 40 名,得到如下的 列联表.
考试成绩
性别 合计
优秀 一般男生 10 40
女生
合计
(1)根据上述数据,完成上面 列联表,并依据小概率值 的独立性检验,分析
“考试成绩优秀”与 “性别” 是否有关?
(2)从考试成绩在 中,利用分层随机抽样抽取7名学生进行学习方法经验介
绍,从抽取的学生中,再确定3名学生做学习经验的介绍,则抽取的3名学生中,考试成
绩在 的学生数为 ,求 的分布列与数学期望.
参考公式: ,(其中 )
0.10 0.05 0.010 0.001
2.706 3.841 6.635 10.828
【答案】(1)列联表见解析,“考试成绩优秀”与 “性别”无关
(2)分布列见解析,
(1)
根据频率分布直方图可得考试成绩优秀的总人数为 ,其中女生的人数为18,考试成绩一般的人数为72,其中女生的人数为 ,
则 列联表为
考试成绩
性别 合计
优秀 一般
男生 10 40 50
女生 18 32 50
合计 28 72 100
零假设 :考试成绩优秀与性别无关.
,
根据小概率值 的独立性检验,没有充分证据推断 不成立,
即认为“考试成绩优秀”与“性别”无关.
(2)
根据频率分布直方图可得考试成绩在 的学生人数分别为20,8,
利用分层随机抽样抽取7名学生中的成绩在 的人数分别为5,2,
则 的所有可能取值为0,1,2,
则 ,
则 的分布列为
0 1 2
P∴ .
题型五:二项分布
【典例分析】
例题1.(2022·云南昆明·高三昆明一中校考阶段练习)2022年,某省启动高考综合改
革,改革后,不再分文理科,改为采用是“ ”模式,“3”是语文、外语、数学三
科必考,“1”是在物理与历史两科中选择一科,“2”是在化学,生物,政治,地理四科
中选择两科作为高考科目,某学校为做好选课走班教学,给出三种可供选择的组合进行模
拟选课,其中 组合:物理、化学、生物, 组合:历史、政治、地理, 组合:物理、
化学、地理.根据选课数据得到,选择 组合的概率为 ,选择 组合的概率为 ,选择
组合的概率为 ,甲、乙、丙三位同学每人选课是相互独立的.
(1)求这三位同学恰好有两位同学选择相同组合的概率.
(2)记 表示这三人中选择含地理的组合的人数,求 的分布列及数学期望.
【答案】(1)
(2)分布列见解析, .
【详解】(1)解:用 表示第i位同学选择A组合,用 表示第i位同学选择B组合,用
表示第i位同学选择C组合, .
由题意可知, 互相独立,
且 .
故三位同学恰好有两位同学选择组合 的概率为 .
三位同学恰好有两位同学选择组合 的概率为 .三位同学恰好有两位同学选择组合 的概率为
所以这三位同学恰好有两位同学选择相同组合的概率为: .
(2)选择含地理的组合的概率为 ,
由题意知 的所有可能取值为0,1,2,3,
且 ,
所以 ,
,
,
,
所以 的分布列为
0 1 2 3
P
所以 .
例题2.(2022春·重庆沙坪坝·高三重庆市凤鸣山中学校考期中)伴随经济的飞速发展,
中国全民健身赛事活动日益丰富,公共服务体系日趋完善.据相关统计数据显示,中国经常
参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数
比例达到90%以上.健身之于个人是一种自然而然的习惯,之于国家与民族,则是全民健康
的基础柱石之一,某市一健身连锁机构对去年的参与了该连锁机构健身的会员进行了统计,
制作成如下两个统计图,图1为该健身连锁机构会员年龄等级分布图,图2为一个月内会员到健身连锁机构频数分布扇形图
若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以
上)两类,将一月内来健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的
会员称为“健身爱好者”,且已知在“健身达人”中有 是“年轻人”.
(1)现从该健身连锁机构会员中随机抽取一个容量为100人的样本,根据上图的数据,补全
下方 列联表,并判断依据小概率值 的独立性检验,能否认为是否为“健身达
人”与年龄有关;
类别 年轻人 非年轻人 合计
健身达人
健身爱好者
合计 100
临界值表:
(2)将(1)中的频率作为概率,连锁机构随机选取会员进行回访,抽取3人回访.①若选到的3人中2人为“年轻人”,1人为“非年轻人”,再从这3人中随机选取的1人,
了解到该会员是“健身达人”,求该人为非年轻人的概率;
②设3人中既是“年轻人”又是“健身达人”的人数为随机变量 ,求 的分布列和期
望值.
【答案】(1)列联表答案见解析,不能认为“健身达人”与年龄有关
(2)① ;②分布列答案见解析,数学期望:
【详解】(1)根据年轻人标准结合图1可得年轻人占比为80%,则年轻人人数为
,则非年轻人为20人,根据图2表格得健身达人所占比60%,所以其人数为
,根据其中年轻人占比 ,所以健身达人中年轻人人数为 ,则非年
轻人为10人;
健身爱好者人数为 ,再通过总共年轻人合计为80人,则健身爱好者中年轻人
人数为 ,3根据非年轻人总共为20人,则健身爱好者中非年轻人人数为
,具体表格填写如下.
列联表为
年轻
类别 非年轻人 合计
人
健身达人 50 10 60
健身爱好者 30 10 40
合计 80 20 100
零假设 ,是否为“健身达人”与年龄无关.
所以,依据 的独立性检验,不能认为“健身达人”与年龄有关;
(2)①设事件 为:该人为年轻人,事件 为:该人为健身达人,故此人为“非年轻人”的概率为则
②由(1)知,既是年轻人又是健身达人的概率为 ,
,
故X的分布列:
0 1 2 3
的数学期望值
.
【提分秘籍】
一般地,在 重伯努利试验中,设每次试验中事件 发生的概率为 ( ),用
表 示 事 件 发 生 的 次 数 , 则 的 分 布 列 为 ,
.
如果随机变量 的分布列具有上式的形式,则称随机变量 服从二项分布,记作
.【变式演练】
1.(2022·江苏苏州·苏州中学校考模拟预测)随着人脸识别技术的发展,“刷脸支付”成
为了一种便捷的支付方式,但是这种支付方式也带来了一些安全性问题.为了调查不同年
龄层的人对“刷脸支付”所持的态度,研究人员随机抽取了300人,并将所得结果统计如
下表所示.
年龄
频数 30 75 105 60 30
持支持态度 24 66 90 42 18
(1)完成下列2×2列联表,并判断是否有99.9%的把握认为年龄与所持态度具有相关性;
年龄在50周岁以上(含50周
年龄在50周岁以下 总计
岁)
持支持态度
不持支持态度
总计
(2)以(1)中的频率估计概率,若在该地区所有年龄在50周岁以上(含50周岁)的人中随
机抽取4人,记X为4人中持支持态度的人数,求X的分布列以及数学期望;
(3)已知某地区“万嘉”连锁超市在安装了“刷脸支付”仪器后,使用“刷脸支付”的人数
y与第x天之间的关系统计如下表所示,且数据的散点图呈现出很强的线性相关的特征,请
根据表中的数据用最小二乘法求y与x的回归直线方程 .
i 1 2 3 4 5 6 7
2 4 8 12 22 26 38
第 天
使用人数
参考数据: , .0.050 0.010 0.001
k 3.841 6.635 10.828
参考公式: , , .
【答案】(1)表格见解析,有
(2)分布列见解析,
(3) .
【详解】(1)完成列联表如下:
年龄在50周岁以上(含50周
年龄在50周岁以下 总计
岁)
持支持态度 60 180 240
不持支持态度 30 30 60
总计 90 210 300
故本次实验中 的观测值 ,
故有99.9%的把握认为年龄与所持态度具有相关性;
(2)依题意, ,
故 , ,
, ,;
故X的分布列为:
X 0 1 2 3 4
P
故 ;
(3)依题意, , ,由 得 ,
,
所以 .
故y关于x的线性回归方程是 .
2.(2022春·湖南湘潭·高三湘潭一中校考期中) 年 月 日是中国传统二十四节气
“立秋”,该日,“秋天的第一杯奶茶”再度出圈,据此,学校社会实践小组随机调查了
该地区 位奶茶爱好者的年龄,得到如下样本数据频率分布直方图.(1)估计奶茶爱好者的平均年龄;(同一组数据用该区间的中点值作代表)
(2)估计奶茶爱好者年龄位于区间 的概率;
(3)以频率替代概率进行计算,若从该地区所有奶茶爱好者中任选 人,求 人中年龄在
岁以下的人数 的分布列和期望.
【答案】(1) 岁
(2)
(3)分布列见解析,数学期望为
【详解】(1)由频率分布直方图估计奶茶爱好者的平均年龄为:
(岁).
(2)由频率分布直方图得:奶茶爱好者年龄位于区间 的频率为
,
由频率估计概率可知:奶茶爱好者年龄位于区间 的概率为 .
(3)由频率分布直方图得:从该地区所有奶茶爱好者中任选 人,年龄在 岁以下的概率
为 , ;
则 所有可能的取值为 ,
; ; ;
;
的分布列为:则数学期望 .
3.(2022春·甘肃兰州·高三兰州西北中学校考期中)为丰富学生的校园生活,提升学生的
实践能力和综合素质能力,培养学生的兴趣爱好,某校计划借课后托管服务平台开设书法
兴趣班.为了解学生对这个兴趣班的喜欢情况,该校随机抽取了本校100名学生,调查他
们对这个兴趣班的喜欢情况,得到数据如下:
喜爱 不喜爱 合计
男 40 20 60
女 30 10 40
合计 70 30 100
以调查得到的男、女学生喜欢书法兴趣班的频率代替概率.
(1)从该校随机抽取1名男学生和1名女学生,求这2名学生中恰有1人喜欢书法兴趣班的
概率;
(2)从该校随机抽取4名女学生,记X为喜欢书法兴趣班的女生人数,求X的分布列与期望.
【答案】(1)
(2)分布列见解析,期望为3.
【详解】(1)从男生中抽取1名学生,喜欢书法兴趣班的概率为 ,从女生中抽
取1名学生,喜欢书法兴趣班的概率为 ,
恰有一人喜欢书法兴趣班分为男生喜欢女生不喜欢和男生不喜欢女生喜欢两类,
所以所求概率为 ;
(2)从女生中抽取1名学生,喜欢书法兴趣班的概率为 ,
由题意 的值分别为0,1,2,3,4, ,, ,
, ,
,
的分布列为:
0 1 2 3 4
.
题型六:正态分布
【典例分析】
例题1.(2022·全国·高三专题练习)十九大以来,某贫困地区扶贫办积极贯彻落实国
家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的奋力拼搏,
新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入力争早日脱贫
的工作计划,该地扶贫办统计了 年 位农民的年收入并制成如下频率分布直方图:
(1)根据频率分布直方图,估计 位农民的年平均收入 (单位:千元)(同一组数据用
该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民收入 服从正态分布 ,其中
近似为年平均收入 , 近似为样本方差 ,经计算得 ,利用该正态分布,求:
①在扶贫攻坚工作中,若使该地区约有 的农民的年收入不低于扶贫办制定的最低年
收入标准,则最低年收入大约为多少千元?
②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了 位农民.
若每位农民的年收入互相独立,这 位农民中的年收入不少于 千元的人数为 ,求
.
附参考数据:① ,②若随机变量 服从正态分布 ,则
, .
【答案】(1)
(2)① 千元;②
(1)
解:由频率分布直方图可知, 位农民的年平均收入为
(千元).
(2)
解:由题意知 ,
① ,
所以 时,满足题意,即最低年收入大约为 千元;
②由 ,
则 ,
每个农民的年收入不少于 千元的事件的概率为 ,
则 , .例题2.(2022·全国·高三专题练习)某收费APP(手机应用程序)自上架以来,凭借简
洁的界面设计、方便的操作方式和实用的强大功能深得用户喜爱.为回馈市场并扩大用户量,
该APP在2022年以竞价形式做出优惠活动,活动规则如下:①每月1到15日,大家可通
过官网提交自己的报价(报价低于原价),但在报价时间截止之前无法得知其他人的报价
和当月参与活动的总人数;②当月竞价时间截止后的第二天,系统将根据当期优惠名额,
按出价从高到低的顺序给相应人员分配优惠名额,获得优惠名额的人的最低出价即为该
APP在当月的下载优惠价,出价不低于优惠价的人将获得数额为原价减去优惠价的优惠券,
并可在当月下载该APP时使用.小明拟参加2022年7月份的优惠活动,为了预测最低成交
价,他根据网站的公告统计了今年2到6月参与活动的人数,如下表所示:
时间 (月) 2 3 4 5 6
参与活动的人数 (万人) 0.5 0.6 1 1.4 1.7
(1)若可用线性回归模型拟合参与活动的人数 (单位:万人)与时间t(单位:月)之间
的关系,请用最小二乘法求 关于 的回归方程 ,并预测今年7月参与活动的人
数;
(2)某自媒体对200位拟参加今年7月份活动的人进行了一个抽样调查,得到如表所示的频
数表:
报价 (单位:
元)
频数 20 60 60 30 20 10
①求这200人的报价X(单位:元)的平均值 和方差 (同一区间的报价用该价格区间
的中点值代替);
②假设所有参与活动的人的报价X(单位:元)可视为服从正态分布 ,且 与
可分别由①中所求的样本平均数 及 估计,若2022年7月计划发放优惠名额数量为
3173,请你合理预测该 在当月的下载优惠价,并说明理由.
参考公式及数据:①回归方程 , , ;② ,
, ;③若随机变量X服从正态分布 ,则, ,
.
【答案】(1) ,预计今年7月参与活动的人数为 万人;
(2)① , ;② 元.
(1)
解:由题意可得 ,
,
又因为 , ,
所以 ,
,
所以回归直线方程为: ,
当 时,可得 (万人),
故预计今年7月参与活动的人数为 万人;
(2)
解:①依题意可得这200人的报价 (单位:元)的平均值
,
方差
;
②由①可知 ,依题意发放的优惠名额为 张,预测参加的人数为人,
所以能够得到优惠名额的概率 ,设下载优惠价为 ,则
又 , ,因为 ,
所以 ,
则 ,
所以预测该APP在当月的下载优惠价为 元.
【提分秘籍】
正态变量的取值范围是 ,但在一次试验中, 的值几乎总是落在区间
内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎
不可能发生.
在实际应用中,通常认为服从于正态分布 的随机变量 只取
中的值,这在统计学中称为 原则.
【变式演练】
1.(2022春·广东·高三统考阶段练习)某市宣传部门开展了线上新冠肺炎世界防控现状及
防控知识竞赛,现从全市的参与者中随机抽取了1000名幸运者的成绩进行分析,把他们的
得分(满分100分)分成以下7组: , , , , ,
, ,统计得各组的频率之比为1∶6:8:10:9:4:2.同一组数据用该区间
中点值代替.
(1)求这1000名幸运者成绩的第75百分位数和平均值 (结果保留整数)﹔
(2)若此次知识竞赛得分 ,为感谢市民的积极参与,对参与者制定如下奖励方
案:得分不超过79分的可获得1次抽奖机会,得分超过79分不超过93分的可获得2次抽
奖机会,超过93分的有3次抽奖机会,试估计任意一名幸运者获得抽奖次数的数学期望.
参考数据:
, ,.
【答案】(1)第75百分位数约为76分,平均值为65分
(2)数学期望为1.1814次.
【详解】(1)这1000名幸运者成绩的第75百分位数为x,则
所以 ,解得 (分),
(分).
所以这1000名幸运者成绩的第75百分位数约为76分,平均值为65分;
(2)设随机变量Y表示任意一名幸运者的抽奖次数,则Y的可能取值为1,2,3,
由已知及(1)得, ,
,
,
,
其分布列为
Y 1 2 3
P 0.84135 0.1359 0.02275
所以 .
所以可以估计任意一名幸运者获得抽奖次数的数学期望为1.1814次.
2.(2022·全国·高三专题练习)我国是全球制造业大国,制造业增加值自2010年起连续
12年位居世界第一,主要产品产量稳居世界前列,为深入推进传统制造业改造提升,全面
提高传统制造业核心竞争力,某设备生产企业对现有生产设备进行技术攻坚突破.设备生产的零件的直径为 (单位:nm).
(1)现有旧设备生产的零件共7个,其中直径大于10nm的有4个.现从这7个零件中随机抽
取3个.记 表示取出的零件中直径大于10nm的零件的个数,求 的分布列及数学期望
;
(2)技术攻坚突破后设备生产的零件的合格率为 ,每个零件是否合格相互独立.现任取6个
零件进行检测,若合格的零件数 超过半数,则可认为技术攻坚成功.求技术攻坚成功的概
率及 的方差;
(3)若技术攻坚后新设备生产的零件直径 ,从生产的零件中随机取出10个,求
至少有一个零件直径大于9.4nm的概率.
参考数据:若 ,则 , ,
, , .
【答案】(1)分布列见解析,
(2) ,
(3)
【详解】(1)由题意,可知 可取0,,1,2,3,.则有
, ,
, .
故 的分布列为:
0 1 2 3
从而 的数学期望 .(2) 可取的值为0,1,2,3,4,5,6,则有
;
;
.
所以技术攻坚成功的概率 ,
因于 ,所以 的方差 .
(3)由 ,则可知 ,
由于 ,则 ,
所以 ,
所以 ,
则 ,
记“从生产的零件中随机取出10个,至少有一个零件直径大于9.4nm”为事件 ,
则 .
故至少有一个零件直径大于9.4nm的概率为 .
3.(2022·全国·高三专题练习)盐水选种是古代劳动人民的智慧结晶,其原理是借助盐水
估测种子的密度,进而判断其优良.现对一批某品种种子的密度(单位: )进行测定,
认为密度不小于 的种子为优种,小于 的为良种.自然情况下,优种和良种的萌发率分
别为 和 .(1)若将这批种子的密度测定结果整理成频率分布直方图,如图所示,据图估计这批种子密
度的平均值;(同一组中的数据用该组区间的中点值为代表)
(2)在(1)的条件下,用频率估计概率,从这批种子(总数远大于2)中选取2粒在自然情
况下种植,设萌发的种子数为 ,求随机变量 的分布列和数学期望(各种子的萌发互相
独立);
(3)若该品种种子的密度 ,任取该品种种子20000粒,估计其中优种的数目.
附:假设随机变量 ,则
.
【答案】(1)1.24
(2)分布列见解析,期望1.44;
(3) 粒.
(1)
种子密度的平均值为:
( )
(2)
由频率分布直方图知优种占比为 ,
任选一粒种子萌发的概率 ,
因为为这批种子总数远大于2,所以 ,, ,
,
所以 布列为:
0
期望 .
(3)
因为该品种种子的密度 ,
所以 , ,即 ,
所以20000粒种子中约有优种 (粒)
即估计其中优种的数目为 粒.
题型七:概率综合
【典例分析】
例题1.(2022·全国·高三专题练习)“学习强国”学习平台是由中宣部主管,以深入
学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员,面向全社会的
优质平台.该平台首次实现了“有组织,有管理,有指导,有服务”的学习,极大地满足
了广大党员干部和人民群众多样化、自主化、便捷化的学习需求,日益成为老百姓了解国
家动态,紧跟时代脉搏的热门APP.某市宣传部门为了解市民利用“学习强国”学习国家
政策的情况,从全市抽取1000人进行调查,统计市民每周利用“学习强国”的时长,下图
是根据调查结果绘制的频率分布直方图.(1)估计该市市民每周利用“学习强国”时长在区间 内的概率;
(2)估计该市市民每周利用“学习强国”的平均时长;
(3)若宣传部为了解市民每周利用“学习强国”的具体情况,准备采用分层抽样的方法从
和 组中抽取7人了解情况,从这7人中随机选取2人参加座谈会,求所选取的
2人来自不同的组的概率.
【答案】(1)0.3
(2)6.8小时
(3) .
(1)
由题意知,该市市民每周利用“学习强国”时长在 内的频率为 ,
所以估计该市市民每周利用“学习强国”时长在 内的概率为0.3.
(2)
由题意知各组的频率分别为0.05,0.1,0.25,0.3,0.15,0.1,0.05,
所以 ,
所以估计该市市民每周利用“学习强国”的平均时长在6.8小时.
(3)
由(2)知,利用“学习强国”时长在 和 的频率分别为0.25,0.1,故两组人数
分别为250,100,
采用分层抽样的方法从 组抽取人数为 ,记作a,b,c,d,e;从
组抽取人数为 ,记作A,B;从7人中抽取2人的基本事件有
,共21个,来自不同
组的基本事件有 ,共10个,
故所求概率 .
例题2.(2022·全国·高三专题练习)《中华人民共和国未成年人保护法》是为保护未
成年人身心健康,保障未成年人合法权益,根据宪法制定的法律.某中学为宣传未成年人保
护法,特举行一次未成年人保护法知识竞赛.竞赛规则是:两人一组,每一轮竞赛中,小组
两人分别选答两题,两人答题互不影响.若答对题数合计不少于3题,则称这个小组为“优
秀小组”.已知甲、乙两位同学组成一组,且甲、乙同学答对每道题的概率分别为 .
(1)若 ,则在第一轮竞赛中,求该组获“优秀小组”的概率;
(2)当 时,求该组在每轮竞赛中获得“优秀小组”的概率的最大值.
【答案】(1) ;
(2) .
【详解】(1)记他们获得“优秀小组”的事件为事件 ,则事件 包含三种情况:
甲答对两题,乙答对一题的事件B;甲答对一题,乙答对两题的事件C,甲、乙都答对两
题的事件D,
事件B、C、D互斥,又因为甲乙两人答题相互独立,
,
所以该组获“优秀小组”的概率 .
(2)由(1)知甲、乙小组每轮比赛获“优秀小组”的概率为:
,又 ,则 , 当且仅当 时,等号成立,
而 , ,于是有 ,因此 ,
令 ,则 ,当且仅当 时等号成立,
所以该组在每轮竞赛中获得“优秀小组”的概率的最大值为 .
【变式演练】
1.(2022·全国·高三专题练习)甲乙两人玩卡片游戏:他们手里都拿着分别标有数字
1,2,3,4,5,6的6张卡片,各自从自己的卡片中随机抽出1张,规定两人谁抽出的卡片上的数
字大,谁就获胜,数字相同则为平局.
(1)求甲获胜的概率.
(2)现已知他们都抽出了标有数字6的卡片,为了分出胜负,他们决定从手里剩下的卡片中
再各自随机抽出1张,若他们这次抽出的卡片上数字之和为偶数,则甲获胜,否则乙获胜.
请问:这个规则公平吗,为什么 ?
【答案】(1) ;(2)见解析
【详解】(1)两人各自从自己的卡片中随机抽出一张,所有可能的结果为:
,
,
,共36种,
其中事件“甲获胜”包含的结果为:
,
有15种.
所以甲获胜的概率为 .
(2)两人各自从于里剩下的卡片中随机抽出一张,所有可能的结果为:,共25种.
其中卡片上的数字之和为偶数的结果为:
,共13种.
根据规则,甲获胜的概率为 ,则乙获胜的概率为 ,所以这个规则不公平.
2.(2022春·内蒙古呼和浩特·高三呼市二中校考阶段练习)设随机变量 ,若
,且 ,则 ,其中 ,
.某工厂对一批零件进行抽
样检测,根据经验可知每个零件是次品的概率均为 .
(1)若从这批零件中抽取2个进行检测,求其中次品数 的分布列及数学期望;
(2)现对这批零件抽取100个进行检测,若其中次品数多于3个,则这批零件为不合格产品.
估算这批零件为不合格产品的概率(精确到 .
【答案】(1)答案见解析
(2)0.14
【详解】(1)根据题意可知 ,
则 ,
,
,
所以 的分布列为:
0 1 2
的数学期望为 .(2)设 为次品的数量,则 ,且 ,
所以 ,
根据题意可知 ,其中 ,
当 时,这批零件为不合格产品,
则这批零件为不合格产品的概率为 ,
即 ,
综上,这批产品为不合格产品的概率约为 .
3.(2022春·湖北·高三校联考阶段练习)某学校为了迎接党的二十大召开,增进全体教职
工对党史知识的了解,组织开展党史知识竞赛活动并以支部为单位参加比赛.现有两组党史
题目放在甲、乙两个纸箱中,甲箱有5个选择题和3个填空题,乙箱中有4个选择题和3个
填空题,比赛中要求每个支部在甲或乙两个纸箱中随机抽取两题作答.每个支部先抽取一题
作答,答完后题目不放回纸箱中,再抽取第二题作答,两题答题结束后,再将这两个题目
放回原纸箱中.
(1)如果第一支部从乙箱中抽取了2个题目,求第2题抽到的是填空题的概率;
(2)若第二支部从甲箱中抽取了2个题目,答题结束后错将题目放入了乙箱中,接着第三支
部答题,第三支部抽取第一题时,从乙箱中抽取了题目.已知第三支部从乙箱中取出的这个
题目是选择题,求第二支部从甲箱中取出的是2个选择题的概率.
【答案】(1)
(2)
【详解】(1)设 表示“第 次从乙箱中取到填空题”, ,2,
, ,
由全概率公式得:第2次抽到填空题的概率为:;
(2)设事件 为“第三支部从乙箱中抽1个选择题”,
事件 为“第二支部从甲箱中取出2个题都是选择题”,
事件 为“第二支部从甲箱中取出1个选择题1个填空题”,
事件 为“第二支部从甲箱中取出2个题都是填空题”,
则 、 、 彼此互斥,且 ,
,
,
,
,
,
,
所求概率即是 发生的条件下 发生的概率:
.题型八:概率统计与数列
【典例分析】
例题1.(2022·全国·高三专题练习)某商场拟在年末进行促销活动,为吸引消费者,
特别推出“玩游戏,送礼券“的活动,游戏规则如下:每轮游戏都抛掷一枚质地均匀的骰
子(形状为正方体,六个面的点数分别为1,2,3,4,5,6),若向上点数不超2点,获
得1分,否则获得2分,进行若干轮游戏,若累计得分为19分,则游戏结束,可得到200
元礼券,若累计得分为20分,则游戏结束,可得到纪念品一份,最多进行20轮游戏.
(1)当进行完3轮游戏时,总分为 ,求 的期望;
(2)若累计得分为 的概率为 ,(初始得分为0分, ).
①证明数列 ,(i=1,2,…,19)是等比数列;
②求活动参与者得到纪念品的概率.
【答案】(1)5;(2)①证明见解析;② .
【详解】(1)由题意可知每轮游戏获得1分的概率为 ,获得2分的概率为 ,设进行完
3轮游戏时,得1分的次数为 ,所以 , ,
而 ,即随机变量X可能取值为3,4,5,6,
, ,
, .
∴X的分布列为:
X 3 4 5 6
PE(X)= =5.
(2)①证明:n=1,即累计得分为1分,是第1次掷骰子,向上点数不超过2点, ,
则 ,累计得分为i分的情况有两种:
(Ⅰ)i=(i﹣2)+2,即累计得i﹣2分,又掷骰子点数超过2点,其概率为 ,
(Ⅱ)累计得分为i﹣1分,又掷骰子点数没超过2点,得1分,其概率为 ,
∴ ,∴ ,(i=2,3,•••,19),∴
数列 ,(i=1,2,…,19)是首项为﹣ ,公比为﹣ 的等比数列.
②∵数列 ,(i=1,2,…,19)是首项为﹣ ,公比为﹣ 的等比数列,
∴ ,
∴ , ,•••, ,
各式相加,得: ,
∴ ,(i=1,2,•••,19),
∴活动参与者得到纪念品的概率为:
.
例题2.(2022·全国·高三专题练习)为落实《关于全面加强和改进新时代学校体育工
作的意见》,完善学校体育“健康知识+基本运动技能+专项运动技能”教学模式,建立
“校内竞赛-校级联赛-选拔性竞赛-国际交流比赛”为一体的竞赛体系,构建校、县
(区)、地(市)、省、国家五级学校体育竞赛制度.某校开展“阳光体育节”活动,其中传统项目“定点踢足球”深受同学们喜爱.其间甲、乙两人轮流进行足球定点踢球比赛
(每人各踢一次为一轮),在相同的条件下,每轮甲、乙两人在同一位置,甲先踢,每人
踢一次球,两人有1人命中,命中者得1分,未命中者得 分;两人都命中或都未命中,
两人均得0分,设甲每次踢球命中的概率为 ,乙每次踢球命中的概率为 ,且各次踢球
互不影响.
(1)经过1轮踢球,记甲的得分为 ,求 的数学期望;
(2)若经过 轮踢球,用 表示经过第 轮踢球累计得分后甲得分高于乙得分的概率.
①求 , , ;
②规定 ,且有 ,请根据①中 , , 的值求出 、 ,并求出数
列 的通项公式.
【答案】(1) ;(2)① , , ;② ,
.
【详解】(1)记一轮踢球,甲命中为事件 ,乙命中为事件 , , 相互独立.
由题意 , ,甲的得分 的可能取值为 ,0,1.
,
.
,
∴ 的分布列为:
0 1.
(2)①由(1) ,
.
经过三轮踢球,甲累计得分高于乙有四种情况:甲3轮各得1分;甲3轮中有2轮各得1分,
1轮得0分;甲3轮中有1轮得1分,2轮各得0分;甲3轮中有2轮各得1分,1轮得 分.
∴ ,
②∵规定 ,且有 ,
∴ 代入得: ,
∴ ,∴数列 是等比数列,
公比为 ,首项为 ,∴ .
∴
【提分秘籍】
借助数列的地推关系式,求出概率或统计量之间的关系,这是高考的重要考点,递推关系
作为重要的工具,为解决概率统计中的问题提供了便利.
【变式演练】
1.(2022·全国·模拟预测)某学校开展投篮活动,活动规则是:每名选手投篮 次( ,
),每次投篮,若投进,则下一次站在三分线处投篮;若没有投进,则下一次站在
两分线处投篮.规定每名选手第一次站在两分线处投篮.站在两分线处投进得2分,否则
得0分;站在三分线处投进得3分,否则得0分.已知小明站在两分线处投篮投进的概率
为0.7,站在三分线处投篮投进的概率为0.5,且每次投篮相互独立.
(1)记小明前2次投篮累计得分为 ,求 的分布列和数学期望;(2)记第 次投篮时,小明站在三分线处投篮的概率为 , ,2,…, ,求 的表达
式.
【答案】(1)分布列见解析,
(2)
(1)
依题意, 的所有可能取值为 , , .
记“小明第 次投篮站在两分线处并且投进”为事件 , , ,
“小明第2次投篮站在三分线处并且投进”为事件 .
;
;
.
所以 的分布列为
所以 .
(2)
由题意知, .
当 时,分两种情形:
①若小明第 次投篮站在三分线处,这种情形下小明第 次投篮站在三分线处的概率为
;
②若小明第 次投篮站在两分线处,这种情形下小明第 次投篮站在三分线处的概率为.
所以 ,
所以 ,
由题易知 ,
当 时, 也成立,
所以 是以 为首项, 为公比的等比数列.
所以 ,即 .
2.(2022·江苏连云港·江苏省赣榆高级中学校考模拟预测)某超市开展购物抽奖送积分活
动,每位顾客可以参加 ( ,且 )次抽奖,每次中奖的概率为 ,不中奖的概
率为 ,且各次抽奖相互独立.规定第1次抽奖时,若中奖则得10分,否则得5分.第2
次抽奖,从以下两个方案中任选一个;
方案① :若中奖则得30分,否则得0分;
方案② :若中奖则获得上一次抽奖得分的两倍,否则得5分.
第3次开始执行第2次抽奖所选方案,直到抽奖结束.
(1)如果 ,以抽奖的累计积分的期望值为决策依据,顾客甲应该选择哪一个方案?并说
明理由;
(2)记顾客甲第i次获得的分数为 ,并且选择方案②.请直接写出 与
的递推关系式,并求 的值.(精确到0.1,参考数据: .)
【答案】(1)应选择方案① ,理由见解析;
(2) ,(1)
若甲第2次抽奖选方案①,两次抽奖累计积分为 ,则 的可能取值为40,35,10,5.
, ,
, ,
所以 .
若甲第2次抽奖选方案②,两次抽奖累计积分为 ,则 的可能取值为30,15,10,
则 , , ,
,
因为 ,所以应选择方案①.
(2)
依题意得 ,
的可能取值为10,5其分布列为
10 5
P
所以 ,则 ,
由 得 ,
所以 为等比数列.其中首项为 ,公比为 .所以 ,故 .
3.(2022·全国·高三专题练习)安庆市某学校高三年级开学之初增加晚自习,晚饭在校食
堂就餐人数增多,为了缓解就餐压力,学校在原有一个餐厅的基础上增加了一个餐厅,分
别记做餐厅甲和餐厅乙,经过一周左右统计调研分析:前一天选择餐厅甲就餐第二天选择
餐厅甲就餐的概率是25%、选择餐厅乙就餐的概率为75%,前一天选择餐厅乙就餐第二天
选择餐厅乙就餐的概率是50%、选择餐厅甲就餐的概率也为50%,如此往复.假设学生第一
天选择餐厅甲就餐的概率是 ,择餐厅乙就餐的概率是 ,记某同学第n天选择甲餐厅就
餐的概率为 .
(1)记某班级的3位同学第二天选择餐厅甲的人数为X,求X的分布列,并求E(X);
(2)请写出 与 的递推关系;
(3)求数列 的通项公式并帮助学校解决以下问题:为提高学生服务意识和团队合作精
神,学校每天从20个班级中每班抽调一名学生志愿者为全体学生提供就餐服务工作,根据
上述数据,如何合理分配到餐厅甲和餐厅乙志愿者人数?请说明理由.
【答案】(1)分布列答案见解析, ;
(2) ;
(3)分配到餐厅甲和餐厅乙志愿者人数8人和12人,理由见解析.
【详解】(1)某同学第二天选择餐厅甲就餐的概率 ,
某同学第二天选择餐厅乙就餐的概率 ,
位同学第二天选择餐厅甲就餐的人数为 ,则 .
,
的分布列为
0 1 2 3故 .
(2)依题意, ,即 .
(3)由(2)知 ,则 当 时,
可得 ,
数列 是首项为 公比为 的等比数列.
,即 .
,
所以,分配到餐厅甲的志愿者人数为 ,分配到餐厅乙的志愿者人数为 .
题型九:概率统计与导数
【典例分析】
例题1.(2022·全国·高三专题练习)一种微生物群体可以经过自身繁殖不断生存下来,
设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,
该微生物每代繁殖的个数是相互独立的且有相同的分布列,设 表示1个微生物个体繁殖
下一代的个数, .
(1)已知 ,求 ;
(2)设 表示该种微生物经过多代繁殖后临近灭绝的概率, 是关于 的方程:
的一个最小正实根,求证:当 时, ,当 时,;
(3)根据你的理解说明(2)问结论的实际含义.
【答案】(1)1;(2)见解析;(3)见解析.
【详解】(1) .
(2)设 ,
因为 ,故 ,
若 ,则 ,故 .
,
因为 , ,
故 有两个不同零点 ,且 ,
且 时, ; 时, ;
故 在 , 上为增函数,在 上为减函数,
若 ,因为 在 为增函数且 ,
而当 时,因为 在 上为减函数,故 ,
故 为 的一个最小正实根,
若 ,因为 且在 上为减函数,故1为 的一个最
小正实根,
综上,若 ,则 .
若 ,则 ,故 .
此时 , ,
故 有两个不同零点 ,且 ,且 时, ; 时, ;
故 在 , 上为增函数,在 上为减函数,
而 ,故 ,
又 ,故 在 存在一个零点 ,且 .
所以 为 的一个最小正实根,此时 ,
故当 时, .
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后
代的平均数超过1,则若干代后被灭绝的概率小于1.
例题2.(2022·全国·高三专题练习)某篮球队为提高队员的训练积极性,进行小组投
篮游戏,每个小组由两名队员组成,队员甲与队员乙组成了一个小组.游戏规则:每个小组
的两名队员在每轮游戏中分别投篮两次,每小组投进的次数之和不少于3次的称为“神投
小组”,已知甲乙两名队员投进篮球的概率为别为 , .
(1)若 , ,则在第一轮游戏他们获“神投小组”的概率;
(2)若 ,则在游戏中,甲乙两名队员想要获得“神投小组”的称号16次,则
理论上他们小组要进行多少轮游戏才行?并求此时 , 的值.
【答案】(1) ;(2)理论上至少要进行 轮游戏, .
【详解】(1)由题可知,所以可能的情况有:①甲投中1次,乙投中2次;②甲投中2次,
乙投中1次;③甲投中2次,乙投中2次.故所求概率:
.
(2)他们在一轮游戏中获“神投小组”的概率为:
,因为 ,所以 ,
因为 , , ,所以 , ,
又 ,所以 ,
令 ,以 ,则 ,
当 时, ,
他们小组在 轮游戏中获“神投小组”次数 满足 ,
由 ,则 ,所以理论上至少要进行 轮游戏.
此时 , , .
【提分秘籍】
概率统计中的最值问题常用工具有:
①基本不等式
②求导
【变式演练】
1.(2022春·山东·高三校联考阶段练习)某公司在一种传染病毒的检测试剂品上加大了研
发投入,其研发的检验试剂品 分为两类不同剂型 和 .现对其进行两次检测,第一次
检测时两类试剂 和 合格的概率分别为 和 ,第二次检测时两类试剂 和 合格的
概率分别为 和 .已知两次检测过程相互独立,两次检测均合格,试剂品 才算合格.
(1)设经过两次检测后两类试剂 和 合格的种类数为 ,求 的分布列和数学期望;
(2)若地区排查期间,一户4口之家被确认为“与确诊患者的密切接触者”,这种情况下医
护人员要对其家庭成员逐一使用试剂品 进行检测,如果有一人检测呈阳性,则检测结束,
并确定该家庭为“感染高危户”.设该家庭每个成员检测呈阳性的概率均为 且
相互独立,该家庭至少检测了3个人才确定为“感染高危户”的概率为 ,若当
时, 最大,求 的值.【答案】(1)分布列见解析,1
(2) .
【详解】(1)剂型 合格的概率为: ;
剂型 合格的概率为: .
由题意知X的所有可能取值为0,1,2.
则 ,
,
,
则X的分布列为
X 0 1 2
P
数学期望 .
(2)检测3人确定“感染高危户”的概率为 ,
检测4人确定“感染高危户”的概率为 ,
则 .
令 ,因为 ,所以 ,
原函数可化为 .因为 ,
当且仅当 ,即 时,等号成立.
此时 ,所以 .
2.(2022春·上海黄浦·高三上海市光明中学校考期中)汽车尾气排放超标是全球变暖、海
平面上升的重要因素.我国近几年着重强调可持续发展,加大在新能源项目的支持力度,积
极推动新能源汽车产业发展,某汽车制造企业对某地区新能源汽车的销售情况进行调查,
得到下面的统计表:
年份t 2017 2018 2019 2020 2021
年份代码x( ) 1 2 3 4 5
销量y/万辆 10 12 17 20 26
(1)统计表明销量y与年份代码x有较强的线性相关关系,利用计算器求y关于x的线性回归
方程,并预测该地区新能源汽车的销量最早在哪一年能突破50万辆;
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业
随机调查了该地区200位购车车主的购车情况作为样本,其中男性车主中购置传统燃油汽
车的有w名,购置新能源汽车的有45名,女性车主中有20名购置传统燃油汽车.
①若 ,将样本中购置新能源汽车的性别占比作为概率,以样本估计总体,试用(1)
中的线性回归方程预测该地区2023年购置新能源汽车的女性车主的人数(假设每位车主只
购买一辆汽车,结果精确到千人);
②设男性车主中购置新能源汽车的概率为p,将样本中的频率视为概率,从被调查的所有
男性车主中随机抽取5人,记恰有3人购置新能源汽车的概率为 ,求当w为何值时,
最大.
【答案】(1) ;2028年
(2)① 15.5万人 ② 30【详解】(1)(1)解:由题意得 ,
,
, .
所以 , .
所以 关于 的线性回归方程为 ,
令 ,得 ,
所以最小的整数为12, ,
所以该地区新能源汽车的销量最早在2028年能突破50万辆.
(2)解:①由题意知,该地区200名购车者中女性有 名,
故其中购置新能源汽车的女性车主的有 名.
所购置新能源汽车的车主中,女性车主所占的比例为 .
所以该地区购置新能源汽车的车主中女性车主的概率为 .
当 时, ,
所以预测该地区2023年购置新能源汽车的销量为33万辆,
因此预测该地区2020年购置新能源汽车的女性车主的人数为 万人
②由题意知, ,
则 ,,
当 时,知 所以函数 单调递增,
当 时,知 所以函数 单调递减
所以当 取得最大值 .
此时 ,解得 ,
所以当 时, 取得最大值 .
1.(2022·陕西宝鸡·统考一模)甲、乙两个代表队各有3名选手参加对抗赛.比赛规定:甲
队的1,2,3号选手与乙队的1,2,3号选手按编号顺序各比赛一场,某队连赢3场,则
获胜,否则由甲队的1号对乙队的2号,甲队的2号对乙队的1号加赛两场,胜场多者最
后获胜(每场比赛只有胜或负两种结果).已知甲队的1号对乙队的1,2号选手的胜率分别
是0.5,0.6,甲队的2号对乙队的1,2号选手的胜率都是0.5,甲队的3号对乙队的3号选
手的胜率也是0.5,假设每场比赛结果相互独立.
(1)求甲队仅比赛3场获胜的概率;
(2)已知每场比赛胜者可获得200个积分,求甲队队员获得的积分数之和 的分布列及期望.
【答案】(1)0.125;
(2)分布列见解析,期望为465.
【详解】(1)甲队1,2,3号选手与乙队1,2,3号选手比赛获胜的概率分别为
,,
甲队比赛3场获胜的概率为 = ;
(2)X所以可能取得值为 ;,
,
,
,
.
即
X 0 200 400 600 800
P 0.125 0.075 0.2625 0.425 0.1125
所以 .
2.(2022·广东广州·统考一模)世界卫生组织建议成人每周进行 至5小时的中等强度
运动.已知 社区有 的居民每周运动总时间超过5小时, 社区有 的居民每周运动
总时间超过5小时, 社区有 的居民每周运动总时间超过5小时,且 三个社区
的居民人数之比为 .
(1)从这三个社区中随机抽取1名居民,求该居民每周运动总时间超过5小时的概率;
(2)假设这三个社区每名居民每周运动总时间为随机变量 (单位:小时),且
.现从这三个社区中随机抽取3名居民,求至少有两名居民每周运动总时间
为5至6小时的概率.
【答案】(1)
(2)
【详解】(1)因为 三个社区的居民人数之比为 ,
设 三个社区的居民人数为 ,
所以 社区每周运动总时间超过5小时的人数为: ,
社区每周运动总时间超过5小时的人数为: ,社区每周运动总时间超过5小时的人数为: ,
该居民每周运动总时间超过5小时的概率 .
(2)因为这三个社区每名居民每周运动总时间为随机变量 (单位:小时),且
,
所以 ,由(1)知, ,
所以 ,
因为随机变量 服从正态分布,且关于 对称,
所以 ,
所以从这三个社区中随机抽取3名居民,求至少有两名居民每周运动总时间为5至6小时
的概率为:
.
3.(2022·全国·模拟预测)某校课题组选取高一两个班级开展对“数学问题链深度设计”
的研究,其中A班为常规教学班,B班为课改研究班.在一次期末考试后,对A,B两班学
生的数学成绩(单位:分)进行分析,满分150分,规定:小于120分为不优秀,大于或
等于120分为优秀.已知A,B两班学生的数学成绩的频数分布统计表如下:
A班:
分组 100分以下
频数 4 8 10 12 12 4
B班:
分组 100分以下
频数 6 12 14 10 6 2
(1)由以上统计数据填写下面的2×2列联表,并根据小概率值 的独立性检验,能否
计数成绩是否优秀与课改研究有关?A班 B班 总计
优秀
不优秀
总计
(2)从A,B两班里成绩在100分以下的学生中任意选取2人,记X为2人中B班的人数,求
X的分布列及数学期望.
附: , ,
α 0.1 0.05 0.025 0.01
2.706 3.841 5.024 6.635
【答案】(1)列联表见解析,能;
(2)分布列见解析, .
【详解】(1)填写完整2×2列联表如表所示:
A班 B班 总计
优秀 22 32 54
不优秀 28 18 46
总计 50 50 100
,
所以根据小概率值 的独立性检验,我们推断 不成立,即认为成绩是否优秀与课
改研究有关,此推断犯错误的概率不大于0.05;
(2)由(1)可知:A,B两班里成绩在100分以下的学生中,A班有4人,B班有2人,
所以X的所有可能取值为0,1,2,
则 , , ,
则随机变量X的分布为
X 0 1 2
P
数学期望 .
4.(2022·全国·模拟预测)从《唐宫夜宴》火爆破圈开始,河南电视台推出的“中国节
日”系列节目被年轻人列入必看节目之一.从某平台“中国节日”系列节目的粉丝与游客
(未注册的访客)中各随机抽取200人,统计他们的年龄(单位:岁,年龄都在
内),并按照 , , , , 分组,得到粉丝年龄频率分布直
方图及游客年龄频数分布表如下所示.
年龄/岁
频数 10 60 50 45 35
(1)估计粉丝年龄的平均数 及游客年龄的中位数 (同一组中的数据用该组区间的中点值
为代表);
(2)以频率估计概率,从该平台“中国节日”系列节目的所有粉丝与游客中各随机抽取2人,
记这4人中年龄在 内的人数为 ,求 的分布列与期望.【答案】(1) ,
(2)分布列见解析,数学期望
【详解】(1)由粉丝年龄频率分布直方图知
,
由游客年龄频数分布表知 ,
所以 ,解得 .
(2)从该平台“中国节日”系列节目的所有粉丝中随机抽取1人,该粉丝年龄在
内的概率为 ,
从该平台“中国节日”系列节目的所有游客中随机抽取1人,该游客年龄在 内的概
率为 ,
由题可得 的所有可能取值为0,1,2,3,4,
且 ,
,
,
,
,
所以 的分布列为
0 1 2 3 4.
5.(2022·河南新乡·统考一模)乒乓球被称为中国的“国球”.甲、乙两位乒乓球爱好者
决定进行一场友谊赛,制定如下比赛规则:比赛分两天进行,每天实行三局两胜制,即先
赢两局者获得该天的胜利.若两天比赛中一方连续胜利,则该方获得胜利;若两天比赛中
双方各胜一天,则第三天加赛一局,一局定胜负.设每局比赛甲获胜的概率为 ,
各局比赛相互独立,没有平局.
(1)当 时,求第一天比赛甲获胜的概率;
(2)记比赛结束时的总局数为 ,当 时,求随机变量 的分布列和数学期望.
【答案】(1) ;
(2)分布列见解析,数学期望为 .
【详解】(1)第一天比赛甲可能以 或 获胜,
因为 , ,
所以第一天甲获胜的概率 ;
(2)因为 ,
所以第一天和第二天甲以 获胜的概率为 ,此时乙以 负,
第一天和第二天甲以 获胜的概率为 ,此时乙以 负,即第一天和第二天甲、乙各自以 和 获胜的概率都是 ,
同样以 和 负的概率都是 ,
所以 的所有可能取值为4,5,6,7,
,
,
,
,
所以随机变量Y的分布列为
4 5 6 7
所以 .
6.(2022·湖南·模拟预测)某学校在50年校庆到来之际,举行了一次趣味运动项目比赛,
比赛由传统运动项目和新增运动项目组成,每位参赛运动员共需要完成3个运动项目.对
于每一个传统运动项目,若没有完成,得0分,若完成了,得30分.对于新增运动项目,
若没有完成,得0分,若只完成了1个,得40分,若完成了2个,得90分.最后得分越多
者,获得的资金越多.现有两种参赛的方案供运动员选择.方案一:只参加3个传统运动
项目.方案二:先参加1个传统运动项目,再参加2个新增运动项目.已知甲、乙两位运
动员能完成每个传统项目的概率为 ,能完成每个新增运动项目的概率均为 ,且甲、乙
参加的每个运动项目是否能完成相互独立.
(1)若运动员甲选择方案一,求甲得分不低于60分的概率.
(2)若以最后得分的数学期望为依据,请问运动员乙应该选择方案一还是方案二?说明你的理由.
【答案】(1)
(2)运动员乙应该选择方案一;理由见解析
【详解】(1)运动员甲选择方案一,若甲得分不低于60分,则甲至少要完成2项传统运
动项目,故甲得分不低于60分的概率 .
(2)若乙选择方案一,则乙完成的运动项目的个数 ,
所以乙最后得分的数学期望为 .
若乙选择方案二,则乙得分Y的可能为取值为0,30,40,70,90,120,
,
,
,
,
,
.
所以Y的数学期 ,
因为 ,所以运动员乙应该选择方案一.
7.(2022·河南·马店第一高级中学校联考模拟预测)在高考结束后,程浩同学回初中母校看望数学老师,顺便帮老师整理初三年级学生期中考试的数学成绩,并进行统计分析,在
整个年级中随机抽取了200名学生的数学成绩,将成绩分为 , , ,
, , ,共6组,得到如图所示的频率分布直方图,记分数不低于90
分为优秀.
(1)从样本中随机选取一名学生,已知这名学生的分数不低于70分,问这名学生数学成绩
为优秀的概率;
(2)在样本中,采取分层抽样的方法从成绩在 内的学生中抽取13名,再从这13名
学生中随机抽取3名,记这3名学生中成绩为优秀的人数为X,求X的分布列与数学期望.
【答案】(1)
(2)分布列见解析;
【详解】(1)依题意,得 ,解得 ,
则不低于70分的人数为 ,
成绩在 内的,即优秀的人数为 ;
故这名学生成绩是优秀的概率为 ;
(2)成绩在 内的有 (人);
成绩在 内的有 (人);成绩在 内的有 人;故采用分层抽样抽取的13名学生中,成绩在 内的有6人,在 内的有5人,
在 内的有2人,
所以由题可知,X的可能取值为0,1,2,
则 , , ,
所以X的分布列为:
X 0 1 2
P
故 .
8.(2022·陕西西安·西安中学校考模拟预测)2022年北京冬奥会后,由一名高山滑雪运动
员甲组成的专业队,与两名高山滑雪爱好者乙、丙组成的业余队进行友谊赛.约定赛制如
下:业余队中的两名队员轮流与甲进行比赛,若甲连续赢两场则专业队获胜;若甲连续输
两场则业余队获胜:若比赛三场还没有决出胜负,则视为平局,比赛结束.已知各场比赛
相互独立,每场比赛都分出胜负,且甲与乙比赛,乙赢概率为 ;甲与丙比赛,丙赢的概
率为p,其中 .
(1)若第一场比赛,业余队可以安排乙与甲进行比赛,也可以安排丙与甲进行比赛.请分别
计算两种安排下业余队获胜的概率;若以获胜概率大为最优决策,问:业余队第一场应该
安排乙还是丙与甲进行比赛?
(2)为了激励专业队和业余队,赛事组织规定:比赛结束时,胜队获奖金3万元,负队获奖
金1.5万元;若平局,两队各获奖金1.8万元.在比赛前,已知业余队采用了(1)中的最
优决策与甲进行比赛,设赛事组织预备支付的奖金金额共计X万元,求X的数学期望
的取值范围.
【答案】(1)业余队第一场应该安排乙与甲进行比赛
(2) 的取值范围为: (单位:万元).
【详解】(1)第一场比赛,业余队安排乙与甲进行比赛,业余队获胜的概率为:;
第一场比赛,业余队安排丙与甲进行比赛,业余队获胜的概率为:
,
因为 ,所以 ,所以 .
所以,业余队第一场应该安排乙与甲进行比赛.
(2)由已知 万元或 万元.
由(1)知,业余队最优决策是第一场应该安排乙与甲进行比赛.
此时,业余队获胜的概率为 ,
专业队获胜的概率为 ,
所以,非平局的概率为 ,
平局的概率为 .
的分布列为:
的数学期望为 (万元)
而 ,所以 的取值范围为: (单位:万元).
9.(2022·全国·模拟预测)某校开展了“学党史”知识竞赛活动,竞赛试题由若干选择题
和填空题两种题型构成,每位选手共需要回答三个问题.对于每一个问题,若回答错误得0
分;若回答正确,填空题得30分,选择题得20分.现设置了两种活动方案供选手选择.方案一:只回答填空题;方案二:先回答填空题,后续选题按如下规则:若上一题回答正确,
则下一次选择填空题;若上题回答错误,则下一次选择选择题.已知甲、乙两位同学能正确
回答填空题的概率均为 ,能正确回答选择题的概率均为 ,且能正确回答问题的概率与
回答次序无关.
(1)若甲同学采用方案一答题,求甲得分不低于60分的概率;
(2)乙同学应该选择何种方案参加比赛更加有利?并说明理由.
【答案】(1) ;
(2)乙同学选择方案二参加比赛更加有利,理由见解析.
(1)
甲同学采用方案一答题,得分不低于60分的情况为至少答对两道填空题,
∴其概率 ;
(2)
乙同学选择方案二参加比赛更加有利,理由如下:
若采用方案一,则其得分X的可能取值为0,30,60,90,
∴ ; ;
; ,
∴X的分布列为
X 0 30 60 90
P
∴X的数学期望 ;若采用方案二,则其得分Y的可能为取值为0,20,30,50,60,90,
∴ ; ;
; ;
; ,
∴Y的分布列为
Y 0 20 30 50 60 90
P
∴Y的数学期望 ,
∵ ,
∴乙同学选择方案二参加比赛更加有利.
10.(2022·四川成都·成都七中校考模拟预测)某企业研发了一种新药,为评估药物对目
标适应症患者的治疗作用和安全性,需要开展临床用药试验,检测显示临床疗效评价指标
A的数量y与连续用药天数x具有相关关系.随机征集了一部分志愿者作为样本参加临床用
药试验,并得到了一组数据 , ,其中 表示连续用药i天, 表示相应
的临床疗效评价指标A的数值.根据临床经验,刚开始用药时,指标A的数量y变化明显,
随着天数增加,y的变化趋缓.经计算得到如下一些统计量的值: ,
, , ,
,其中 .
(1)试判断 与 哪一个适宜作为y关于x的回归方程类型?并建立y关于
x的回归方程;
(2)新药经过临床试验后,企业决定通过两条不同的生产线每天8小时批量生产该商品,其
中第1条生产线的生产效率是第2条生产线的两倍.若第1条生产线出现不合格药品的概率
为0.012,第2条生产线出现不合格药品约概率为0.009,两条生产线是否出现不合格药品相互独立.
(i)随机抽取一件该企业生产的药品,求该药品不合格的概率;
(ii)若在抽查中发现不合格药品,求该药品来自第1条生产线的概率.
参考公式:对于一组数据 ,其回归直线 的斜率和截距的
最小二乘估计分别为 , .
【答案】(1) 适宜,
(2)(i) ;(ii)
(1)
刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓,故
适宜作为y关于x的回归方程类型.
令 ,得 ,于是 ,
因为 , ,所以 , ,
所以 , ,即 ;
(2)
(i)设 “随机抽取一件该企业生产的药品为不合格”,
“随机抽取一件药品为第1条生生产线生产”,
“随机抽取一件药品为第2条生生产线生产”,
则 , ,
又 , ,于是.
(ii) .
11.(2022·辽宁大连·育明高中校考一模)2020年12月16日至18日,中央经济工作会议
在北京召开,会议确定,2021年要抓好八个重点任务,其中第五点就是:保障粮食安全,
关键在于落实藏粮于地、藏粮于技战略.要加强种质资源保护和利用,加强种子库建设.要尊
重科学、严格监管,有序推进生物育种产业化应用.某“种子银行”对某种珍稀名贵植物种
子采取“活态保存”方法进行保存,即对种子实行定期更换和种植.通过以往的相关数据表
明,该植物种子的出芽率为 ,每颗种子是否发芽相互独立.现任取该植物种子
颗进行种植,若种子的出芽数 超过半数,则可认为种植成功( ).
(1)当 , 时,求种植成功的概率及 的数学期望;
(2)现拟加种两颗该植物种子,试分析能否提高种植成功率?
【答案】(1)概率为 , ;(2)答案见解析.
【详解】(1)由题意可知, 服从二项分布 ,
故 ,
故种植成功的概率为 ,
;
(2)设种植 颗种子时,种植成功的概率为 ,
拟加种两颗该植物种子时,种植成功的概率为 ,
当种植 颗种子时,考虑前 颗种子出芽数,
为了种植成功,前 颗种子中至少要有 颗种子出芽,①前 颗种子中恰有 颗出芽,它的概率为 ,
此时后两颗种子必须都要出芽,
所以这种情况下种植成功的概率为 ;
②前 颗种子恰有 颗出芽,它的概率为 ,
此时后两颗种子至少有一颗出芽即可,
所以这种情况下种植成功的概率为 ;
③前 颗种子至少有 颗出芽,
它的概率为 ,此时种植一定成功.
所以 ,
故 ,
,
因为 ,
所以 ,
所以当 时, ,种植成功率会降低;
当 时, ,种植成功率不变;
当 时, ,种植成功率会提高.
12.(2022·湖北·荆门市龙泉中学校联考二模)高尔顿板是英国生物统计学家高尔顿设计
用来研究随机现象的模型,在一块木板上钉着若干排相互平行但相互错开的圆柱形小木块,
小木块之间留有适当的空隙作为通道,前面挡有一块玻璃,让一个小球从高尔顿板上方的
通道口落下,小球在下落的过程中与层层小木块碰撞,且等可能向左或向右滚下,最后掉
入高尔顿板下方的某一球槽内.如图1所示的高尔顿板有7层小木块,小球从通道口落下,第一次与第2层中间的小木块碰撞,以 的概率向左或向右滚下,依次经过6次与小木块
碰撞,最后掉入编号为1,2,…,7的球槽内.例如小球要掉入3号球槽,则在6次碰撞中
有2次向右4次向左滚下.
(1)如图1,进行一次高尔顿板试验,求小球落入5号球槽的概率;
(2)小红、小明同学在研究了高尔顿板后,利用高尔顿板来到社团文化节上进行盈利性
“抽奖”活动.小红使用图1所示的高尔顿板,付费6元可以玩一次游戏,小球掉入m号球
槽得到的奖金为 元,其中 .小明改进了高尔顿板(如图2),首先将小木块减少
成5层,然后使小球在下落的过程中与小木块碰撞时,有 的概率向左, 的概率向右滚
下,最后掉入编号为1,2,……,5的球槽内,改进高尔顿板后只需付费4元就可以玩一
次游戏,小球掉入n号球槽得到的奖金为 元,其中 .两位同学的高尔顿板游戏
火爆进行,很多同学参加了游戏,你觉得小红和小明同学谁的盈利多?请说明理由.
【答案】(1) ;(2)小明的盈利多,理由见解析.
【详解】(1)设这个小球掉入5号球槽为事件 ,掉入5号球槽,需要向右4次向左2次,
所以 ,
所以这个小球掉入5号球槽的概率为 .(2)小红的收益计算如下:每一次游戏中, 的可能取值为0,4,8,12.
,
,
,
.
0 4 8 12
一次游戏付出的奖金 ,则小红的收益为 .
小明的收益计算如下:每一次游戏中, 的可能取值为0,1,4,9.
,
,
,
.
0 1 4 9一次游戏付出的奖金 ,则小明的收益为 .
显然, ,所以小明的盈利多.
13.(2022·湖北黄石·校考模拟预测)第13届女排世界杯于2019年9月14日在日本举行,
共有12支参赛队伍.本次比赛启用了新的排球用球MIKSA-V200W ,已知这种球的质量指
标ξ (单位:g )服从正态分布N (270, ).比赛赛制采取单循环方式,即每支球队进行11
场比赛(采取5局3胜制),最后靠积分选出最后冠军积分规则如下:比赛中以3:0或3:1取胜
的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.已知第10轮
中国队对抗塞尔维亚队,设每局比赛中国队取胜的概率为p(0