文档内容
专题 27 概率统计解答题分类练
一、概率
1.(2024届江苏省连云港市赣榆智贤中学高三上学期9月模拟)某活动现场设置了抽奖环节,在盒中装
有9张大小相同的精美卡片,卡片上分别印有“敬业”或“爱国”图案,抽奖规则:参加者从盒中抽取卡
片两张,若抽到两张分别是“爱国”和“敬业”卡即可获奖;否则,均为不获奖.卡片用后放回盒子,下
一位参加者继续重复进行.活动开始后,一位参加者问:“盒中有几张“爱国”卡?”主持人答:“我只
知道,从盒中抽取两张都是“敬业”卡的概率是 .”
(1)求抽奖者获奖的概率;
(2)为了增加抽奖的趣味性,规定每个抽奖者先从装有9张卡片的盒中随机抽出1张不放回,再用剩下8张
卡片按照之前的抽奖规则进行抽奖,现有甲、乙、丙三人依次抽奖,用X表示获奖的人数,求X的分布列
和均值.
2.(2024届THUSSAT中学生标准学术能力诊断性测试高三上学期9月测试)某单位组织知识竞赛,有甲、
乙两类问题.现有 、 、 三位员工参加比赛,比赛规则为:先从甲类问题中随机抽取一个问题回答,
若回答错误则该员工比赛结束;若回答正确再从乙类问题中随机抽取一个问题回答,无论回答正确与否,
该员工比赛结束.每人两次回答问题的过程相互独立.三人回答问题也相互独立.甲类问题中每个问题回
答正确得 分,否则得 分;乙类问题中每个问题回答正确得 分,否则得 分.已知 员工能正确回答
甲类问题的概率为 ,能正确回答乙类问题的概率为 ; 员工能正确回答甲类问题的概率为 ,能
正确回答乙类问题的概率为 ; 员工能正确回答甲类问题的概率为 ,能正确回答乙类问题的概率为
.
(1)求 人得分之和为 分的概率;
(2)设随机变量 为 人中得分为 的人数,求随机变量 的数学期望.
3.(2023届河南省开封市通许县第一高级中学高三下学期押题)有一种双人游戏,游戏规则如下:一个
袋子中有大小和质地相同的5个小球,其中有3个白色小球,2个红色小球,每次游戏双方从袋中轮流摸
出1个小球,摸后不放回,摸到第2个红球的人获胜,同时结束该次游戏,并把摸出的球重新放回袋中,
准备下一次游戏,且本次游戏中输掉的人在下一次游戏中先摸球.小胡和小张准备玩这种游戏,约定玩3
次,第一次游戏由小胡先摸球.
(1)在第一次游戏中,求在小胡第一轮摸到白球的情况下,小胡获胜的概率;
(2)记3次游戏中小胡获胜的次数为X,求X的分布列和数学期望.4.(重庆市巴蜀中高三上学期月考)2023年7月28日,第三十一届世界大学生夏季运动会在成都隆重开
幕.为庆祝大运会的到来,有 , , , , 共10位跳水爱好者自发组建了跳水训练营,并邀请教练
甲帮助训练.教练训练前对10位跳水员测试打分,得分情况如图中虚线所示;集训后再进行测试,10位跳
水员得分情况如图中实线所示,规定满分为10分,记得分在8分以上的为“优秀”.
优秀人数 非优秀人数 合计
训练前
训练后
合计
(1)将上面的列联表补充完整,并根据小概率值 的独立性检验,判断跳水员的优秀情况与训练是否
有关?并说明原因;
(2)从这10人中任选3人,在这3人中恰有2人训练后为“优秀”的条件下,求这3人中恰有1人是训练前
也为“优秀”的概率;
(3)跳水员 将对“5米、7.5米和10米”这三种高度进行集训,且在训练中进行了多轮测试.规定:在每轮
测试中,都会有这3种高度,且至少有2个高度的跳水测试达到“优秀”,则该轮测试才记为“优秀”.每
轮测试中,跳水员 在每个高度中达到“优秀”的概率均为 ,每个高度互不影响且每轮测试互不影响.如
果跳水员 在集训测试中要想获得“优秀”的次数平均值达到3次,那么理论上至少要进行多少轮测试?
附: ,其中 .
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828二、随机变量的分布列
5. (2024届湖南省永州市高三一模)某企业为提高竞争力,成功研发了三种新品 ,其中
能通过行业标准检测的概率分别为 ,且 是否通过行业标准检测相互独立.
(1)设新品 通过行业标准检测的品种数为 ,求 的分布列;
(2)已知新品 中的一件产品经检测认定为优质产品的概率为0.025,现从足量的新品 中任意抽取一件进
行检测,若取到的不是优质产品,则继续抽取下一件,直至取到优质产品为止,但抽取的总次数不超过 .
如果抽取次数的期望值不超过5,求 的最大值.
参考数据:
6.(2024届陕西省西安市高三上学期10月模拟)肺炎是指终末气道、肺泡和肺间质的炎症,由多种病因
所致的肺组织充血、水肿和渗出性炎症.夏季天气潮热、蝇蚊滋生、霉菌泛滥,再加上热应激的因素等,导
致肺炎高发.某调查小组为了解本市不同年龄段的肺炎患者在肺炎确诊两周内的治疗情况,在肺炎患者中随
机抽取200人进行调查,并将调查结果整理如下:
两周内治愈 两周内未治愈
12岁以上(含12岁) 90 30
12岁以下 50 30
(1)试判断是否有90%的把握认为该市肺炎患者在肺炎确诊两周内治愈与年龄有关;
(2)现从样本中肺炎确诊两周内未治愈的人群中用分层抽样法抽取4人做进一步调查,然后从这4人中随机
抽取2人填写调查问卷,记这2人中12岁以下的人数为X,求X的分布列与数学期望.
附:
0.150 0.100 0.050 0.025
2.072 2.706 3.841 5.024
,其中 .
7.(2024届贵州省贵阳市六校高三上学期联考)第19届亚运会的开幕式于2023年9月23日在我国杭州
举行.2023年8月,某商场为了吸引顾客,举行了“答题领优惠,杭州看亚运”促销活动.具体规则是:两
人一组进行答题比拼,比拼分两关进行.第一关:一道题,两人抽签决定谁答题(都有 的机会被抽到),答对得10分并获得100元优惠券,否则另一人得10分并获得100元优惠券;第二关:由第一关获得积分
和优惠券的人从6道题目中抽取2道题目回答,每回答正确一道题目就获得10分和100元优惠券,每答错
一道题目另一人获得10分和100元优惠券,两轮比赛结束后,积分更高者获胜,胜者将获得一张亚运会开
幕式门票和200元优惠券.现有甲、乙两人组成一组参加该游戏,已知第一关的问题甲能答对的概率为 ,
乙能答对的概率 ;第二关的6道题目中甲能答对4题,乙能答对3题.
(1)求甲获胜的概率;
(2)设 表示甲获得的优惠券总金额,求 的分布列和期望.
8.(2024届重庆市高三上学期第二次质量检测)2023年7月28日至8月8日在成都举行的第三十一届世
界大学生夏季运动会是中国西部第一次举办世界性综合运动会.在本届成都大运会中,共有800多支城市志
愿服务队139万青年志愿者参加.现某城市志愿服务队通过报名者对某比赛项目的了解程度进行筛选,筛选
规则:对报名者进行分组,每两人一组,同组两人以抢答形式进行比赛,共7道题,抢到并回答正确得一
分,答错则对方得一分,先得4分者获胜,比赛结束.已知在这次分组中,甲乙两人被分为一组,已知甲,
乙两人都参与每一次抢题,且每次抢到的概率相同,甲和乙正确回答每道题的概率分别是 、 ,且两人
各道题是否回答正确均相互独立.
(1)在第二道题结束时,求甲:乙的比分为2:0的概率;
(2)若已知在第三道题结束时甲得分以2:1领先,设到比赛结束时,两人共再继续抢答了 道题,求 的
分布列和数学期望.
三、期望与方差的应用
9. (2024届吉林省长春博硕学校高三上学期9月月考)某人准备应聘甲、乙两家公司的高级工程师,两家
公司应聘程序都是:应聘者先进行三项专业技能测试,专业技能测试通过后进入面试.已知该应聘者应聘
甲公司,每项专业技能测试通过的概率均为 ,该应聘者应聘乙公司,三项专业技能测试通过的概率依次
为 , ,m,其中 ,技能测试是否通过相互独立.
(1)若 ,分别求该应聘者应聘甲、乙两家公司,三项专业技能测试恰好通过两项的概率;
(2)若甲、乙两家公司的招聘在同一时间进行,该应聘者只能应聘其中一家,若以专业技能测试通过项目数的数学期望为决策依据,该应聘者更有可能通过乙公司的技能测试,求m的取值范围.
10.(2024届浙江省嘉兴市高三上学期9月测试)近年来,购买盲盒成为当下年轻人的潮流之一,为了引
导青少年正确消费,国家市场监管总局提出,盲盒经营行为应规范指引,经营者不能变相诱导消费.盲盒
最吸引人的地方,是因为盒子上没有标注,只有打开才会知道自己买到了什么,这种不确定性的背后就是
概率.几何分布是概率论中非常重要的一个概率模型,可描述如下:在独立的伯努利(Bernoulli)试验中,
若所考虑事件首次出现,则试验停止,此时所进行的试验次数 服从几何分布,事件发生的概率 即为几
何分布的参数,记作 .几何分布有如下性质:分布列为 , ,
期望 .现有甲文具店推出四种款式不同、单价相同的文具盲盒,数量足够多,
购买规则及概率规定如下:每次购买一个,且买到任意一种款式的文具盲盒是等可能的.
(1)现小嘉欲到甲文具店购买文具盲盒.
①求他第二次购买的文具盲盒的款式与第一次购买的不同的概率;
②设他首次买到两种不同款式的文具盲盒时所需要的购买次数为 ,求 的期望;
(2)若甲文具店的文具盲盒的单价为12元,乙文具店出售与甲文具店款式相同的非盲盒文具且单价为18元.
小兴为了买齐这四种款式的文具,他应选择去哪家文具店购买更省钱,并说明理由.
四、正态分布
11.(2024届云南民族大学附属中学高三上学期联考) 随着网络技术的迅速发展,各种购物群成为网络销
售的新渠道.在丑橘销售旺季,某丑橘基地随机抽查了100个购物群的销售情况,各购物群销售丑橘的数量
(都在100箱到600箱之间)情况如下:
丑橘数量(箱)
购物群数量(个) 18 18
(1)求实数 的值,并用组中值估计这100个购物群销售丑橘总量的平均数(箱);
(2)假设所有购物群销售丑橘的数量 服从正态分布 ,其中 为(1)中的平均数, 12100.若
参与销售该基地丑橘的购物群约有2000个,销售丑橘的数量在 (单位:箱)内的群为“一级
群”,销售数量小于266箱的购物群为“二级群”,销售数量大于等于596箱的购物群为“优质群”.该丑
橘基地对每个“优质群”奖励1000元,每个“一级群”奖励200元,“二级群”不奖励,则该丑橘基地大
约需要准备多少元?附:若 服从正态分布 ,则
.
12.(2024届浙江省浙南名校联盟高三上学期第一次联考)某型合金钢生产企业为了合金钢的碳含量百分
比在规定的值范围内,检验员在同一试验条件下,每天随机抽样10次,并测量其碳含量(单位:%).已
知其产品的碳含量服从正态分布 .
(1)假设生产状态正常,记 表示一天内10次抽样中其碳含量百分比在 之外的次数,求
及 的数学期望:
(2)一天内的抽检中,如果出现了至少1次检测的碳含量在 之外,就认为这一天的生产过程
可能出现了异常情况,需对当天的生产过程进行检查.下面是在一天中,检测员进行10次碳含量(单位:
%)检测得到的测量结果:
次数 1 2 3 4 5 6 7 8 9 10
碳含量(%) 0.31 0.32 0.34 0.31 0.30 0.31 0.32 0.31 0.33 0.32
经计算得, ,其中 为抽取的第 次的碳含量百分比
.
(i)用样本平均数 作为 的估计值 ,用样本标准差 作为 的估计值 ,利用估计值判断是否需对当
天的生产过程进行检查?
(ii)若去掉 ,剩下的数的平均数和标准差分别记为 ,试写出 的算式(用 表示 ).
附:若随机变量 服从正态分布 ,则 . .
五、用样本估计总体
13. (2024届天域全国名校协作体高三上学期10月联考)为了解某市区高中学生的阅读时间,从该市区随机抽取了800名学生进行调查,得到了这800名学生一周的平均阅读时间(单位:小时),并将样本数据
分成九组,绘制成如图所示的频率分布直方图.
(1)求a的值;
(2)为进一步了解这800名学生阅读时间的分配情况,从周平均阅读时间在 , , 三组
内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记周平均阅读时间在
内的学生人数为X,求X的分布列和数学期望;
(3)以样本的频率估计概率,从该市区学生周平均阅读时间在 内中随机抽取20名学生.这20名学生
中,周平均阅读时间在 内的学生最可能有多少名?
14.(2024届重庆市第八中学校高三上学期月考)树人中学有高一学生600人,其中男生400人,女生
200人.为了获得该校全体高一学生的身高信息,采用分层抽样的方法抽取一个容量为60的样本,并观测样
本的指标值(单位:cm),计算得男生样本的均值为170,方差为18,女生样本的均值为161,方差为30.
现有两种抽取样本的方案来计算总样本的均值和方差:①按比例分配分层抽样,男女样本量分别为40,
20;②按等额分配分层抽样,男、女样本量都是30.
(1)你认为哪种方案得到的总样本的均值和方差作为总体的均值和方差的估计更合理?请说明理由;
(2)请用第(1)问中你选择的方案计算总样本的均值 与方差s²;
(3)根据总样本数据发现有两个数据154,180在区间 以外,在总样本数据中剔除这两个数据,
用剩下的数据计算新总样本均值和方差(精确到0.1).15.(2024届青海省西宁市大通县高三上学期开学摸底考试)如图是M市某爱国主义教育基地宣传栏中标
题为“2015~2022年基地接待青少年人次”的统计图.根据该统计图提供的信息解决下列问题.
①参考数据:
0 1 2 3
90 330
②参考公式:对于一组数据 ,其回归直线 的斜率和截距的最小二乘法公
式分别为: .
(1)求M市爱国主义教育基地所统计的8年中接待青少年人次的平均值和中位数;
(2)由统计图可看出,从2019年开始,M市爱国主义教育基地接待青少年的人次呈直线上升趋势,请你用
线性回归分析的方法预测2024年基地接待青少年的人次.
六、独立性检验
16.(2023届江西省九江市高三上学期第一次模拟)某IT公司在A,B两地区各开设了一家分公司,为了
解两家分公司员工的业务水平,对员工们进行了业务水平测试,满分为100分,80分及以上为优秀. A地
区分公司的测试成绩分布情况如下:
成
绩
频
5 20 50 20 5
数(1)完成A地区分公司的频率分布直方图,并求出该公司员工测试
成绩的中位数;
(2)补充完成下列 列联表,并判断是否有 的把握认为两家分公司员工业务水平有差异.
优秀 不优秀 合计
A地区分公司
B地区分公司 40 60
合计
0.100 0.050 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
【来源】拟数学(文)试题
17.(2023届河北省唐山市邯郸市等2地高三上学期期末)数据中心是全球协作的特定设备网络,用于在
网络上处理、存储和传递数据信息.由于数据中心对算力的要求很高,在高速运转时往往会产生巨大的热
量.如果不对设备进行散热,会对设备的正常运作造成不可忽视的影响.氟化液是最为适合浸没式液冷系
统的电子设备冷却液.由于氟化液技术壁垒较高,此前高性能电子氟化液长期被国外垄断.2020年巨化集
团技术中心成功开发出高性能巨芯冷却液,填补了国内高性能大数据中心专用冷却液的空白.一工厂生产
某型号的氯化液其抗张强度 100Mpa为合格品,否则为不合格品.该厂有新旧两套生产设备同时生产,按
两设备生产量分层抽样进行⩾检测,其中新设备和旧设备生产的产品中分别抽取了12桶和8桶,测得每桶抗
张强度值(单位:Mpa)如下表所示:
甲 102.1 101.0 100.8 103.6 107.6 99.9 100.2 100.9 105.7 98.8 103.2 104.1
乙 103.3 102.6 107.1 99.5 102.8 103.6 99.5 102.3(1)根据抽检结果请完成下面的 列联表,试根据小概率值 的独立性检验,分析新设备是否比旧
设备好.
不合格
合格(桶) 合计
(桶)
新设备
旧设备
合计
(2)从旧设备产品抽得的样本中随机抽取3桶,求抽到的不合格桶数 的分布列和数学期望;
(3)从该厂所有产品中任取一桶,用抽检频率估计概率,求抽到的一桶不合格的概率.
参考公式: ,其中 .
0.15 0.10 0.05 0.025
2.072 2.706 3.841 5.024
18.(2023届湖北省武汉市部分学校高三上学期九月调研)近期世界地震、洪水、森林大火等自然灾害频
繁出现,紧急避险知识越来越引起人们的重视.某校为考察学生对紧急避险知识的掌握情况,从全校学生
中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成绩都在区间
范围内,由测试成绩数据作出如图所示的频率分布直方图.
(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中m的值;
(2)规定测试成绩不低于80分为优秀,已知共有45名男生成绩优秀,完成下面的列联表,并根据小概率值
的独立性检验,能否推断男生和女生的测试成绩优秀率有差异?
性别 测试成绩 合计优秀 不优秀
男生 45
女生
合计
参考公式与数据:
0.1 0.05 0.01
2.706 3.841 6.635
七、回归分析
19.(2024届云南师范大学附属中学高三月考)近年来我国新能源汽车产业迅速发展,下表是某地区新能
源乘用车的年销售量与年份的统计表:
年份
销量 (万台)
某机构调查了该地区 位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购置传统燃油
购置新能源车 总计
车
男性车主
女性车主
总计
(1)求新能源乘用车的销量 关于年份 的线性相关系数 ,并判断 与 之间的线性相关关系的强弱;
(若 ,相关性较强;若 ,相关性一般;若 ,相关性较弱)
(2)请将上述 列联表补充完整,根据小概率值 的独立性检验,分析购车车主购置新能源乘用车
与性别是否有关系?
①参考公式:相关系数 ;②参考数据: ;
③卡方临界值表:
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
其中 , .
20.(2024届云南省昆明市第二十四中学高三上学期月考)云南省统计局发布《全省旅游业发展情况
(2015-2022年)》报告,其中2015年至2022年游客总人数y(单位:亿人次)的数据如下表:
201 202
年份 2015 2016 2018 2019 2020 2022
7 1
年份代号x 1 2 3 4 5 6 7 8
游客总人数y 3.3 4.3 5.7 6.9 8.1 5.3 6.5 8.4
为了预测2023年云南省游客总人数,根据2015年至2022年游客总人数y的数据建立线性回归模型一,得
到回归方程 : ,但由于受到2020年疫情影响,估计预测不准确,若用2015年至2019年
数据建立线性回归模型二,得到回归方程 :
(1)根据 和 预测2023年云南省游客总人数(预测数据精确到0.1);
(2)为了检验两种模型的预测效果,对两种模型作残差分析得到:
模型一:总偏差平方和 ,残差平方和 ;
模型二:总偏差平方和 ,残差平方和 ,
用 来比较模型一与模型二的拟合效果( 精确到0.001);
(3)根据2020年至2022年游客总人数y的数据建立线性回归模型三,求回归方程 ,并根据 预测2023年
云南省游客总人数(预测数据精确到0.1).参考公式: , , , .
21.(2024届重庆市高三上学期9月质量检测)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,
每只红蜘蛛的平均产卵数y(个)和平均温度x(℃)有关,现收集了以往某地的7组数据,得到下面的散
点图及一些统计量的值.
(1)根据散点图判断, 与 (其中 …为自然对数的底数)哪一个更适合作为平均产
卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中 , ,
参考数据( )
2
5215 17713 714 81.3 3.6
7
(3)根据以往每年平均气温以及对果园年产值的统计,得到以下数据:平均气温在22℃以下的年数占60%,
对柚子产量影响不大,不需要采取防虫措施;平均气温在22℃至28℃的年数占30%,柚子产量会下降
20%;平均气温在28℃以上的年数占10%,柚子产量会下降50%.为了更好的防治红蜘蛛虫害,农科所研发
出各种防害措施供果农选择.
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益=产值-防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施A,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施B,可以防治22℃至28℃的蜘蛛虫害,但无法防治28℃以上的红蜘蛛虫害,费用是
10万;
方案3:不采取防虫害措施.