文档内容
【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)
素养拓展 39 概率与统计的综合问题(精讲+精
练)
一、知识点梳理
①超几何分布与统计
②二项分布与统计
③正态分布与统计
④条件概率与统计
一、概率与统计问题
概率与统计是高考数学命题中的必考题, 由于概率与统计中的分析方法与计数有关, 而计数中的分析方法
不同于逻辑分析方法, 需要重新建立一种独特的思维模式. 在此过程中, 基础不够牢固的话,遇到思维障碍
较多.随机变量的分布列建立在随机变量的取值与取值的概率之上, 把随机变量的取值转化为随机事件, 才
容易通过计数方法得到取值的概率. 概率统计问题本质上难在两个方面:一是模型的识别与分析, 要准确把
握给定现象或信息中随机变量 所遵循的概率模型; 二是在计算分布列时, 随机变量取值转化为随机事件的
概率, 这涉及计数的难点.
二、相关知识点归纳
Ⅰ 频率分布直方图
1.频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为 ,利用 左(右)侧矩形面积之和等
于 ,即可求出 .
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和,即有 ,其中 为每个小长方形底边的中点, 为每个小长
方形的面积.Ⅱ 独立性检验
(1)定义:利用独立性假设、随机变量 来确定是否有一定把握认为“两个分类变量有关系”的方法称
为两个分类变量的独立性检验.
(2)公式: ,其中 为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量 的观测值 ,查下表确定临界值 :
0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
②如果 ,就推断“ 与 有关系”,这种推断犯错误的概率不超过 ;否则,就认为在犯
错误的概率不超过 的前提下不能推断“ 与 有关系”.
Ⅲ 线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x,y),(x,y),…,(x,y),其回归方程 的求法
1 1 2 2 n n
为
其中, , ,( , )称为样本点的中心.
Ⅳ 二项分布
1.定义
一般地,在 次独立重复试验中,用 表示事件 发生的次数,设每次试验中事件 发生的概率为 ,不
发生的概率 ,那么事件 恰好发生 次的概率是 ( , , ,…, )
于是得到 的分布列
… …
… …
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量 服从参数为 , 的二项分布,记作 ,并称 为成功概率.
3.二项分布的期望、方差
若 ,则 , .
Ⅴ 超几何分布
1.定义
在含有 件次品的 件产品中,任取 件,其中恰有 件次品,则事件 发生的概率为
, ,其中 ,且
,1,2,…, , , , ,
,称分布列为超几何分布列.如果随机变量 的分布列为超几何分布列,则称随机变量X 服从超
几何分布.
0 1 …
…
Ⅵ 正态分布
1.定义
随机变量 落在区间 的概率为 ,即由正态曲线,过点 和点
的两条 轴的垂线,及 轴所围成的平面图形的面积,如下图中阴影部分所示,就是 落在区间 的
概率的近似值.
一般地,如果对于任何实数 , ,随机变量 满足 ,则称随机变量 服
从正态分布.正态分布完全由参数 , 确定,因此正态分布常记作 .如果随机变量 服从正
态分布,则记为 .
其中,参数 是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计; 是衡量随机变量总
体波动大小的特征数,可以用样本的标准差去估计.
2. 原则
若 ,则对于任意的实数 , 为下图中阴影部分的面
积,对于固定的 和 而言,该面积随着 的减小而变大.这说明 越小, 落在区间 的概
率越大,即 集中在 周围的概率越大特别地,有 ; ;
.
由 ,知正态总体几乎总取值于区间 之内.而在此区间以
外取值的概率只有 ,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应
用中,通常认为服从于正态分布 的随机变量 只取 之间的值,并简称之为
原则.
二、题型精讲精练
【典例1】某学校共有1000名学生参加知识竞赛,其中男生500人,为了解该校学生在知识竞赛中的情
况,采取分层抽样随机抽取了100名学生进行调查,分数分布在 分之间,根据调查的结果绘制的
学生分数频率分布直方图如图所示:将分数不低于750分的学生称为“高分选手”.
(1)求 的值,并估计该校学生分数的平均数、中位数和众数;(同一组中的数据用该组区间的中点值作代
表);
(2)现采用分层抽样的方式从分数落在 , 内的两组学生中抽取8人,再从这8人中随机
抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量 ,求 的分布列及数学期望.
【详解】(1)由题意知 ,解得 ,所以每组的频率依次为 ,
样本平均数 ,
因为 ,所以中位数650,
又因为 的频率最大,所以众数为600.
(2)由题意可得:从 中抽取 人,从 中抽取 人,
则随机变量 的所有可能取值有0,1,2,3.可知 ,
即 ,
所以随机变量 的分布列为:
0 1 2 3
随机变量 的数学期望 .
【典例2】某市热线网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票,按照该市
暴雨前后两个时间各收集了50份有效投票,所得统计结果如下表:
支持情况
暴雨
前后 不支
支持 总计
持
暴雨
x y 50
后
暴雨
20 30 50
前
总计 A B 100
已知工作人员从所有投票中任取一张,取到“不支持投入”的投票概率为 .
(1)求列联表中的数据x,y,A,B的值;
(2)能够有多大把握认为暴雨与该市民众是否赞成加大修建城市地下排水设施的投入有关?(3)用样本估计总体,在该市全体市民中任意选取4人,其中“支持加大修建城市地下排水设施的资金投
入”的人数记为ξ,求ξ的分布列和数学期望.
附: .
【详解】(1)设“从所有投票中任取一张,取到‘不支持投入’的投票”为事件C,
由已知得 ,
所以 ,所以 , , ;
(2)χ2= ,
故有99%的把握认为暴雨对该市民众是否赞成加大对修建城市地下排水设施的投入有关.
(3)ξ的所有可能取值为0,1,2,3,4,用样本估计总体,任取一人支持的概率 ,所以
,
所以ξ的分布列为:
ξ 0 1 2 3 4
P
【典例3】射箭是群众喜闻乐见的运动形式之一,某项赛事前,甲、乙两名射箭受好者各射了一组(72
支)箭进行赛前热身训练,下表是箭靶区域划分及两人成绩的频数记录信息:
箭靶区域 环外 黑环 蓝环 红环 黄圈
区域颜色 白色 黑色 蓝色 红色 黄色
环数 1-2环 3-4环 5环 6环 7环 8环 9环 10环
甲成绩(频数) 0 0 1 2 3 6 36 24
乙成绩(频数) 0 1 2 4 5 12 36 12
用赛前热身训练的成绩估计两名运动员的正式比赛的竞技水平,并假设运动员竞技水平互不影响,运动员每支箭的成绩也互不影响.
(1)甲乙各射出一支箭,求有人命中8环及以上的概率;
(2)甲乙各射出两支箭,求共有3支箭命中黄圈的概率.
【详解】(1)设 “甲运动员一箭命中8环及以上”, “乙运动员一箭命中8环及以上”,
“有人命中8环及以上”,则 , ,
显然事件A,B相互独立, ,
,
所以甲乙各射出一支箭,有人命中8环及以上的概率为 .
(2)设 =“甲运动员第i箭命中黄圈”, =“乙运动员第i箭命中黄圈”, ,
则 , ,设 “共有3支箭命中黄圈”,
,显然 相互独立,
且 , , , 互斥,
所以甲乙各射出两支箭,共有3支箭命中黄圈的概率为:
.
【典例4】 企业 的产品 正常生产时,产品 尺寸服从正态分布 ,从当前生产线上随机
抽取400件产品进行检测,产品尺寸汇总如下表:
产品尺寸
件数 8 54 54 160 72 40 12
根据产品质量标准和生产线的实际情况,产品尺寸在 以外视为小概率事件.一旦小概率事件发生视为生产线出现异常,产品尺寸在 以内为正品,以外为次品.
.
(1)判断生产线是否正常工作,并说明理由;
(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测费20元/件,次品检测费30元/件,记
这3件产品检测费为随机变量 ,求 的数学期望及方差.
【详解】(1) 产品 尺寸服从正态分布 ,
,且正常产品尺寸范围为 .
生产线正常工作,次品不能多于 (件),
而实际上,超出正常范围以外的零件数为20,故生产线没有正常工作;
(2)尺寸在 以外的就是次品,故次品率为 .
记这3件产品中次品件数为 ,则 服从二项分布 ,
,
则 ,
所以 的数学期望是 (元),
方差是 .
【典例5】共享单车是企业与政府合作,在校园,地铁站点、公交站点、居民区、商业区、公共服务区等
区域提供的公共自行车及其共享服务,是共享经济的一种新形态.某市研究了广大市民骑行共享单车的情
况,随机抽取了180名用户进行调查,得到数据如下表(单位:人).
每周骑行次数
性
别
小于等于1次 2次 3次 4次 5次 6次及以上男 24 10 11 11 12 52
女 6 5 4 13 10 22
合
30 15 15 24 22 74
计
(1)约定“每周骑行超过3次的用户为喜欢骑共享单车”,判断能否有90%的把握认为是否喜欢骑共享单车
与性别有关;
(2)若从被调查人员中任选一个喜欢骑共享单车的人,求该人为男性的概率.
附: ,其中 .
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【详解】(1)由表格可得 列联表如下.
是否喜欢骑共享单车
性别 合计
不喜欢 喜欢
男 45 75 120
女 15 45 60
合计 60 120 180
,
从而有90%的把握认为是否喜欢骑共享单车与性别有关.
(2)设事件B为“喜欢骑共享单车的人”,事件 为“抽取的人为男性”,
事件 为“抽取的人为女性”,则 .
, ,
, ,
由全概率公式得,,
所以 .
所以从被调查人员中任选一个喜欢骑共享单车的人,该人为男性的概率为 .
【题型训练1-刷真题】
一、解答题
1.(2023·全国·统考高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其
中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白
鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设 表示指定的两只小白鼠中分配到对照组的只数,求 的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如
下列联表:
对照
组
实验
组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加
量有差异.
附:0.100 0.050 0.010
2.706 3.841 6.635
【答案】(1)分布列见解析,
(2)(i) ;列联表见解析,(ii)能
【分析】(1)利用超几何分布的知识即可求得分布列及数学期望;
(2)(i)根据中位数的定义即可求得 ,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【详解】(1)依题意, 的可能取值为 ,
则 , , ,
所以 的分布列为:
故 .
(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位
与第21位数据的平均数,观察数据可得第20位为 ,第21位数据为 ,
所以 ,
故列联表为:
合计
对照组 6 14 20
实验组 14 6 20
合计 20 20 40
(ii)由(i)可得, ,
所以能有 的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
2.(2022·全国·统考高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间 的概率;
(3)已知该地区这种疾病的患病率为 ,该地区年龄位于区间 的人口占该地区总人口的 .从该
地区中任选一人,若此人的年龄位于区间 ,求此人患这种疾病的概率.(以样本数据中患者的年龄
位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1) 岁;
(2) ;
(3) .
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设 {一人患这种疾病的年龄在区间 },根据对立事件的概率公式 即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设 {一人患这种疾病的年龄在区间 },所以
.
(3)设 “任选一人年龄位于区间[40,50)”, “从该地区中任选一人患这种疾病”,
则由已知得:,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间 ,此人患这种疾病的概率为
.
3.(2022·北京·统考高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到
以上(含 )的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙
以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【答案】(1)0.4
(2)
(3)丙
【分析】(1) 由频率估计概率即可
(2) 求解得X的分布列,即可计算出X的数学期望.
(3) 计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.
【详解】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,
故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,,
,
.
∴X的分布列为
X 0 1 2 3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为 ,甲获得9.80的概率为 ,
乙获得9.78的概率为 .并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
4.(2022·全国·统考高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习
惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在
未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良
良好
好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该
疾病”. 与 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标
为R.
(ⅰ)证明: ;(ⅱ)利用该调查数据,给出 的估计值,并利用(ⅰ)的结果给出R的估计值.
附 ,
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii) ;
【分析】(1)由所给数据结合公式求出 的值,将其与临界值比较大小,由此确定是否有99%的把握认为
患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)
根据(i)结合已知数据求 .
【详解】(1)由已知 ,
又 , ,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为 ,
所以
所以 ,
(ii)
由已知 , ,
又 , ,
所以【题型训练2-刷模拟】
1 . 超几何分布与统计
一、解答题
1.电网公司将调整电价,为此从某社区随机抽取100户用户进行月用电量调查,发现他们的月用电量都在
之间,进行适当分组后(每组为左闭右开区间),画出如图所示的频率分布直方图.
(1)求 的值;
(2)若采用按比例分配的分层随机抽样的方法,从月用电量不低于 的用户中抽9户用户,再从这9
户用户中随机抽取3户,记月用电量在区间 内的户数为 ,试求 的分布列和数学期望.
【答案】(1)
(2)分布列见解析,1
【分析】(1)根据频率分布直方图利用频率之和为1可求得 的值.
(2)利用分层抽样得两组各抽取样本数,结合超几何分布求解概率即可得分布列,从而可求数学期望.
【详解】(1)因为 ,所以 .
(2)月用电量在 , 的频率分别为: ,据按比例分配的分层随机抽样可知:
用电量在 , 的分别有 人, 人,从而 可取的值为:0,1,2,3.
,
故 的分布列为:则 .
2.中国进出口商品交易会,简称广交会,是由中国商务部和广东省人民政府共同主办、中国对外贸易中
心承办,创办于1957年4月25日,每年春秋两季在广州举办.为调查广州地区大学生对广交会举办的了解
情况,从广州各高校抽取400名学生进行问卷调查,得到部分数据如下表,
男 女 总计
8
了解
0
不了解 160
总计 200 400
(1)完成上述2×2列联表,并判断是否有99.9%的把握认为广州地区大学生对广交会举办的了解情况与性别
有关;
(2)据调查,广州某高校学生会宣传部6人中有3人了解广交会情况,现从这6人中随机抽取4人参加2024
年广交会志愿服务,设抽取的人中了解广交会的人数为X,求X的分布列与期望.
参考公式: .
参考数据:
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)表格见解析,有
(2)分布列见解析,
【分析】(1)根据表中已有数据计算,即可完成表格;求出 的值,根据独立性检验,即可得出答案;
(2)根据超几何概率公式计算出 时的概率,列出分布列,根据期望公式计算即可得出答案.
【详解】(1)根据已知完成2×2列联表如下,男 女 总计
了解 80 40 120
不了解 120 160 280
总计 200 200 400
则 ,
所以有99.9%的把握认为上海地区大学生对进口博览会展区设置的了解情况与性别有关.
(2)根据题意,X的可能取值为1,2,3,
, , .
则X的分布列为:
1 2 3
则 .
3.下表为某班学生理科综合能力测试成绩(百分制)的频率分布表,已知在 分数段内的学生人数
为21.`
分数
段
频率 0.1 0.15 0.2 0.2 0.15 0.1 *
(1)求测试成绩在 分数段内的人数;
(2)现欲从 分数段内的学生中抽出2人参加物理兴趣小组,若其中至少有一名男生的概率为 ,求
分数段内男生的人数;
(3)若在 分数段内的女生为4人,现欲从 分数段内的学生中抽出3人参加培优小组, 为分配
到此组的3名学生中男生的人数.求 的分布列及期望【答案】(1)6
(2)2
(3)分布列见解析,
【分析】(1)利用在 分数段内的学生数为21人求出高二年级某班学生总数,再利用频率和为1求
出 ,两数相乘可得答案;
(2)设男生有 人,根据抽出2人这2人都是男生的概率为 ,解得 可得答案;
(3)求出在 分数段内的学生人数及男生人数,可得 的取值及对应的概率,可得分布列和期望.
【详解】(1)某班学生共有 人,
因为 ,所以 ,
所以测试成绩在 分数段内的人数为 人.
(2)由(1)知在 分数段内的学生有6人,设男生有 人,
若抽出2人至少有一名男生的概率为 ,
则 ,解得 ,所以在 分数段内男生有2人.
(3)在 分数段内的学生有 人,所以男生有2人,
X的取值有 ,
,
,
,X的分布列为
0 1 2
.
4.为了适当疏导电价矛盾,保障电力供应,支持可再生能源发展,促进节能减排,某省推出了省内居民
阶梯电价的计算标准:以一个年度为计费周期,月度滚动使用.第一阶梯:年用电量在2160度以下(含
2160度),执行第一档电价0.5653元/度;第二阶梯:年用电量在2161度到4 200度内(含4200度),超出
2160度的电量执行第二档电价0.6153元/度;第三阶梯:年用电量在4200度以上,超出4200度的电量执行
第三档电价0.8653元/度.
某市的电力部门从本市的用户中随机抽取10户,统计其同一年度的用电情况,列表如下:
用户
1 2 3 4 5 6 7 8 9 10
编号
年用电量/度 1000 1260 1400 1824 2180 2423 2815 3325 4411 4600
(1)计算表中编号为10的用户该年应交的电费;
(2)现要在这10户中任意选取4户,对其用电情况进行进一步分析,求取到第二阶梯的户数的分布列.
【答案】(1)2822.38
(2)分布列见解析
【分析】(1)根据阶梯电价的计算标准,分段计算编号为10的用户一年的用电费用,即得答案;
(2)确定第二阶梯的户数,设取到第二阶梯的户数为X,确定其可能的取值,根据超几何分布的概率计算,
求出每个值相应的概率,即可得分布列.
【详解】(1)(因为第二档电价比第一档电价每度多0.05元,
第三档电价比第一档电价每度多0.3元,
编号为10的用户一年的用电量是4600度,
所以该户该年应交电费为
(元).
(2)设取到第二阶梯的户数为X,
易知第二阶梯有4户,则X的所有可能取值为0,1,2,3,4., , ,
, ,
故X的分布列为
X 0 1 2 3 4
P
5.某研究小组为研究经常锻炼与成绩好差的关系,从全市若干所学校中随机抽取100名学生进行调查,其
中有体育锻炼习惯的有45人.经调查,得到这100名学生近期考试的分数的频率分布直方图.记分数在
600分以上的为优秀,其余为合格.
(1)请完成下列 列联表.根据小概率值 的独立性检验,分析成绩优秀与体育锻炼有没有关系.
经常锻
不经常锻炼 合计
炼
合格 25
优秀 10
合计 100
(2)现采取分层抽样的方法,从这100人中抽取10人,再从这10人中随机抽取5人进行进一步调查,记抽
到5人中优秀的人数为X,求X的分布列.
附: ,其中 .
0.050 0.010 0.001k 3.841 6.635 10.828
【答案】(1)列联表见解析;成绩优秀与是否经常体育锻炼有关联
(2)分布列见解析
【分析】(1)根据题意,得到 列联表,求得 的值,结合附表,即可得到结论;
(2)根据题意,求得抽取的10人中合格有 人,优秀的为 人,得到 服从超几何分布,得出 的可能
值,求得相应的概率,列出分布列.
【详解】(1)解:根据题意,得到 列联表
经常锻炼 不经常锻炼 合计
合格 25 45 70
优秀 20 10 30
合计 45 55 100
零假设 :成绩是否优秀与是否经常体育锻炼无关,
可得 .
根据小概率值 的独立性检验,推断 不成立,
所以 的把握认为成绩优秀与是否经常体育锻炼有关联.
(2)解:根据频率分布直方图,可得大于600分的频率为 ,
小于600分的频率为 ,
所以由分层抽样知,抽取的10人中合格有 人,优秀的为 人,
则从这10人中随机抽取5人,优秀人数 服从超几何分布,
由题意 的可能值为0,1,2,3
可得 , , ,所以随机变量 分布列为
X 0 1 2 3
P
6.温室是以采光覆盖材料作为全部或部分围护结构材料,具有透光、避雨、保温、控温等功能,可在冬
季或其他不适宜露地植物生长的季节供栽培植物的建筑,而温室蔬菜种植技术是一种比较常见的技术,它
具有较好的保温性能,使人们在任何时间都可吃到反季节的蔬菜,深受大众喜爱.温室蔬菜生长和蔬菜产品
卫生质量要求的温室内土壤、灌溉水、环境空气等环境质量指标,其温室蔬菜产地环境质量等级划定如表
所示.
环境质量等 土壤各单项或综合质量 灌溉水各单项或综合质量 环境空气各单项或综合质 等级名
级 指数 指数 量指数 称
清洁
尚清洁
超标
各环境要素的综合质量指数超标,灌溉水、环境空气可认为污染,土壤则应做进一步调研,若确对其所影
响的植物(生长发育、可食部分超标或用作饮料部分超标)或周围环境(地下水、地表水、大气等)有危
害,方能确定为污染.某乡政府计划对所管辖的甲、乙、丙、丁、戊、已、庚、辛,共 个村发展温室蔬菜
种植,对各村试验温室蔬菜环境产地质量监测得到的相关数据如下:
(1)若从这 个村中随机抽取 个进行调查,求抽取的 个村应对土壤做进一步调研的概率;
(2)现有一技术人员在这 个村中随机选取 个进行技术指导,记 为技术员选中村的环境空气等级为尚清
洁的个数,求 的分布列和数学期望.
【答案】(1)(2)分布列见解析;数学期望
【分析】(1)根据折线图可得应对土壤做进一步调研的村子个数,结合组合数知识可求得基本事件总数
和满足题意的基本事件个数,由古典概型概率公式可求得结果;
(2)根据折线图可得环境空气等级为尚清洁的村子个数,由此可得 所有可能的取值,由超几何分布概率
公式可求得每个取值对应的概率,由此可得分布列;根据数学期望计算公式可求得期望值.
【详解】(1)由折线图可知:应对土壤做进一步调研的村共 个,
从 个村中随机抽取 个进行调查,基本事件总数有 个;
其中抽取的 个村应对土壤做进一步调研的基本事件个数有 个,
所求概率 .
(2)由折线图可知:环境空气等级为尚清洁的村共有 个,则 所有可能的取值为 ,
; ; ; ;
的分布列为:
数学期望 .
7.人工智能(AI)是当今科技领域最热门的话题之一,某学校组织学生参加以人工智能(AI)为主题的
知识竞赛,为了解该校学生在该知识竞赛中的情况,现采用随机抽样的方法抽取了600名学生进行调查,
分数分布在450~950分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示.将分数不低于
850分的学生称为“最佳选手”.(1)求频率分布直方图中a的值,并估计该校学生分数的中位数;
(2)现采用分层抽样的方法从分数落在 , 内的两组学生中抽取7人,再从这7人中随机
抽取3人,记被抽取的3名学生中属于“最佳选手”的学生人数为随机变量 ,求 的分布列及数学期望.
【答案】(1) ,670
(2)分布列见解析,数学期望为
【分析】(1)根据频率之和为 求得 ,根据中位数的求法求得中位数.
(2)根据超几何分布的知识求得分布列,进而求得数学期望.
【详解】(1)由题意知 ,
解得 ,
分数段 对应的频率为0.1, 对应的频率为0.35, 对应的频率为0.25,
设中位数为x,则 .
由 ,解得 .
(2)由题意知从分数段 对应的学生中抽取5人,
从 对应的学生中抽取2人,随机变量 的所有可能取值为0,1,2.
则 ,
,,
随机变量X的分布列为
0 1 2
所以 .
8.南水北调中线工程建成以来,通过生态补水和减少地下水开采,华北地下水位有了较大的回升,水质
有了较大的改善,为了研究地下水位的回升情况,对2015年-2021年河北平原地区地下水埋深进行统计,
所得数据如下表:
年份 2015 2016 2017 2018 2019 2020 2021
埋深(单位:
25.74 25.22 24.95 23.02 22.69 22.03 20.36
米)
根据散点图知,该地区地下水位埋深 与年份 (2015年作为第1年)可以用直线 拟合.
(1)根据所给数据求线性回归方程 ,并利用该回归方程预测2023年河北平原地区地下水位埋深;
(2)从2016年至2021年这6年中任取3年,该地区这3年中每一年地下水位与该地区上一年地下水位相比
回升超过0.5米的年份数为 ,求 的分布列与数学期望.
附相关表数据: .
参考公式: ,其中 .
【答案】(1) , 米
(2)分布列见解析,
【分析】(1)根据最小二乘法求出 和 可得线性回归方程,再代入 可得结果;
(2)根据超几何分布的概率公式和期望公式可求出结果.【详解】(1) , , ,
,
所以 , ,
所以所求线性回归方程为 .
当 时, 米.
所以预测2023年河北平原地区地下水位埋深为 米.
(2)因为 , ,
, ,
, ,
所以从2016年至2021年这6年中,每一年地下水位与该地区上一年地下水位相比回升超过0.5米的年份有
,共 个年份,
的所有可能取值为 ,
, , ,
所以 的分布列为:
1 2 3
.
9.2023年“十一”长假期间,某商场的一些店铺纷纷加大了促销力度. 现随机抽取7家店铺,得到其广告
促销支出 (单位:万元)与销售额 (单位:万元)数据如下:
店铺 A B C D E F G
1
广告支出/万元 1 2 4 6 10 20
3
1 4 5
销售额/万元 32 44 52 54
9 0 3(1)建立 关于 的一元线性回归方程(系数精确到0.01),并预测当促销支出为30万元时,销售额为多少
万元;
(2)若将店铺的销售额 与促销支出 的比值称为该店铺的促销效率值 ,当 时,称该店铺的促销手
段为“金牌方案”,从这7家店铺中随机抽取4家,记这4家店铺中“金牌方案”的店铺数为X,求X的
分布列与期望.
注:参考数据 , ,回归方程 中斜率和截距的最小二乘估计公式分别为
, .
【答案】(1) ; 万元;
(2)分布列见解析, .
【分析】(1)首先计算 ,再根据参考公式和数据,分别计算 ,即可得出答案;
(2)根据超几何分布求概率,再根据分布列求期望.
【详解】(1)解:由数据可得 ;
,
又 ,
,
.
.
则当 时, 万元.即当促销支出为30万元时,销售额为 万元.
(2)由题知,7家超市中有3家超市的广告是“好广告”,X的可能取值是0,1,2,3
.
.
所以 的分布列为
0 1 2 3
所以 .
10.某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能
评分,每款车都有1分、2分、3分、4分、5分五个等级,各评分的相应人数统计结果如下表所示.
评分
1分 2分 3分 4分 5分
款式
基础版1 2 2 3 1 0
基础版
基础版2 4 4 5 3 1
豪华版1 1 3 5 4 1
豪华版
豪华版2 0 0 3 5 3
(1)求这四款车得分的平均数和第90百分位数;
(2)约定当得分不小于4时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下
列联表,取显著性水平 ,能否认为汽车的性能与款式有关?说明理由
汽车款式
汽车性
合计
能
基础版 豪华版
一般
优秀合计
(3)为进一步提升产品品质,现从样本评分不大于2的基础版车主中,随机抽取3人征求意见,设随机变量
表示其中基础版1车主的人数,求 的分布和期望.
附: ; ,
【答案】(1)3;4.5
(2)答案见解析
(3)分布列见解析;
【分析】(1)根据平均数和百分位数的定义求解即可;
(2)根据题意写出列联表,再结合公式求解即可;
(3)根据超几何分布计算概率,进而求解分布列和期望.
【详解】(1)由题意,这四款车得分的平均数为 ,
因为 ,
所以这四款车得分的第90百分位数为 .
(2)由题意, 列联表如下:
汽车款式
汽车性能 合计
基础版 豪华版
一般 20 12 32
优秀 5 13 18
合计 25 25 50
则 ,
所以能在犯错误概率不超过 的前提下认为汽车的性能与款式有关.
(3)由题意可得 服从超几何分布,且 , , ,
的所有可能取值为0,1,2,3,则 , ,
, ,
所以 的分布列为:
0 1 2 3
则 .
11.为了引导居民合理用电,国家决定实行合理的阶梯电价,居民用电原则上以住宅单位(一套住宅为一
户).
第一阶
阶梯级别 第二阶梯 第三阶梯
梯
月用电范围(度)
某市随机抽取10户同一个月的用电情况,得到统计表如下:
居民用电编
1 2 3 4 5 6 7 8 9 10
号
用电量
53 86 90 124 132 200 215 225 300 410
(度)
(1)若规定第一阶梯电价每度 元,第二阶梯超出第一阶梯的部分每度 元,第三阶梯超出第二阶梯每度
元,式计算 居民用电户用电 度时应交电费多少元?
(2)现要在这10户家庭中任意选取3户,求取到第二阶梯电量的用户数的分布与期望;
(3)以表中抽到的10户作为样本估计全是居民用电,现从全市中依次抽取10户,若抽到 户用电量为第一
阶梯的可能性最大,求 的值.
【答案】(1)227元
(2)分布列见解析,
(3)6
【详解】(1) 元 ;(2)设取到第二阶梯电量的用户数为 ,可知第二阶梯电量的用户有3户,则 可取0,1,2,3
故 的分布列是
0 1 2 3
所以 ;
(3)可知从全市中抽取10户的用电量为第一阶梯,满足 ,可知
,解得 ,
所以当 时,概率最大,所以 .
12.我国风云系列卫星可以检测气象和国土资源情况.某地区水文研究人员为了了解汛期人工测雨量 (单位:
dm)与遥测雨量 (单位:dm)的关系,统计得到该地区10组雨量数据如下:
样本号 1 2 3 4 5 6 7 8 9 10
人工测雨量 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23
5遥测雨量 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49
0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26
并计算得
(1)求该地区汛期遥测雨量 与人工测雨量 的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若 ,则认为两个变量有较强的线性相关性)
(2)规定:数组 满足 为“Ⅰ类误差”,满足 为“Ⅱ类误差”,满足
为“Ⅲ类误差”.为进一步研究该地区水文研究人员,从“Ⅰ类误差”、“Ⅱ类误差”中随机
抽取3组数据与“Ⅲ类误差”数据进行对比,记抽到“Ⅰ类误差” 的数据的组数为 ,求 的概率分布
与数学期望.
附:相关系数 .
【答案】(1) ,认为具有很强的线性相关性
(2)分布列见解析,
【分析】(1)根据公式求出样本相关系数,由数据判断线性相关关系的强弱;
(2)由 的所有可能取值,计算相应的概率,得到分布列,再求数学期望.
【详解】(1)因为 ,
代入已知数据,
得 .
所以汛期遥测雨量y与人工测雨量x有很强的线性相关关系.
(2)10组数据中,“Ⅰ类误差”有5组,“Ⅱ类误差”有3组,“Ⅲ类误差”有2组,
从“Ⅰ类误差”,“Ⅱ类误差”中随机抽取3组数据,记抽到“Ⅰ类误差”的数据组数为 ,
由题意, 的所有可能取值为 .则 ,
, , .
所以 的概率分布为0 1 2 3
P
所以X的数学期望 .
2 . 二项分布与统计
一、解答题
1.某市某部门为了了解全市中学生的视力情况,采用比例分配的分层随机抽样方法抽取了该市120名中学
生,已知该市中学生男女人数比例为 ,他们的视力情况统计结果如表所示:
视力情况
性别 合计
近视 不近视
男生 30
女生 40
合计 120
(1)请把表格补充完整,并根据小概率值 的独立性检验,判断近视是否与性别有关;
(2)如果用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的概率,且每名
同学是否近视相互独立.现从该市中学生中任选4人,设随机变量X表示4人中近视的人数,求X的分布
列及均值.
附: ,其中 .
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
【答案】(1)表格见解析,近视与性别有关
(2)分布列见解析,
【分析】(1)根据已知条件即可完成 的列联表,根据表中数据计算观测值,对照临界值即可求解;
(2)根据已知条件得出随机变量X服从二项分布,进而可以得出随机变量X的分布列,再结合二项分布
随机变量X的期望公式即可求解.
【详解】(1)∵该市中学生男女人数比例为 ,∴抽取的120名学生中男生有70人,女生有50人,
列联表如下:
视力情况
性别 合计
近视 不近视
男生 30 40 70
女生 10 40 50
合计 40 80 120
零假设为 :近视与性别无关.
根据列联表中的数据得, ,
∴根据小概率值 的独立性检验,我们推断 不成立,即认为近视与性别有关.
(2)∵用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的概率,
∴每名学生近视的概率为 ,
由题意可得,X的所有可能取值为0,1,2,3,4,且随机变量 ,
, ,
, ,
,
∴X的分布列为:
X 0 1 2 3 4
P.
2.为了检查工厂生产的某产品的质量指标,随机抽取了部分产品进行检测,所得数据统计如下图所示.
(1)求 的值以及这批产品的优质率:(注:产品质量指标达到130及以上为优质品);
(2)若按照分层的方法从质量指标值在 的产品中随机抽取 件,再从这 件中随机抽取 件,求至
少有一件的指标值在 的概率;
(3)以本次抽检的频率作为概率,从工厂生产的所有产品中随机抽出 件,记这 件中优质产品的件数为 ,
求 的分布列与数学期望.
【答案】(1) ,优质率为25%
(2)
(3)分布列见解析,
【分析】(1)由频率分布直方图中,所有频率之和为1及优质率的定义即可求得结果.
(2)由分层抽样可得质量指标在 有 件,质量指标在 有 件,结合古典概型求其概率即
可.
(3)由题意知,4件产品中优质产品的件数服从二项分布,即 ,进而运用公式求解即可.
【详解】(1)因为 ,所以 ,
产品质量指标超过130的频率为 ,
所以这批产品的优质率为25%.
(2)因为质量指标在 和 的频率分别为0.4和0.3.所以质量指标在 产品中抽取7件,则质量指标在 有 件,质量指标在
有 件.
所以从这7件中任取2件,至少有一件质量指标在 的概率为 .
(3)因为抽到产品为优质产品的频率为0.25,以频率作为概率,所以每件产品为优质产品的概率为 .
所以4件产品中优质产品的件数 .
则 , ,
所以 , ,
, ,
,
所以 的分布列为
0 1 2 3 4
P
.
3.哈尔滨冰雪大世界于2022年9月投入使用,总投资高达25亿元,号称“永不落幕”的冰雪游乐场,从
“一季繁荣”到“四季绽放”2023年1月至5月的游客数以及对游客填写满意与否的调查表,统计如下:
月份 1 2 3 4 5
13
游客人数 万人) 90 80
0
满意率 0.5 0.4 0.4 0.3 0.35已知 关于 的线性回归直线方程为 .
(1)求2月份,3月份的游客数 的值;
(2)在1月至5月的游客中随机抽取2人进行调查,把满意率视为概率,求评价为满意的人数 的分布列与
期望 .
(参考公式: )
【答案】(1)
(2)分布列见解析;
【分析】(1)根据题意中调查表及回归直线方程,可以分别求出 的值;
(2)根据题意得满意率为概率,即可列出分布列,求解出期望.
【详解】(1)由题意可得 ,且 ,
所以得: ,①
又因为: , , ,
所以得: ,化简得: ,②
联立①②得: .
(2)任取1个人满意的概率 ,
所以满意的人数 服从二项分布,即 ,
随机变量 的取值分别为:0,1,2,从而得:
,
,,
所以可得满意人数 的分布列如下表所示:
0 1 2
所以期望 .
4.某校为了解本校学生课间进行体育活动的情况,随机抽取了60名男生和60名女生,通过调查得到以下
数据:60名女生中有10人课间经常进行体育活动,60名男生中有20人课间经常进行体育活动.
(1)请补全 列联表(单位:人),并根据小概率值 的独立性检验,判断学生课间经常进行体育
活动是否与性别有关联;
课间进行体育活动情况
性
合计
别
不经常 经常
男
女
合
计
(2)以样本的频率作为概率的值,在全校的学生中任取4人,记其中课间经常进行体育活动的人数为 ,求
的分布列与数学期望.
附: ,其中 .
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,有关联
(2)分布列见解析,1
【分析】(1)根据已知补全 列联表,根据独立性检验,计算 值,与 对比即可得出答案;(2)根据已知得出在全校学生中随机抽取1人,其课间经常进行体育活动的概率为 ,则随机变量X的
所有可能取值为0,1,2,3,4,且 ,计算出对应的概率,再结合期望公式计算即可得出答案.
【详解】(1)提出零假设 :学生课间经常进行体育活动与性别相互独立,即课间是否经常进行体育活
动与性别无关.
依题意,补全 列联表如下.
课间进行体育活动情况
性别 合计
不经常 经常
男 40 20 60
女 50 10 60
合计 90 30 120
,
根据小概率值 的独立性检验,推断 不成立,即认为学生课间是否经常进行体育活动与性别有关
联,此推断犯错误的概率不大于 .
(2)由题意得,学生课间经常进行体育活动的频率为 ,所以在全校学生中随机抽取1人,其课间
经常进行体育活动的概率为 ,而随机变量X的所有可能取值为0,1,2,3,4,则由题意得 ,
所以 , .
, ,, ,
.
的分布列如下.
0 1 2 3 4
的数学期望为 .
5.皮试是皮肤敏感试验的简称,是临床最常用的特异性检查.某些药物在临床使用过程中容易发生过敏
反应,为了防止过敏反应的发生,规定一些容易发生过敏反应的药物在使用前需要做皮肤敏感试验,皮试
阴性的药物可以给病人使用,皮试阳性的药物则禁止使用.某医疗机构现对治疗同一种疾病的A,B两种
药物进行皮肤敏感试验,随机选择的60名受试者的试验结果如下表:
阴性 阳性
药物A 25 5
药物B 20 10
(1)判断是否有95%的把握认为皮试药物与皮试结果有关;
(2)若随机选择4名受试者,其中2名使用皮试药物A,2名使用皮试药物B,用频率估计概率,求3名受试
者结果为阴性,1名受试者结果为阳性的概率.
参考公式: ,其中 .
参考数据:
0.25 0.15 0.10 0.05
1.323 2.072 2.706 3.841
【答案】(1)没有95%的把握认为皮试药物与皮试结果有关
(2)【分析】(1)计算 与临界值比较独立性检验判断相关性即可;
(2)根据题意分类应用互斥事件的概率公式结合独立事件概率计算可得.
【详解】(1)由题意可得, ,
所以没有95%的把握认为皮试药物与皮试结果有关.
(2)由题意可知,随机选择1名使用药物A的受试者,皮试结果为阴性的概率为 ,
随机选择1名使用药物B的受试者,皮试结果为阴性的概率为 .
设使用药物A且皮试结果为阴性的受试者人数为X,
使用药物B且皮试结果为阴性的受试者人数为Y,
则 且
且 .
所以所求概率为 且 且 .
6.杭州第19届亚运会后,多所高校掀起了体育运动的热潮.为了深入了解学生在“艺术体操”活动中的
参与情况,随机选取了10所高校进行研究,得到数据绘制成如下的折线图:
(1)若“艺术体操”参与人数超过35人的学校可以作为“基地校”,现在从这10所学校中随机选出3所,
记可作为“基地校”的学校个数为 ,求 的分布列和数学期望;
(2)现有一个“艺术体操”集训班,对“支撑、手倒立、手翻”这3个动作技巧进行集训,且在集训中进行
了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优
秀”.在集训测试中,某同学3个动作中每个动作达到“优秀”的概率均为 ,每个动作及每轮测试互不影响.如果该同学在集训测试中要想获得“优秀”的次数的平均值达到8次,那么理论上至少要进行多少
轮测试?
【答案】(1)分布列见解析, ;
(2)23轮.
【分析】(1)根据超几何分布的知识求得分布列,并求得数学期望;
(2)先求得一轮测试该同学“优秀”的概率,然后根据二项分布的知识列不等式,从而求得答案.
【详解】(1)参加“艺术体操”人数在35人以上的学校共5所, 所有可能取值为0,1,2,3,
则 ,
,
所以 的分布列为:
0 1 2 3
P
所以 ;
(2)由已知该同学在一轮测试中为“优秀”的概率为 ,
则该同学在n轮测试中获“优秀”次数X服从二项分布,即满足 ,
由 ,
所以理论上至少要进行23轮测试.
7.近年来,我国清洁能源产业不断发展壮大,清洁能源消费量占能源消费总量的比重持续增长. 近5年
(2017年记为第1年)我国清洁能源消费量占能源消费总量的比重 统计如下:(1)根据所给数据,求比重 关于第 年的回归方程,并估计到2030年我国清洁能源消费量占能源消费总量
的比重是否有可能超过 ;
(2)某市积极响应政府号召,鼓励企业积极使用清洁能源,使用清洁能源的企业达 .若从该市10家企业
中随机抽取3家,用 表示所选3家中使用清洁能源的数量,求 的分布列和数学期望.
附: .
【答案】(1) ,有可能超过
(2)分布列见解析,
【分析】(1)利用最小二乘法可得.
(2)根据二项分布的概率公式和数学期望公式可得.
【详解】(1)由题图可知, 与 满足线性回归方程 ,得表:
第 年 1 2 3 4 5
23.
比重 20. 5 22. 1 24. 3 25. 5
3
, ,
,
, ,故回归直线方程为 .
2030年是第14年,此时 ,
即2030年我国清洁能源消费量占能源消费总量的比重约为 ,故可判断有可能超过 .
(2)由题意可知, ,
, ,
, ,
所以 的分布列为:
0 1 2 3
数学期望 .
8.根据《国家学生体质健康标准》,高三男生和女生立定跳远单项等级如下(单位:cm):
立定跳远单项等级 高三男生 高三女生
及以
优秀 及以上
上
良好 ~ ~
及格 ~ ~
及以
不及格 及以下
下
从某校高三男生和女生中各随机抽取 名同学,将其立定跳远测试成绩整理如下(精确到 ):
男生
女生
假设用频率估计概率,且每个同学的测试成绩相互独立.(1)分别估计该校高三男生和女生立定跳远单项的优秀率;
(2)从该校全体高三男生中随机抽取 人,全体高三女生中随机抽取 人,设 为这 人中立定跳远单项等
级为优秀的人数,估计 的数学期望 ;
(3)从该校全体高三女生中随机抽取 人,设“这 人的立定跳远单项既有优秀,又有其它等级”为事件 ,
“这 人的立定跳远单项至多有 个是优秀”为事件 .判断 与 是否相互独立.(结论不要求证明)
【答案】(1)
(2)
(3) 与 相互独立
【分析】(1)样本中立定跳远单项等级获得优秀的男生人数为 ,获得优秀的女生人数为 ,计算频率得
到优秀率的估计值;
(2)由题设, 的所有可能取值为 .算出对应概率的估计值,得到 的数学期望的估计值;
(3)利用两个事件相互独立的定义判断即可.
【详解】(1)样本中立定跳远单项等级获得优秀的男生人数为 ,获得优秀的女生人数为 ,
所以估计该校高三男生立定跳远单项的优秀率为 ;估计高三女生立定跳远单项的优秀率为 .
(2)由题设, 的所有可能取值为 .
估计为 ;
估计为 ;
估计为 ;
估计为 .
估计 的数学期望 .
(3) 估计为 ;
估计为 ;估计为 ,
,所以 与 相互独立.
9.某短视频平台的一位博主,其视频以展示乡村生活为主,赶集、出城、抓鱼、养鸡等新时代农村生活
吸引了许多观众,该博主为家乡的某农产品进行直播带货,通过 次试销得到了销量 (单位:百万盒)
与单价 (单位:元/盒)的如下数据:
参考公式:回归方程 ,其中 , .
参考数据: , .
(1)根据以上数据,求 关于 的经验回归方程;
(2)在所有顾客中随机抽取部分顾客(人数很多)进行体验调查问卷,其中“体验非常好”的占一半,“体
验良好”“体验不满意”的各占 ,然后在所有顾客中随机抽取 人作为幸运顾客赠送礼品,记抽取的
人中“体验非常好”的人数为随机变量 ,求 的分布列和均值.
【答案】(1)
(2)分布列见解析;均值
【分析】(1)由表格数据可求得所需数据,利用最小二乘法可求得经验回归方程;
(2)根据二项分布定义可知 ,利用二项分布概率公式可求得 每个取值对应的概率,由此可
得分布列;由二项分布数学期望公式可求得均值.
【详解】(1)由表格数据知: , ,
, ,关于 的经验回归方程为: .
(2)由题意知:从所有顾客中随机抽取 人,则抽取的 人的问卷结果为“体验非常好”的概率为 ,
,
则 所有可能的取值为 ,
; ; ;
;
; ;
; ; ;
的分布列为:
均值 .
10.截止到2018年末,我国公路总里程达到484.65万公里,其中高速公路达到14.26万公里,规模居世界
第一.与此同时,行车安全问题也成为管理部门关注的重点.下图是某部门公布的一年内道路交通事故成因
分析,由图可知,超速驾驶已经成为交通事故的一个主要因素.研究表明,急刹车时的停车距离等于反应距
离与制动距离的和,下表是根据某部门的调查结果整理所得的数据( 表示行车速度,单位:
分别表示反应距离和制动距离,单位: )道路交通事故成因分析
64 72 80 89 97 105 113 121 128 135
13.4 15.2 16.7 18.6 20.1 21.9 23.5 25.3 26.8 28.5
(1)从一年内发生的道路交通事故中随机抽出3起进行分析研究,求其中恰好有1起属于超速驾驶的概率
(用频率代替概率);
(2)已知 与 的平方成正比,且当行车速度为 时,制动距离为 .由表中数据可知, 与 之
间具有线性相关关系,请建立 与 之间的回归方程,并估计车速为 时的停车距离.
参考数据:
参考公式:对于一组数据 ,其线性回归直线方程 的斜率和截距的最小
二乘法估计分别为 , .
【答案】(1)
(2) ,
【分析】(1)概率类型为二项分布,按照二项分布计算公式 即可;
(2)首先代入公式求 ,然后求出 代入式子,即可得答案.【详解】(1)由题意可知从一年内发生的交通事故中随机抽出一起事故,则该起事故是恰好是超速驾驶
的概率为0.2,
设“恰好有一起事故属于超速驾驶”为事件 ,则 .
所以其中恰好有1起属于超速驾驶的概率 .
(2)由题意,设 ,因为当行车速度为 时,制动距离为 ,所以 ,
即 ,因为 与 之间具有线性相关关系,故设 ,
于是 ,
故 ,
把 代入上式,解得 ,则 与 之间的回归方程为:
.
设停车距离为 ,则 ,则 ,
当 时, ,
即车速为 时的停车距离为 .
11.人类命运共同体充分展现了中国的大国担当.在第75届联合国大会上中国承诺,将采取更加有力的政
策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双
碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生
深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于
实现“双碳目标”具有重要的作用.为了解 两个品牌新能源电动汽车的使用满意度,在某市对购买
两个品牌的用户各随机抽取了100名进行问卷调查,记录他们对A、B两种品牌的满意度得分(满分
100分),将数据分成6组: ,并整理得到如下频率分布
直方图:(1)请通过频率分布直方图分别估计A、B两种电动汽车使用满意度的平均得分,并判断哪种品牌电动汽车
更受用户欢迎(同一组中的数据用该组中间的中点值作代表);
(2)以样本频率估计概率,若使用满意度得分不低于70分说明用户对该品牌电动汽车较满意,现从该市使
用B品牌的用户中随机抽取5个人,用 表示对B品牌较满意的人数,求 的分布列及数学期望.
【答案】(1) , 品牌电动汽车的满意度平均分分别为 ,B品牌电动汽车更受用户欢迎;
(2)分布列见解析, .
【分析】(1)利用频率分布直方图估计两种品牌电动汽车满意度的平均分,再比较大小作答.
(2)求出对 品牌满意度不低于70分的概率,求出 的可能值及各个值对应的概率,列出分布列并求出
期望作答.
【详解】(1)设用户对 品牌电动汽车的满意度平均分为 ,则
,
设用户对 品牌电动汽车的的满意度平均分为 ,则
,
显然 ,
所以 品牌电动汽车更受用户欢迎.
(2)依题意,用户对 品牌电动汽车满意度不低于70分的频率为 ,
低于70分的频率为 ,
从该市使用 品牌的用户中随机抽取5个人,则 的所有可能取值为 ,则 ,, ,
, ,
, ,
所以 的分布列为:
0 1 2 3 4 5
数学期望 .
12.人工智能 是一门极富挑战性的科学,自诞生以来,理论和技术日益成熟.某校成立了 、 两个
研究性小组,分别设计和开发不同的 软件用于识别音乐的类别:“古典音乐”、“流行音乐”和“民族
音乐”.为测试 软件的识别能力,计划采取两种测试方案.
方案一:将 首音乐随机分配给 、 两个小组识别.每首音乐只被一个 软件识别一次,并记录结果;
方案二:对同一首音乐, 、 两组分别识别两次,如果识别的正确次数之和不少于三次,则称该次测试
通过.
(1)若方案一的测试结果显示:正确识别的音乐数之和占总数的 ;在正确识别的音乐数中, 组占 ;在
错误识别的音乐数中, 组占 .
(i)用频率估计概率,两个研究性小组的 软件每次能正确识别音乐类别的概率分别为多少?
(ii)利用(i)中的结论,求方案二在一次测试中获得通过的概率:
(2)若方案一的测试结果如下:
音乐类 小组 小组别
测试音乐数
测试音乐数量 正确识别比例 正确识别比例
量
古典音
乐
流行音
乐
民族音
乐
在 小组、 小组识别的歌曲中各任选 首,记 、 分别为 小组、 小组正确识别的数量,试比较
、 的大小(直接写出结果即可).
【答案】(1)(i) 、 研究性小组的 软件每次能正确识别音乐类别的概率分别为 、 ;(ii)
(2)
【分析】(1)(i)根据题意计算出 、 两个研究性小组识别音乐正确和错误的数量,即可求得两个研
究性小组的 软件每次能正确识别音乐类别的概率;
(ii)利用独立重复试验的概率公式、独立事件的概率公式以及互斥事件的概率公式可求得所求事件的概
率;
(2)分析可知 , ,根据超几何分布的期望公式可得出 、 的
值,即可得出结论.
【详解】(1)解:(i)对于方案一,设 、 两个研究性小组的 软件每次能正确识别音乐类别的概率
分别为 、 ,
首音乐中,正确被识别的数量为 首,错误被识别数量为 首,
其中 组识别正确的数量为 首, 组识别正确的数量为 首,其中 组识别错误的数量为 首, 组识别错误的数量为 首,
故 , ;
(ii)记事件 方案二在一次测试中获得通过,
则 .
(2)解:由题意可知, 小组识别正确的歌曲数量为 首,
小组识别正确的歌曲数量为 ,
由题意可知, 、 均服从超几何分布,且 , ,
根据超几何分布的期望公式可得 , ,
因此, .
13.今年5月以来,世界多个国家报告了猴痘病例,非洲地区猴痘地方性流行国家较多.9月19日,中国
疾控中心发布了我国首例“输入性猴痘病例”的溯源公告.我国作为为人民健康负责任的国家,对可能出
现的猴痘病毒防控已提前做出部署,同时国家卫生健康委员会同国家中医药管理局制定了《猴痘诊疗指南
(2022年版)》.此《指南》中指出:①猴痘病人潜伏期5-21天;②既往接种过天花疫苗者对猴痘病毒存
在一定程度的交叉保护力.据此,援非中国医疗队针对援助的某非洲国家制定了猴痘病毒防控措施之一是
要求与猴痘病毒确诊患者的密切接触者集中医学观察21天.在医学观察期结束后发现密切接触者中未接种
过天花疫苗者感染病毒的比例较大.对该国家200个接种与未接种天花疫苗的密切接触者样本医学观察结
束后,统计了感染病毒情况,得到下面的列联表:
接种天花疫苗与否/人数 感染猴痘病毒 未感染猴痘病毒
未接种天花疫苗 30 60
接种天花疫苗 20 90
(1)是否有 的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关;
(2)以样本中结束医学现察的密切接触者感染猴痘病毒的频率估计概率.现从该国所有结束医学观察的密切
接触者中随机抽取4人进行感染猴痘病毒人数统计,求其中至多有1人感染猴痘病毒的概率:
(3)该国现有一个中风险村庄,当地政府决定对村庄内所有住户进行排查.在排查期间,发现一户3口之家与确诊患者有过密切接触,这种情况下医护人员要对其家庭成员逐一进行猴痘病毒检测.每名成员进行检
测后即告知结果,若检测结果呈阳性,则该家庭被确定为“感染高危家庭”.假设该家庭每个成员检测呈
阳性的概率均为 且相互独立.记:该家庭至少检测了2名成员才能确定为“感染高危家庭”的
概率为 .求当 为何值时, 最大?附:
0.1 0.05 0.010
2.706 3.841 6.635
【答案】(1)没有 的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关
(2)
(3)当 时, 最大
【分析】(1)假设 :密切接触者感染猴痘病毒与未接种天花疫苗无关,根据题意求得 判断;
(2)易得该地区每名密切接触者感染病毒的概率为 ,再利用独立重复实验求解;
(3)易得 ,再利用导数法求解.
【详解】(1)假设 :密切接触者感染猴痘病毒与未接种天花疫苗无关,
依题意有 ,
故假设不成立, 没有 的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关.
(2)由题意得,该地区每名密切接触者感染病毒的概率为 ,设随机抽取的4人中至多有1人感
染病毒为事件 ,则 ,
(3)记事件 为:检测了2名成员确定为“感染高危家庭”;事件 为:检测了3名成员确定为“感染高危家庭”;则
则, ,令 ,则 (舍去)
随着 的变化, 的变化如下表:
+ 0
递增 极大值 递减
综上,当 时, 最大.
14.为了解某市区高中学生的阅读时间,从该市区随机抽取了800名学生进行调查,得到了这800名学生
一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图.
(1)求a的值;
(2)为进一步了解这800名学生阅读时间的分配情况,从周平均阅读时间在 , , 三组
内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记周平均阅读时间在
内的学生人数为X,求X的分布列和数学期望;
(3)以样本的频率估计概率,从该市区学生周平均阅读时间在 内中随机抽取20名学生.这20名学生中,周平均阅读时间在 内的学生最可能有多少名?
【答案】(1)
(2)分布列见解析,
(3)最可能有6名或7名
【分析】(1)根据小矩形面积之和为1,列出关系式,求解即可得出答案;
(2)根据频率分布直方图求出周平均阅读时间在 , , 三组的频率之比为 ,进
而得出每组的人数.根据超几何分布分别求出X分别取0,1,2,3时的概率,列出分布列,即可求出期望;
(3)先求出周平均阅读时间在 内的概率 .进而求出 ,由 解出 的范
围,即可得出答案.
【详解】(1)由 可得 .
(2)由频率分布直方图可得:周平均阅读时间在 , , 三组的频率之比为
,
∴10人中,周平均阅读时间在 的人数为 人,在 的人数为 人,在
的人数为 人.
则X所有可能的取值为0,1,2,3,
∴ , ,
, .
∴X的分布列为:
X 0 1 2 3
P∴数学期望 .
(3)用频率估计概率,从该地区学生周平均阅读时间在 内中随机抽取20名学生,周平均阅读时间
在 内的概率 ,
设周平均阅读时间在 内的学生有 名,则
,
所以 .
令 ,解得 ,
所以当 或 , 最大.
所以,周平均阅读时间在 内的学生最可能有6名或7名.
15.某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等
情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对
“人工智能助力教学”作用的认识,得到的部分数据如下表所示:
假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.
(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)现按性别进行分层抽样,从该地区抽取了5名教师,求这5名教师中恰有1人认为人工智能对于教学
“很有帮助”的概率;
(3)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.统计受访教师的得分,将这100名教师得分的平均值记为 ,其中年龄在40岁以
下(含40岁)教师得分的平均值记为 ,年龄在40岁以上教师得分的平均值记为 ,请直接写出
的大小关系.(结论不要求证明)
【答案】(1)140
(2)
(3)
【分析】(1)完善表格,并得到认为人工智能对于教学“没有帮助”的频率,从而估计出该地区中小学
教师中认为人工智能对于教学“没有帮助”的人数;
(2)根据分层抽样定义得到抽取的5名教师,有1名男教师,4名女教师,再结合该地区中小学教师中男
教师和女教师认为对于教学“很有帮助”的概率,分两种情况求出这5名教师中恰有1人认为人工智能对
于教学“很有帮助”的概率;
(3)计算平均值,并比较出大小即可.
【详解】(1)根据表格中数据,完善表格,
可以得到100名教师中,认为人工智能对于教学“没有帮助”的频率为 ,
用频率估计概率,估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数为 ;
(2)男女比例为 ,故抽取的5名教师,有1名男教师,4名女教师,
用频率估计概率,估计该地区中小学教师中男教师认为对于教学“很有帮助”的概率为 ,
女教师认为对于教学“很有帮助”的概率为 ,
抽取的5名教师中,恰有1人认为人工智能对于教学“很有帮助”,则1名男教师认为人工智能对于教学“很有帮助”的概率为 ,
1名女教师认为人工智能对于教学“很有帮助”的概率为 ,
故这5名教师中恰有1人认为人工智能对于教学“很有帮助”的概率为 ;
(3) , ,
,
因为 ,所以 .
16.卡塔尔世界杯的吉祥物“拉伊卜”引发网友和球迷喜爱,并被亲切地称为“饺子皮”.某公司被授权销
售以“拉伊卜”为设计主题的精制书签.该精制书签的生产成本为50元/个,为了确定书签的销售价格,该
公司对有购买精制书签意向的球迷进行了调查,共收集了200位球迷的心理价格来估计全部球迷的心理价
格分布.这200位球迷的心理价格对应人数比例分布如下图:
若只有在精制书签的销售价格不超过球迷的心理价格时,球迷才会购买精制书签.公司采用常见的饥饿营销
的方法刺激球迷购买产品,规定每位球迷最多只能购买一个该精制书签.设每位球迷是否购买该精制书签相
互独立,精制书签的销售价格为 元/个( ).
(1)若 ,已知某时段有3名球迷有购买意向而咨询公司,设 为这3名球迷中购买精制书签的人数,
求 的分布列和期望;
(2)假设共有 名球迷可能购买该精制书签,请比较当精制书签的售价分别定为70元和80元时,哪种售价
对应的总利润的期望最大?
【答案】(1)分布列见解析,
(2)当精制书签的销售价格定为70元时,对应的总利润的期望最大【分析】(1)先确定购买该精制书签的概率,根据二项分布的概率得分布列与数学期望;
(2)根据随机变量之间的关系确定当 , 时的 与 的关系,即可判断得结论.
【详解】(1)当 时,由样本数据估计球迷购买该精制书签的概率为 .
因每位球迷是否购买该精制书签相互独立,
∴ ,X的可能取值为 .
;
其分布列为:
0 1 2 3
其期望为 .
(2)设该公司销售该精制书签所得总利润为 元,
当 时,由样本数据估计球迷购买该精制书签的概率为 ,
此时 ;
当 时,由样本数据估计球迷购买该精制书签的概率为 .
此时 ;
∵ ,所以当精制书签的销售价格定为70元时,对应的总利润的期望最大.
17.为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到400只小白鼠
体内,一段时间后测量小白鼠的某项指标值,按 分组,绘制频率分
布直方图如图所示,实验发现小白鼠体内产生抗体的共有320只,其中该项指标值不小于60的有220只.
指标值
抗体 合计
小于60 不小于60有抗体
没有抗
体
合计
(1)填写完成上面的 列联表(单位:只),并根据列联表及
的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的小白鼠进行第二次注射疫苗,
结果又有60只小白鼠产生抗体.
(i)用频率估计概率,求一只小白鼠最多注射两次疫苗后产生抗体的概率 ;
(ii)以(i)中确定的概率 作为人体最多注射两次疫苗后产生抗体的概率,进行人体接种试验,现有40
人进行接种试验,设最多注射两次疫苗后产生抗体的人数为随机变量 ,当 时, 取得最大
值,求 .
参考公式: (其中 为样本容量)
0.50 0.40 0.25 0.15 0.100 0.050 0.025
0.455 0.708 1.323 2.072 2.706 3.841 5.024
【答案】(1)列联表见解析,能;
(2)(i) ;(ii)38.
【分析】(1)根据频率分布直方图完善 列联表,再求出 的观测值,与临界值表比对即可.
(2)(i)利用条件概率公式及对立事件的概率公式计算即可;(ii)利用二项分布的概率公式,列出不等式即可求解.
【详解】(1)由频率分布直方图知,该项指标值不小于60的频率为 ,有
(只),
则 列联表如下:(单位:只)
指标值
抗体 合计
小于60 不小于60
有抗体 100 220 320
没有抗体 40 40 80
合计 140 260 400
零假设为 :注射疫苗后小白鼠产生抗体与指标值不小于60无关联,
根据列联表中数据,得
根据 的独立性检验,推断 不成立,
即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.025.
(2)(i)令事件 “小白鼠第一次注射疫苗产生抗体”,事件 “小白鼠第二次注射疫苗产生抗体”,
事件 “小白鼠最多注射2次疫苗后产生抗体”,
记事件 发生的概率分别为 ,
则 , ,
所以一只小白鼠最多注射2次疫苗后产生抗体的概率 .
(ii)依题意,随机变量 ,
因为 最大,显然 ,且 ,
因此 ,则 , ,解得 ,
而 是整数,所以 .
3 . 正态分布与统计
一、解答题
1.在某大学举行的自主招生考试中,随机抽取了100名考生的成绩(单位:分),并把所得数据列成了如
下所示的频数分布表:
组
别
频
5 18 28 26 17 6
数
(1)求抽取样本的平均数 (同一组中的数据用该组区间的中点值代表);
(2)已知这次考试共有2000名考生参加,如果近似地认为这次成绩 服从正态分布 (其中 近似
为样本平均数 , 近似为样本方差 ),且规定82.7分是复试线,那么在这2000名考生中,能进
入复试的有多少人?(附: ,若 ,则 ,
).
【答案】(1)70
(2)318
【分析】(1)根据平均数的定义结合频率分布表求解;
(2)由(1)可知 ,然后根据正态分布的性质求解即可.
【详解】(1)由所得数据列成的频数分布表,得:
;
(2)由(1)知 ,所以 ,所以 ,
所以在这2000名考生中,能进入复试的有 人.
2.某工厂的工人生产内径为 的一种零件,为了了解零件的生产质量,在某次抽检中,从该厂的
1000个零件中抽出60个,测得其内径尺寸(单位: )如下:
这里用 表示有 个尺寸为 的零件, , 均为正整数.若从这60个零件中随机抽取1个,则这个
零件的内径尺寸小干 的概率为 .
(1)求 , 的值.
(2)已知这60个零件内径尺寸的平均数为 ,标准差为 ,且 ,在某次抽检中,若抽取的零
件中至少有80%的零件内径尺寸在 内,则称本次抽检的零件合格.试问这次抽检的零件是否合
格?说明你的理由.
【答案】(1)
(2)不合格,理由见解析
【分析】(1)根据零件个数和概率值建立方程求解即可;
(2)求出平均数,然后求出零件内径尺寸在 内的个数即可判断.
【详解】(1)依题意可得 ,
解得 .
(2)将每个数据都减去28.50后所得新数据的平均数为,
所以 ,所以 , .
所以这60个零件内径尺寸在 内的个数为 ,
因为 ,所以这次抽检的零件不合格.
3.某市为提升中学生的环境保护意识,举办了一次“环境保护知识竞赛”,分预赛和复赛两个环节,预
赛成绩排名前三百名的学生参加复赛.已知共有12000名学生参加了预赛,现从参加预赛的全体学生中随机
地抽取100人的预赛成绩作为样本,得到如下频率分布直方图:
(1)规定预赛成绩不低于80分为优良,若从上述样本中预赛成绩不低于60分的学生中随机地抽取2人,求
至少有1人预赛成绩优良的概率,并求预赛成绩优良的人数 的分布列及数学期望;
(2)由频率分布直方图可认为该市全体参加预赛学生的预赛成绩 服从正态分布 ,其中 可近似为
样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且 ,已知小明
的预赛成绩为91分,利用该正态分布,估计小明是否有资格参加复赛?
(3)复赛规则如下:①每人的复赛初始分均为100分;②参赛学生可在开始答题前自行决定答题数量 ,每
一题都需要“花”掉(即减去)一定分数来获取答题资格,规定答第 题时“花”掉的分数为 ( ,
2, , );③每答对一题加2分,答错既不加分也不减分;④答完 题后参赛学生的最终分数即为复赛
成绩,已知参加复赛的学生甲答对每道题的概率均为0.8,且每题答对与否都相互独立.若学生甲期望获
得最佳的复赛成绩,则他的答题数量 应为多少?
附:若 ,则 , ,; .
【答案】(1)至少有1人预赛成绩优良的概率为 ;分布列见解析,数学期望为
(2)小明有资格参加复赛
(3)答题数量为7或8时,学生甲可获得最佳的复赛成绩
【分析】(1)根据超几何分布的知识求得正确答案.
(2)先求得 ,然后根据正态分布的对称性求得正确答案.
(3)设学生甲复赛成绩为 ,计算 ,然后结合二次函数的性质求得正确答案.
【详解】(1)预赛成绩在 范围内的样本量为: ,
预赛成绩在 范围内的样本量为: ,
设抽取的2人中预赛成绩优良的人数为X,可能取值为 ,
则 ,
又 ,
则 的分布列为:
0 1 2
故 .
(2) ,
,则 ,
又 ,
故 ,故全市参加预赛学生中,成绩不低于91分的有 人,
因为 ,故小明有资格参加复赛.
(3)设学生甲答对的题目数为 ,复赛成绩为 ,
则 ,故 ,
,
故
,
因为 ,所以答题数量为7或8时,学生甲可获得最佳的复赛成绩.
4.零件的精度几乎决定了产品的质量,越精密的零件其精度要求也会越高.某企业为了提高零件产品质量,
质检部门随机抽查了100个零件的直径进行了统计整理,得到数据如下表:
零件直径(单位:厘
米)
零件个数 10 25 30 25 10
已知零件的直径可视为服从正态分布 , , 分别为这100个零件的直径的平均数及方差(同一
组区间的直径尺寸用该组区间的中点值代表).
参考数据: ;若随机变量 ,则 ,
, .
(1)分别求 , 的值;
(2)试估计这批零件直径在 的概率;
(3)随机抽查2000个零件,估计在这2000个零件中,零件的直径在 的个数.
【答案】(1) , ;
(2)0.8186
(3)1637【分析】(1)根据平均数与方差的公式即可求解.
(2)根据正态分布的性质,结合正态分布在三个常见的区间上取值的概率进行求解.
(3)根据区间 上的概率计算即可.
【详解】(1)由平均数与方差的计算公式分别得:
故 ,
.
(2)设 表示零件直径,则 ,即 .
,
由对称性得, ,即 .
同理, ,
,即 .
.
故这批零件直径在 的概率为0.8186.
(3)由(2)知, ,所以在这2000个零件中,零件的直径在 的有 个.
5.某工厂一台设备生产一种特定零件,工厂为了解该设备的生产情况,随机抽检了该设备在一个生产周
期中的100件产品的关键指标(单位: ),经统计得到下面的频率分布直方图:
(1)由频率分布直方图估计抽检样本关键指标的平均数 和方差 .(用每组的中点代表该组的均值)
(2)已知这台设备正常状态下生产零件的关键指标服从正态分布 ,用直方图的平均数估计值 作为
的估计值 ,用直方图的标准差估计值 作为 估计值 .
(i)为了监控该设备的生产过程,每个生产周期中都要随机抽测10个零件的关键指标,如果关键指标出
现了 之外的零件,就认为生产过程可能出现了异常,需停止生产并检查设备.下面是某个
生产周期中抽测的10个零件的关键指标:
0.8 1.2 0.95 1.01 1.23 1.12 1.33 0.97 1.21 0.83
利用 和 判断该生产周期是否需停止生产并检查设备.
(ⅱ)若设备状态正常,记 表示一个生产周期内抽取的10个零件关键指标在 之外的零件
个数,求 及 的数学期望.
参考数据:若随机变量 服从正态分布 ,则 ,
【答案】(1)
(2)(i)需停止生产并检查设备;(ii) ,【分析】(1)根据频率分布直方图结合平均数的计算公式,即可求得 ,继而结合方差的计算公式求得 ;
(2)(i)根据 , ,确定 , ,判断抽查的零件关键指标有无在
之外的情况,即可得结论;(ii)求出抽测一个零件关键指标在 之外的概率,
确定 ,根据二项分布的概率公式以及期望公式,即可求得答案.
【详解】(1)由频率分布直方图,得 .
.
(2)(i)由(1)可知 , ,
所以 , ,
显然抽查中的零件指标 ,故需停止生产并检查设备.
(ii)抽测一个零件关键指标在 之内的概率为 ,
所以抽测一个零件关键指标在 之外的概率为 ,
故 ,所以 ,
X的数学期望 .
6.某国家网球队为了预选2024年奥运会的参赛选手,预计在国家队选拔一批队员做特训.选拔过程中,
记录了某队员的40局接球成绩,每局发100个球,该队员每接球成功得1分,否则得0分,且每局结果相
互独立,得到如图所示的频率分布直方图.(1)结合直方图,估算该队员40局接球成绩的平均分(同一组数据用该组区间的中点值作代表);
(2)若该队员的接球训练成绩X近似服从正态分布 ,其中 近似为样本平均数,求
的值;
(3)为了营造竞技氛围,队员间相互比赛.一局比赛中发球方连续发100个球,若接球方得分达到80分,
则接球方获胜,否则发球方获胜.若有人获胜达3局,则比赛结束,记比赛的局数为Y.以频率分布直方
图中该队员获胜的频率作为概率,求均值 .
参考数据:若随机变量 ,则 , ,
.
【答案】(1)
(2)
(3)
【分析】(1)将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全部相加可得样本平均数;
(2)由题意可知 , ,则 , ,利用参考数据即可求解
;
(3)由题意可知,随机变量 的可能取值有3,4,5,计算出随机变量 在不同取值下的概率,进而可求
得 的值.
【详解】(1)由频率分布直方图可得队员甲的平均分.
(2)由题意可知 , ,则 , ,
所以
.
(3)由频率分布直方图可知,在一局中,某队员得分达到80分的概率为 ,
由题意可知,随机变量Y的所有可能取值为3,4,5,
,
,
,
所以随机变量Y的分布列为
Y 3 4 5
P
因此, .
7.在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布 ,而化肥
施肥量因农作物的种类不同每亩也存在差异.
(1)假设生产条件正常,记 表示化肥的有效利用率,求 ;
(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初
步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为 (单位:公斤),粮食亩产
量为 (单位:百公斤)参考数据:
650 91.5 52.5 1478.6 30.5 15 15 46.5
, ,2, , .
(i)根据散点图判断, 与 ,哪一个适宜作为该农作物亩产量 关于每亩化肥施用量 的回
归方程(给出判断即可,不必说明理由);
(ii)根据(i)的判断结果及表中数据,建立 关于 的回归方程;并预测每亩化肥施用量为27公斤时,
粮食亩产量 的值.
附:①对于一组数据 ,2,3, , ,其回归直线 的斜率和截距的最小二乘估计分
别为 , ;
②若随机变量 ,则 , .
【答案】(1)
(2)(i) 适宜作为粮食亩产量 关于每亩化肥施用量 的回归方程;(ii) , (百公斤)
【分析】(1)根据正态分布曲线的对称性,结合 ,即可求解;
(2)(i)由散点图可知 与 的关系不是线性关系,即可得到答案;(ii)由 ,得到 ,令 ,得到 ,结合公式求得回归系数和 的
值,即可求解.
【详解】(1)解:由 ,根据正态分布曲线的对称性,
可得 .
(2)解:(i)由散点图可知 与 的关系不是线性关系,所以 适宜作为粮食亩产量 关于每亩化
肥施用量 的回归方程;
(ii)因为 ,所以 ,令 ,则 ,
由表可得 ,所以 ,
所以 ,所以 ,所以 ,
当 时, (百公斤)
8.新能源汽车是中国战略新兴产业之一,政府高度重视新能源产业的发展,某企业为了提高新能源汽车
品控水平,需要监控某种型号的汽车零件的生产流水线的生产过程,现从该企业生产的该零件中随机抽取
100件,测得该零件的质量差(这里指质量与生产标准的差的绝对值)的样本数据统计如下表.
质量差(单位:
56 67 70 78 86
)
件数(单位:件) 10 20 48 19 3
(1)求样本平均数 的值;根据大量的产品检测数据,得到该零件的质量差(这里指质量与生产标准的差的
绝对值)X近似服从正态分布 ,其中 的近似值为36,用样本平均数 作为 的近似值,求概率
)的值;
(2)若该企业有两条生产该零件的生产线,其中第1条生产线的生产效率是第2条生产线的生产效率的两倍.
若第1条生产线出现废品的概率约为0.015,第2条生产线出现废品的概率约为0.018,将这两条生产线生
产出来的零件混放在一起,这两条生产线是否出现废品相互独立.现从该企业生产的该零件中随机抽取一件.
(i)求该零件为废品的概率;(ii)若在抽取中发现废品,求该废品来自第1条生产线的概率.
参考数据:若随机变量 服从正态分布 ,则: ,
,
【答案】(1) ,
(2)(i) ;(ii)
【分析】(1)先由表格计算平均数,再根据正态分布三段区间公式计算概率即可;
(2)(i)根据全概率公式计算即可,(ii)根据贝叶斯公式计算即可.
【详解】(1)
由 得:
(2)(i)设 “随机抽取一件该企业生产的该零件为废品”,
“随机抽取一件零件为第1条生产线生产”,
“随机抽取一件零件为第2条生产线生产”,
则由题意可知 ,
又 ,
于是
.
(ii) .
9.某企业拟对手机芯片进行科技升级,根据市场调研,得到科技升级投入 (亿元)与科技升级直接收益
(亿元)的数据统计如下:
序 1 2 3 4 5 6 7 8 9 10号
2 3 4 6 9 11 13 15 17 19
13 22 31 42 50 56 58 62 63 65
根据表格中的数据,当 时,建立了 与 的两个回归模型:模型①: ;模型②:
;当 时,确定 与 满足的线性回归方程为 .
(1)根据下列表格中的数据,比较当 时,模型①、②的相关指数的大小,并选择拟合精度更高、
更可靠的模型;
回归模型 模型① 模型②
回归方程
(附:刻画回归效果的相关指数 )
(2)为鼓励科技创新,当科技升级的投入不少于 亿元时,国家给予公司补贴 亿元,比较根据市场调研科
技升级投入 亿元直接收益与投入 亿元时科技升级实际收益的预测值的大小;
(附:用最小二乘法求线性回归方程 的系数: )
(3)科技升级后,芯片的效率 大幅提高,经实际试验得 大致服从正态分布 .公司对科技升
级团队的奖励方案如下:若芯片的效率不超过 ,不予奖励;若芯片的效率超过 ,但不超过 ,
每部芯片奖励 元;若芯片的效率超过 ,每部芯片奖励 元,记 为每部芯片获得的奖励额,求
(精确到 ).
(附:若随机变量 , ,.)
【答案】(1)模型②的相关指数大于模型①的相关指数,模型②
(2)技术升级投入 亿元时,公司的实际收益更大
(3)
【分析】(1)比较两个模型相关指数的大小,即可得出结论;
(2)计算出当 时, 关于 的回归方程,可求出当 时,实际收益的预测值,再与市场调研科
技升级投入 亿元直接收益比较大小,可得出结论;
(3)根据 原则计算出 、 的值,结合题意可求得 的值.
【详解】(1)解:由表格中的数据, ,
所以, ,则 ,
则模型②的相关指数大于模型①的相关指数,故回归模型②的拟合效果更好.
(2)解:当 时,由已知可得 .
,
因为 ,所以, ,解得 ,
所以当 时, 与 满足的线性回归方程为 ,
当 时,根据市场调研科技升级投入 亿元直接收益 亿元.
当 时,科技升级直接收益的预测值为 亿元,
所以实际收益的预测值为 亿元,
所以技术升级投入 亿元时,公司的实际收益更大.
(3)解: , ,
.
.(元).
10.2020年受疫情影响,我国企业曾一度停工停产,中央和地方政府纷纷出台各项政策支持企业复工复产,
以减轻企业负担.为了深入研究疫情对我国企业生产经营的影响,帮扶困难职工,在甲、乙两行业里随机抽
取了200名工人进行月薪情况的问卷调查,经统计发现他们的月薪在2000元到8000元之间,具体统计数
据见下表.
月薪/元 [2000,3000) [3000,4000) [4000,5000) [5000,6000) [6000,7000) [7000,8000)
人数 20 36 44 50 40 10
将月薪不低于6000元的工人视为“I类收入群体”,低于6000元的工人视为“II类收入群体”,并将频率
视为概率.
(1)根据所给数据完成下面的 列联表:
I类收入群体 II类收入群体 总计
甲行业 60
乙行业 20
总计
根据上述列联表,判断是否有99%的把握认为“II类收入群体”与行业有关.
附件: ,其中 .
3.841 6.635 10.828
0.050 0.010 0.001
(2)经统计发现该地区工人的月薪X(单位:元)近似地服从正态分布 ,其中 近似为样本的平均
数 (每组数据取区间的中点值).若X落在区间 外的左侧,则可认为该工人“生活困难”,
政府将联系本人,咨询月薪过低的原因,并提供帮助.
①已知工人王强参与了本次调查,其月薪为2500元,试判断王强是否属于“生活困难”的工人;
②某超市对调查的工人举行了购物券赠送活动,赠送方式为:月薪低于 的获得两次赠送,月薪不低于
的获得一次赠送.每次赠送金额及对应的概率如下:10
赠送金额/元 200 300
0
概率
求王强获得的赠送总金额的数学期望.
【答案】(1)列联表见解析,没有;
(2)①不属于;② .
【分析】(1)根据已知数据,补充列联表,进而计算 即可判断;
(2)①根据题意,计算对应的平均数,再结合正态分布求解即可;②结合①得Y的可能取值为200,
300,400,500,600,再根据独立事件的概率求解概率分布列,计算期望即可.
【详解】(1) 列联表如下:
I类收入群体 II类收入群体 总计
甲行业 30 60 90
乙行业 20 90 110
总计 50 150 200
于是 ,
从而没有99%的把握认为“II类收入群体”与行业有关.
(2)①所调查的200名工人的月薪频率分布表如下:
月薪/元 [2000,3000) [3000,4000) [4000,5000) [5000,6000) [6000,7000) [7000,8000)
人数 20 36 44 50 40 10
频率 0.1 0.18 0.22 0.25 0.2 0.05
所以
.
因为这200名工人的月薪X服从正态分布 ,所以 ,
从而 .因为王强的月薪为2500元, ,所以王强不属于“生活困难”的工人.
②由①知 ,王强的月薪为2500元,低于4920元,所以王强可获赠两次购物券,从而他获得的赠
送总金额Y的可能取值为200,300,400,500,600,则
, , ,
, ,
故Y的分布列如下:
20 40
Y 300 500 600
0 0
P
所以王强获得的赠送总金额的数学期望 .
11.中国国家统计局2019年9月30日发布数据显示,2019年9月中国制造业采购经理指数(PMI)为
,反映出中国制造业扩张步伐有所加快.以新能源汽车、机器人、增材制造、医疗设备、高铁、电
力装备、船舶、无人机等为代表的高端制造业突飞猛进,则进一步体现了中国制造目前的跨越式发展.已
知某精密制造企业根据长期检测结果,得到生产的产品的质量差服从正态分布 ,并把质量差在
内的产品称为优等品,质量差在 内的产品称为一等品,优等品与一等品统称为
正品,其余范围内的产品作为废品处理.现从该企业生产的正品中随机抽取1000件,测得产品质量差的样
本数据统计如下:(1)根据大量的产品检测数据,检查样本数据的标准差s近似值为10,用样本平均数 作为 的近似值,用
样本标准差 作为 的估计值,记质量差服从正态分布 ,求该企业生产的产品为正品的概率
;(同一组中的数据用该组区间的中点值代表)
参考数据:若随机变量服从正态分布 ,则 , ,
.
(2)假如企业包装时要求把2件优等品和 ( ,且 )件一等品装在同一个箱子中,质检员从某箱
子中摸出两件产品进行检验,若抽取到的两件产品等级相同则该箱产品记为 ,否则该箱产品记为 .
①试用含 的代数式表示某箱产品抽检被记为 的概率 ;
②设抽检5箱产品恰有3箱被记为 的概率为 ,求当 为何值时, 取得最大值.
【答案】(1)
(2)① ;② 时,最大值为 .
【分析】(1)根据频率分布直方图可估计从该企业生产的正品中随机抽取1000件的平均数 ,再根据标
准差,可得出 和 ,得出 ,结合正品的条件,即可求出该企业生产的产品为正品的概率
的结果;
(2)①由题意,结合组合的定义可知,从 件正品中任选两个,有 种选法,其中等级相同有
种选法,通过古典概型的概率求法,即可求出箱产品抽检被记为B的概率为 ,最后
利用排列数的运算即可得出结果;
②根据二项分布的概率求法求出 ,化简得出关于 的函数,利用导数研究函数的单调
性和最值,得出当 时, 取得最大值,从而可求出 时, 最大值为 .【详解】(1)由题意,估计从该企业生产的正品中随机抽取1000件的平均数为:
,即 ,
,所以 ,
则优等品为质量差在 内,即 ,
一等品为质量差在 内,即 ,
所以正品为质量差在 和 内,即 ,
所以该企业生产的产品为正品的概率:
;
(2)①从 件正品中任选两个,有 种选法,其中等级相同有 种选法,
∴某箱产品抽检被记为B的概率为: .
②由题意,一箱产品抽检被记为 的概率为 ,则5箱产品恰有3箱被记为 的概率为
,
所以 ,
所以当 时, ,函数 单调递增,
当 时, ,函数 单调递减,
所以当 时, 取得最大值,最大值为 .
此时 ,解得: ,∴ 时,5箱产品恰有3箱被记为 的概率最大,最大值为 .
4 . 条件概率与统计
一、解答题
1.(2023·全国·高三专题练习)个人养老金制度明确参加人每年除单位缴纳的养老金外可以额外再缴纳个
人养老金,上限为12000元.某机构就是否愿意缴纳个人养老金的情况随机采访了200位市民,假设被采访
者只给出“愿意缴纳个人养老金”或“不愿意缴纳个人养老金”两种结果.已知200位市民中不愿意缴纳个
人养老金的市民占总人数的30%,将愿意缴纳个人养老金的市民按照年龄进行分组,得到如下的频数分布
表.
年龄
频数 8 22 m 50
(1)求m;
(2)估计该市一位市民愿意缴纳个人养老金且年龄位于 的概率;
(3)估计在愿意缴纳个人养老金条件下,该市一位市民的年龄位于 的概率.
【答案】(1)60
(2)0.41
(3)
【分析】(1)先求出愿意缴纳个人养老金的人数,再根据频率分布表即可得解;
(2)先求出愿意缴纳个人养老金且年龄在 的市民人数,再根据古典概型即可得解;
(3)先求出愿意缴纳个人养老金且年龄在 的市民人数,再根据条件概率即可得解.
【详解】(1)由题意可知,愿意缴纳个人养老金的市民占总人数的 ,
故 ,解得 ;
(2)由题意可得愿意缴纳个人养老金且年龄在 的市民人数为 人,
频率为 ,由频率估计概率可得该市一位市民愿意缴纳个人养老金且年龄位于 的概率为 ;
(3)由题意可得愿意缴纳个人养老金且年龄在 的市民人数为 ,
设愿意缴纳个人养老金为事件A,愿意缴纳个人养老金且年龄在 为事件AB,
则 , ,故 ,
由频率估计概率可得在愿意缴纳个人养老金条件下,
该市一位市民的年龄位于 的概率为 .
2.(2023·河南·校联考模拟预测)A市天文台在该市朝阳区随机调查了100位天文爱好者的年龄,得到如
图所示的样本数据频率分布直方图.
(1)估计该朝阳区100名天文爱好者年龄的 分位数(精确到0.01);
(2)已知该朝阳区天文爱好者的占比为 ,且该朝阳区年龄位于区间 的人口数占该区总人口数的
.用样本的频率估计总体的概率,从该朝阳区任选1人,若此人的年龄位于区间 ,求此人是天
文爱好者的概率.(计算结果精确到0.01)
【答案】(1)28.21岁
(2)0.12
【分析】(1)设出 分位数为 ,运用百分位数定义解题;
(2)本题是在朝阳区任选1人且年龄位于区间 的条件下求解是天文爱好者的概率,是条件概率问
题,运用条件概率的知识进行求解即可.【详解】(1)记该朝阳区100名天文爱好者年龄的 分位数为 ,
则 ,
解得 ,
故估计该朝阳区100名天文爱好者年龄的 分位数为28.21岁;
(2)记事件 为:“任选一人,此人年龄位于区间 ”,
事件 为:“任选一人,此人是天文爱好者”,
由条件概率公式可得,
,
故此人是天文爱好者的概率约为0.12.
3.(2023·重庆沙坪坝·重庆八中校考模拟预测)为了保障学生们的合法权益,并保证高考的公平性,重庆
市施行的新高考方案中再选科目的高考成绩采用赋分制.赋分制在一定程度上缩小了试题难度不同带来的分
数差,也在一定程度上减少了学科难度不一造成的分数差.2022年高考成绩公布后,重庆市某中学收集了
部分学生的高考成绩,其中地理成绩均在 (单位:分),将收集到的地理成绩按
分组,得到频率分布直方图如下.
(1)求 ,并估计该校2022年高考地理科的平均成绩;(同一组数据用该区间的中点值作代表)
(2)已知该校2022年所有参加高考的学生中历史类考生占20%,物理类考生占80%,历史类考生中选考地
理的占90%,物理类考生中选考地理的占5%,历史类考生中高考地理成绩不低于90分的占8%,若从该
校2022年高考地理成绩不低于90分的学生中任选1名代表进行经验交流,求选到历史类考生的概率(以
样本中各区间的频率作为相应事件的概率).
【答案】(1) ,估计该校2022年高考地理科的平均成绩为(2)
【分析】(1)根据频率分布直方图结合所有频率和为1求 ,并根据加权平均数运算求解;(2)根据题
意结合条件概率运算求解.
【详解】(1)由题意可得: ,
解得 ,
估计该校2022年高考地理科的平均成绩为
.
(2)该校2022年所有参加高考的学生中任选1名,记“选到历史类考生”为事件A,“选到物理类考
生”为事件B,“选到选考地理的考生”为事件C,则有
,
∴ ,
记“选到高考地理成绩不低于90分”为事件D,则 ,
∴ ,
故 ,
若从该校2022年高考地理成绩不低于90分的学生中任选1名代表进行经验交流,选到历史类考生的概率
.
4.(2023·海南·校联考模拟预测)新冠病毒在传播过程中会发生变异,现在已有多种变异毒株,传播能力
和重症率都各不相同.某地卫生部门统计了本地新冠确诊病例中感染每种毒株的患者在总病例中的比例和
各自的重症率,数据统计如下表所示.
病毒类型 在确诊病例中的比例 重症率
阿尔法 10% 2.4%
贝尔特 15% 3.8%德尔塔 25% 4%
奥密克戎
50% 2%
已知当地将阿尔法、贝尔塔、德尔塔三种类型病例全部集中收治在甲医院,奥密克戎病例全部单独收治在
乙医院.以频率估计概率回答下列问题.
(1)某医生从甲医院新冠确诊病例名单中任取1人,求其为重症病例的概率;
(2)某医生从乙医院新冠确诊病例名单中任取2人,已知2人中有重症病例,求2人都是重症病例的概率
(结果保留4位小数).
【答案】(1)
(2)0.0101
【分析】(1)设事件 “甲医院中任取1位病例为重症病例”,事件 “甲医院中病例来自毒株类型
”, , , ,再利用
利用条件概率公式和全概率公式即可得解;
(2)设事件 “2人中有重症”,事件 “2人都是重症”
则 ,因为 ,所以 ,利用
即可得解.
【详解】(1)设事件 “甲医院中任取1位病例为重症病例”,
事件 “甲医院中病例来自毒株类型 ”,
其样本空间 ,且 , , 两两互斥,根据题意得,
,
,
.
则 , ;, ;
, .
根据全概率公式得
(2)设事件 “2人中有重症”,事件 “2人都是重症”
则 ,因为 ,所以 ,
.
所以,已知2人中有重症病例,2人都是重症病例的概率为0.0101.
5.(2023·辽宁大连·统考二模)2022年2月4日至2月20日,北京冬奥会在我国盛大举行.在冬奥会如火
如荼地进行过程中,不少外国运动员纷纷化身“干饭人”,在社交媒体上发布沉浸式“吃播”,直呼“好
吃到舍不得回家”.其中麻辣烫、豆沙包、宫保鸡丁、饺子……不少传统中国美食也借此机会频频亮相.2月16
日美联社称麻辣烫成为欧洲部分运动员眼中最好吃的冬奥会美食.荷兰速滑运动员尤塔·里尔达姆
(juttaleerdam)就对麻辣烫赞不绝口,在社交媒体上发布的视频获得20多万点赞.西班牙冰舞选手奥利维
亚·斯马特(oliviasmart)和搭档阿德里安·迪亚斯(adriandiaz)也告诉美联社,他们每天都在食堂吃麻辣
烫.针对于此,欧洲某中餐馆决定在餐厅售卖麻辣烫.该中餐馆通过中国美食协会共获得两种不同地方特色
麻辣烫配方(分别称为A配方和B配方),并按这两种配方制作售卖.由于不熟悉当地居民是否能吃辣,故
按照麻辣程度定义了每碗麻辣烫的麻辣值(麻辣值越大表明越麻辣),得到下面第一天的售卖结果:
A配方的售卖频数分布表
麻辣值分
组
频数 10 20 42 18 10
B配方的售卖频数分布表
麻辣值分
组
频数 18 22 38 12 10
定义本餐厅麻辣烫的“麻辣度指数”如下表:麻辣值
麻辣度指
3 4 5
数
(1)试分别估计第一天A配方,B配方售卖的麻辣烫的麻辣值的平均数(同一组中的数据用该组区间的中点
值为代表),并比较大小.
(2)用样本估计总体,将频率视为概率,从当地同时吃过两种配方麻辣烫的消费者中随机抽取1人进行调查,
试估计其评价A配方的“麻辣度指数”比B配方的“麻辣度指数”高的概率.
【答案】(1) , ,A配方的麻辣烫的麻辣值的平均数大于B配方的麻辣烫的麻辣值的平均数
(2)0.33
【分析】(1)根据平均数的计算方法求解,再比较大小即可;
(2)根据全概率公式结合概率的乘法公式求解即可
【详解】(1)A配方售卖的麻辣烫的麻辣值的平均数为
,
B配方售卖的麻辣烫的麻辣值的平均数为
,
因为 ,
所以A配方的麻辣烫的麻辣值的平均数大于B配方的麻辣烫的麻辣值的平均数.
(2)设“其评价A配方麻辣度指数比B配方麻辣度指数高”为事件C.
记“其评价A配方的麻辣度指数为4”为事件 ,“其评价A配方的麻辣度指数为5”为事件 ,
“其评价B配方的麻辣度指数为3”为事件 ,“其评价B配方的麻辣度指数为4”为事件 ,
则 , ,
, .
因为事件 与 相互独立,其中 , ,
所以
.所以其评价A配方的麻辣度指数比B配方麻辣度指数高的概率为0.33.
6.(2023上·湖南长沙·高三长沙一中校联考阶段练习)2022年卡塔尔世界杯将于当地时间11月20日开赛,
某国家队为了考察甲球员对球队的贡献,现作如下数据统计:
球队
甲 总计
胜 负
未参加比赛 30 70
参加比赛 10
总计 70
(1)根据小概率值 的独立性检验,能否认为该球队胜利与甲球员参赛有关联?
(2)根据以往的数据统计,甲球员能够胜任前锋、中场、后卫三个位置,且出场率分别为:0.2,0.5,0.3;在
甲出任前锋、中场、后卫的条件下,球队输球的概率依次为:0.2,0.2,0.7,则:
①当甲参加比赛时,求该球队某场比赛输球的概率;
②当甲参加比赛时,在球队输了某场比赛的条件下,求甲球员担当中场的概率;
③如果你是教练员,应用概率统计有关知识,该如何使用甲球员?
附表及公式:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
.
【答案】(1)认为该球队胜利与甲球员参赛有关联,此推断犯错误的概率不超过0.001
(2)①0.35;② ;③应该多让甲球员担任前锋
【详解】(1)依题意, , , , ,
零假设为 :球队胜利与甲球员参赛无关,
则观测值
根据小概率值 的独立性检验,我们推断 不成立,即认为该球队胜利与甲球员参赛有关联,此推断犯错误的概率不超过0.001.
(2)①设 表示“甲球员担当前锋”; 表示“甲球员担当中场”; 表示“甲球员担当后卫”; 表
示“球队输掉某场比赛”,
有 , , ,
,
则
所以该球队某场比赛输球的概率是0.35.
②由①知,球队输的条件下,甲球员担当中场的概率
③由①知,球队输的条件下,甲球员担当前锋的概率
球队输的条件下,甲球员担当后卫的概率
由②知,
所以,应该多让甲球员担任前锋.