文档内容
2025年菁优高考数学解密之统计
一.选择题(共10小题)
1.(2024•南开区校级模拟)某校举办了数学知识竞赛,并将1000名学生的竞赛成绩(满分100分,成
绩取整数)整理成如图所示的频率分布直方图,则以下四个说法正确的个数为
① 的值为0.005
②估计这组数据的众数为75
③估计这组数据的下四分位数为60
④估计成绩高于80分的有300人
A.1 B.2 C.3 D.4
2.(2024•天心区校级模拟)已知样本数据 , , , 的平均数和标准差均为4,则数据 ,
, , 的平均数与方差分别为
A. ,4 B. ,16 C.4,16 D.4,4
3.(2024•泰安模拟)已知一组数据从小到大为4,5,6,8, ,13,18,30,若这组数据的 分位
数是中位数的两倍,则
A.12 B.11 C.10 D.9
4.(2024•安徽模拟)已知甲、乙两组数据(已按从小到大的顺序排列)
甲组:27、28、39、40、 、50;
乙组:24、 、34、43、48、52.
若这两组数据的30百分位数、80百分位数分别相等,则 等于
A. B. C. D.
5.(2024•和平区校级模拟)在一段时间内,分5次测得某种商品的价格 (万元)和需求量 之间的
1一组数据,绘制散点图如图所示,利用最小二乘法求得相应的经验回归方程为 根据上述信
息,如下判断正确的是
价格 1.4 1.6 1.8 2 2.2
需求量 12 10 7 3
A.商品的价格和需求量存在正相关关系
B. 与 不具有线性相关关系
C.
D.价格定为1.9万元,预测需求量大约为
6.(2024•南开区模拟)某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒到18秒
之间,将测试结果分为五组:第一组 , ,第二组 , , ,第五组 , .如图是按上
述分组方法得到的频率分布直方图,若成绩低于 即为优秀,如果优秀的人数为14人,则 的估计值是
A.14 B.14.5 C.15 D.15.5
7.(2024•邢台模拟)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在 , 内.
估计所有参赛同学成绩的第75百分位数为
2A.65 B.75 C.85 D.95
8.(2024•浦东新区校级模拟)从某中学甲、乙两班各随机抽取 10名同学,测量他们的身高(单位:
,所得数据用茎叶图表示如图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是
A.甲乙两班同学身高的极差相等
B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等
D.乙班同学身高在 以上的人数较多
9.(2024•河东区一模)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在
(含 以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处 500元以上
2000元以下罚款.某地统计了近五年来查处的酒后驾车和醉酒驾车共200人,如图2,这是对这200人酒
后驾车血液中酒精含量进行检测所得结果的频率分布直方图,下列说法正确的是
3A.在酒后驾车的驾驶人中醉酒驾车比例不高因此危害不大
B.在频率分布直方图中每个柱的高度代表区间内人数的频率
C.根据频率分布直方图可知200人中醉酒驾车的约有30人
D.这200人酒后驾车血液中酒精含量的平均值约为
10.(2024•福建模拟)若一组数据1,1, ,4,5,5,6,7的75百分位数是6,则
A.4 B.5 C.6 D.7
二.多选题(共5小题)
11.(2024•鼓楼区校级模拟)下列说法中,正确的是
A.一组数据5,8,8,9,12,13,15,16,20,22的第80百分位数为18
B.若随机变量 ,且 ,则
C.袋中装有除颜色外完全相同的4个红球和2个白球,从袋中不放回地依次抽取2个球,记事件
第一次抽到的是白球,事件 第二次抽到的是白球,则
D.设随机事件 , ,已知 (A) , , ,则 (B)
12.(2024•江西一模)下列说法正确的是
A.用简单随机抽样从含有50个个体的总体中抽取一个容量为10的样本,个体 被抽到的概率是0.2
B.已知一组数据1,2, ,6,7的平均数为4,则这组数据的方差是5
C.数据27,12,14,30,15,17,19,23的 分位数是17
D.若样本数据 , , , 的标准差为8,则数据 , , , 的标准差为16
13.(2024•九龙坡区模拟)已知样本数据 , , 的平均数为2,方差为1,则下列说法正确的是
A.数据 , , 的平均数为6
B.数据 , , 的方差为9
C.数据 , , ,2的方差为1
4D.数据 的平均数为5
14.(2024•丹东模拟)已知甲乙两人进行射击训练,两人各试射5次,具体命中环数如下表(最高环数
为10.0环),从甲试射命中的环数中任取3个,设事件 表示“至多1个超过平均环数”,事件 表示
“恰有2个超过平均环数”,则下列说法正确的是
人 甲 乙
员
命 9.0 9.8 9.0 9.2 9.5 9.3 9.5 9.2 9.1 9.4
中
环
数
A.甲试射命中环数的平均数小于乙试射命中环数的平均数
B.甲试射命中环数的方差大于乙试射命中环数的方差
C.乙试射命中环数的的 分位数是9.2
D.事件 , 互为对立事件
15.(2024•河南模拟)下列说法正确的是
A.在经验回归方程 中,当解释变量 每增加1个单位时,响应变量 平均减少3.6个
单位
B.在经验回归方程 中,相对于样本点 的残差为
C.在残差图中,残差分布的水平带状区域的宽度越宽,其模型的拟合效果越差
D.若两个变量的决定系数 越大,表示残差平方和越小,即模型的拟合效果越好
三.填空题(共5小题)
16.(2024•杨浦区校级三模)对于没有重复数据的样本 、 、 、 ,记这 个数的第 百分位数
为 .若 不在这组数据中,且在区间 , 中的数据有且只有5个,则 的所有可
能值组成的集合为 .
17.(2024•渭南二模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题
共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得 6分,
有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题
正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的
5考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地
选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
18.(2024•闵行区校级三模)记一组样本数据10,18,8,4,16,24,6,8,32的中位数为 ,平均数
为 ,则 .
19.(2024•烟台模拟)数据3.2,3.4,3.8,4.2,4.3,4.5, ,6.6的第63百分位数是4.5,则实数 的
最小值是 .
20.(2024•雁峰区校级模拟)随机数表是人们根据需要编制出来的,由 0,1,2,3,4,5,6,7,8,9
这10个数字组成,表中每一个数都是用随机方法产生的,随机数的产生方法主要有抽签法、抛掷骰子法
和计算机生成法.现有甲、乙、丙三位同学合作在一个正二十面体(如图)的各面写上 这10个数字
(相对的两个面上的数字相同),这样就得到一个产生 的随机数的骰子.依次投掷这个骰子,并逐
个记下朝上一面的数字,就能按顺序排成一个随机数表,若甲、乙、丙依次投掷一次,按顺序记下三个
数,三个数恰好构成等差数列的概率为 .
四.解答题(共5小题)
21.(2024•毕节市模拟)某地区工会利用“健步行 ”开展健步走活动.为了解会员的健步走情况,
工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为 ,
, , , , , , , , , 九组,整理得到如图所示的频率分布直方图.
(Ⅰ)根据频率分布直方图,估计样本数据的 分位数;
(Ⅱ)据统计,在样本数据 , , , , , 的会员中体检为“健康”的比例分别为 ,
以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
622.(2024•峨眉山市校级模拟)亚运聚欢潮,璀璨共此时 年9月第19届亚洲运动会在杭州举办,
来自亚洲45个国家和地区的1万多名运动员在这里团结交流、收获友谊,奋勇拼搏、超越自我,共同创
造了亚洲体育新的辉煌和荣光,赢得了亚奥理事会大家庭和国际社会的广泛好评.亚运会圆满结束后,
杭州某学校组织学生参加与本届亚运会有关的知识竞赛.为更好地了解该校学生对本届亚运会有关赛事
和知识的掌握情况,采用随机抽样的方法抽取了600名学生进行调查,成绩全部分布在 分之间,
根据调查的结果绘制的学生成绩频率分布直方图如图所示,
(1)求频率分布直方图中 的值;
(2)估计这600名学生成绩的中位数;
(3)根据频率分布直方图,按分层抽样的方法从成绩在 , , , 的学生中选取5人,再从
这5人中任意选取2人,求这2人中至少有1人成绩不低于90分的概率.
23.(2024•宁化县校级一模)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的
平均产卵数 (个 和平均温度 有关,现收集了以往某地的7组数据,得到下面的散点图及一些统
计量的值.
(1)根据散点图判断, 与 (其中 为自然对数的底数)哪一个更适合作为平
7均产卵数 (个 关于平均温度 的回归方程类型?
(2)由(1)的判断结果及表中数据,求出 关于 的回归方程.(计算结果精确到 附:回归方程
中, , .
参考数据
5215 17713 717 27 81.3 3.6
(3)根据以往每年平均气温以及对果园年产值的统计,得到以下数据:平均气温在 以下的年数占
,对柚子产量影响不大,不需要采取防虫措施;平均气温在 至 的年数占 ,柚子产量
会下降 ;平均气温在 以上的年数占 ,柚子产量会下降 、为了更好的防治红蜘蛛虫害,
农科所研发出各种防害措施供果农选择.
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益
产值 防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施 ,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施 ,可以防治 至 的蜘蛛虫害,但无法防治 以上的红蜘蛛虫害,费用
是10万;
方案3:不采取防虫害措施.
24.(2024•静安区二模)某高中随机抽取100名学生,测得他们的身高(单位: ,按照区间 ,
8, , , , , , , , 分组,得到样本身高的频率分布直方图(如
图所示).
(1)求身高不低于 的学生人数;
(2)将身高在 , , , , , 区间内的学生依次记为 , , 三个组,用分层
抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求 组中至少有1人被抽中的概率.
25.(2024•包头模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽
车流量 (单位:辆)和空气中的 的平均浓度 (单位: .调研人员采集了50天的数据,
制作了关于 , ,2,3, , 的散点图,并用直线 与 将散点图分成如图所
示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的 列联表,并判断至少有多大把握认为“ 平均浓度不小于 与“汽车
日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
的平均浓度
的平均浓度
9合计
(2)经计算得回归方程为 ,且这50天的汽车日流量 的标准差 , 的平均
浓度 的标准差 .
①求相关系数 ,并判断该回归方程是否有价值;
②若这50天的汽车日流量 满足 ,试推算这50天的 日均浓度 的平均数 .(精确
到
参考公式: ,其中 .
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程 ,其中 .
相关系数 .若 ,则认为 与 有较强的线性相关性.
102025年菁优高考数学解密之统计
参考答案与试题解析
一.选择题(共10小题)
1.(2024•南开区校级模拟)某校举办了数学知识竞赛,并将1000名学生的竞赛成绩(满分100分,成
绩取整数)整理成如图所示的频率分布直方图,则以下四个说法正确的个数为
① 的值为0.005
②估计这组数据的众数为75
③估计这组数据的下四分位数为60
④估计成绩高于80分的有300人
A.1 B.2 C.3 D.4
【答案】
【考点】补全频率分布直方图
【专题】数形结合法;数形结合;概率与统计;数学运算
【分析】利用频率分布直方图的性质判断①;利用众数、百分位数的求法判断②③;根据频率分布直方
图计算可估计总体判断④.
【解答】解:由频率分布直方图可知 ,
解得 ,故①正确;
根据频率分布直方图可知众数落在区间 , ,用区间中点表示众数,即众数为75,故②正确;
前两组频率之和为 ,
这组数据的下四分位数为60,故③正确;
成绩高于80分的频率为 ,
估计总体成绩高于80分的有 人,故④正确.
故选: .
【点评】本题考查频率分布直方图、众数、百分位数等基础知识,考查运算求解能力,是基础题.
112.(2024•天心区校级模拟)已知样本数据 , , , 的平均数和标准差均为4,则数据 ,
, , 的平均数与方差分别为
A. ,4 B. ,16 C.4,16 D.4,4
【答案】
【考点】用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数
【专题】综合法;数学运算;概率与统计;整体思想
【分析】利用平均数和方差的性质求解.
【解答】解: 样本数据 , , , 的平均数和标准差均为4,
数据 , , , 的平均数为 ,方差为 .
故选: .
【点评】本题主要考查了平均数和方差的性质,属于基础题.
3.(2024•泰安模拟)已知一组数据从小到大为4,5,6,8, ,13,18,30,若这组数据的 分位
数是中位数的两倍,则
A.12 B.11 C.10 D.9
【答案】
【考点】用样本估计总体的集中趋势参数
【专题】定义法;对应思想;概率与统计;数学运算
【分析】首先求出中位数,再找到第 分位数,即可得到方程,解得即可.
【解答】解:由题意得这组数据的中位数为 ,
因为 ,所以这组数据的 分位数为第7个数,即18,
则 ,解得 .
故选: .
【点评】本题考查中位数,百分位数的定义,属于基础题.
4.(2024•安徽模拟)已知甲、乙两组数据(已按从小到大的顺序排列)
甲组:27、28、39、40、 、50;
乙组:24、 、34、43、48、52.
若这两组数据的30百分位数、80百分位数分别相等,则 等于
12A. B. C. D.
【答案】
【考点】百分位数
【专题】转化思想;定义法;概率与统计;数学运算
【分析】根据百分位数的定义并结合已知条件求出 , 的值,即可得到答案.
【解答】解:因为 , ,
所以乙组的30百分位数为 ,甲组的80百分位数为 ,
则 .
故选: .
【点评】本题考查了百分位的求解,解题的关键是掌握百分位数的定义以及求解方法,考查了运算能力,
属于基础题.
5.(2024•和平区校级模拟)在一段时间内,分5次测得某种商品的价格 (万元)和需求量 之间的
一组数据,绘制散点图如图所示,利用最小二乘法求得相应的经验回归方程为 根据上述信
息,如下判断正确的是
价格 1.4 1.6 1.8 2 2.2
需求量 12 10 7 3
A.商品的价格和需求量存在正相关关系
B. 与 不具有线性相关关系
C.
D.价格定为1.9万元,预测需求量大约为
【答案】
【考点】经验回归方程与经验回归直线
【专题】方程思想;概率与统计;数学模型法;数学运算
【分析】由图判定 ;由经验回归方程判断 ;求出样本点的中心的坐标代入线性回归方程求解 值判
13断 ;在线性回归方程中,取 求得 值判断 .
【解答】解:由图表可知,商品的价格和需求量存在负相关关系,故 错误;
由经验回归方程为 ,可知 与 具有线性相关关系,故 错误;
, ,
则 ,解得 ,故 错误;
取 ,得 ,故 正确.
故选: .
【点评】本题考查线性回归方程及其应用,是基础题.
6.(2024•南开区模拟)某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒到18秒
之间,将测试结果分为五组:第一组 , ,第二组 , , ,第五组 , .如图是按上
述分组方法得到的频率分布直方图,若成绩低于 即为优秀,如果优秀的人数为14人,则 的估计值是
A.14 B.14.5 C.15 D.15.5
【答案】
【考点】频率分布直方图;用样本的数字特征估计总体的数字特征
【专题】转化思想;数形结合法;概率与统计;数学运算
【分析】由频率分布直方图,先求出低于 的频率,然后求出成绩在 , 内的频率,由此列式求解
即可.
【解答】解:根据题意可得,成绩低于 的频率为 ,
14由频率分布直方图可知,成绩在 , 内的频率为 ,
则 的估计值为 .
故选: .
【点评】本题考查了频率分布直方图的应用,解题的关键是掌握频率分布直方图中频率的求解方法,掌
握频率、频数、样本容量之间的关系,考查了逻辑推理能力,属于基础题.
7.(2024•邢台模拟)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在 , 内.
估计所有参赛同学成绩的第75百分位数为
A.65 B.75 C.85 D.95
【答案】
【考点】百分位数
【专题】数学运算;概率与统计;数形结合;数形结合法
【分析】利用频率分布直方图、百分位数的定义直接求解.
【解答】解:因为参赛成绩位于 , 内的频率为 ,
所以第75百分位数在 , 内,
设为 ,则 ,解得 ,
即第75百分位数为85.
故选: .
【点评】本题考查统计的知识、数据分析与数学运算的核心素养等基础知识,考查运算求解能力,是基
础题.
8.(2024•浦东新区校级模拟)从某中学甲、乙两班各随机抽取 10名同学,测量他们的身高(单位:
,所得数据用茎叶图表示如图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是
15A.甲乙两班同学身高的极差相等
B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等
D.乙班同学身高在 以上的人数较多
【答案】
【考点】茎叶图;用样本估计总体的集中趋势参数
【专题】综合法;数学运算;概率与统计;整体思想
【分析】根据茎叶图和极差、平均数、中位数等概念逐一计算,即可判断选项是否正确.
【解答】解:由茎叶图可知,甲班同学身高的极差为 ,乙班同学身高的极差为
,两班身高极差不相等,故 错误;
甲班同学身高的平均值为 ,
乙班同学身高的平均值为 ,
显然,甲乙两班同学身高的平均值不相等,即 错误;
根据茎叶图可知,甲班同学身高的中位数为 ,乙班同学身高的中位数为:
,
所以甲乙两班同学身高的中位数不相等,即 错误;
由茎叶图可知,甲班同学身高在 以上的人数为3人,乙班同学身高在 以上的人数为4人,故
正确.
故选: .
【点评】本题主要考查了茎叶图的应用,考查了极差、平均数、中位数的计算,属于基础题.
9.(2024•河东区一模)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在
(含 以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处 500元以上
2000元以下罚款.某地统计了近五年来查处的酒后驾车和醉酒驾车共200人,如图2,这是对这200人酒
16后驾车血液中酒精含量进行检测所得结果的频率分布直方图,下列说法正确的是
A.在酒后驾车的驾驶人中醉酒驾车比例不高因此危害不大
B.在频率分布直方图中每个柱的高度代表区间内人数的频率
C.根据频率分布直方图可知200人中醉酒驾车的约有30人
D.这200人酒后驾车血液中酒精含量的平均值约为
【答案】
【考点】频率分布直方图的应用
【专题】综合法;数学运算;整体思想;概率与统计
【分析】根据频率分布直方图的性质可判断 ,根据平均数的定义可判断 .
【解答】解:对于 ,醉酒驾车发生车祸的概率非常大,所以醉酒驾车的危害很大,故 错误;
对于 ,由频率分布直方图可知,在频率分布直方图中每个柱的面积代表区间内人数的频率,故 错误;
对于 ,根据频率分布直方图可知200人中醉酒驾车的频率为 ,
所以200人中醉酒驾车的人数约有 人,故 正确;
对 于 , 这 200 人 酒 后 驾 车 血 液 中 酒 精 含 量 的 平 均 值 约 为
, 故 错
误.
故选: .
【点评】本题主要考查了频率分布直方图的应用,考查了平均数的定义,属于基础题.
10.(2024•福建模拟)若一组数据1,1, ,4,5,5,6,7的75百分位数是6,则
A.4 B.5 C.6 D.7
【答案】
【考点】百分位数
【专题】转化思想;转化法;概率与统计;数学运算
17【分析】根据百分位数的定义求解即可.
【解答】解:这组数据为:1,1, ,4,5,5,6,7,但 大小不定,因为 ,
所以这组数据的 分位数为从小到大的顺序的第6个数和第7个数的平均数,
经检验,只有 符合.
故选: .
【点评】本题主要考查百分位数的定义,属于基础题.
二.多选题(共5小题)
11.(2024•鼓楼区校级模拟)下列说法中,正确的是
A.一组数据5,8,8,9,12,13,15,16,20,22的第80百分位数为18
B.若随机变量 ,且 ,则
C.袋中装有除颜色外完全相同的4个红球和2个白球,从袋中不放回地依次抽取2个球,记事件
第一次抽到的是白球,事件 第二次抽到的是白球,则
D.设随机事件 , ,已知 (A) , , ,则 (B)
【答案】
【考点】正态分布曲线的特点及曲线所表示的意义;求解条件概率;百分位数
【专题】数学运算;转化思想;概率与统计;综合法
【分析】根据百分位数的定义计算即可判断选项 ;根据正态分布的性质计算即可判断选项 ;根据条
件概率的计算方法求解即可判断选项 ;根据条件概率与对立事件的计算公式计算即可判断选项 .
【解答】解:对于 ,共有10个数, ,
所以数据的第80百分位数为16和20的平均数,即为18,故 正确.
对于 ,因为 ,且 ,
所以 ,
则 ,故 正确.
对于 ,因为 ,
所以 ,则 ,故 错误.
18对于 ,因为 (A) , ,
所以 (A) ,
又因为 (A) ,所以 ,
则 ,
所以 ,故 正确.
故选: .
【点评】本题考查百分位数的求解,正态分布的性质,条件概率问题,属中档题.
12.(2024•江西一模)下列说法正确的是
A.用简单随机抽样从含有50个个体的总体中抽取一个容量为10的样本,个体 被抽到的概率是0.2
B.已知一组数据1,2, ,6,7的平均数为4,则这组数据的方差是5
C.数据27,12,14,30,15,17,19,23的 分位数是17
D.若样本数据 , , , 的标准差为8,则数据 , , , 的标准差为16
【答案】
【考点】用样本估计总体的集中趋势参数;用样本估计总体的离散程度参数
【专题】综合法;数学运算;概率与统计;整体思想
【分析】利用概率的定义即可判断 ;根据平均数求得 的值,然后利用方差公式求解即可判断 ;根
据百分位数的求法即可判断 ;利用方差公式求解即可判断 .
【解答】解:对于 ,一个总体含有50个个体,某个个体被抽到的概率为 ,
以简单随机抽样方式从该总体中抽取一个容量为10的样本,
则指定的某个个体被抽到的概率为 ,故 正确;
对于 , 数据1,2, ,6,7的平均数是4, ,
这组数据的方差是 ,故 错误;
对于 ,8个数据50百分位为 ,第50百分位数为 ,故 错误;
对于 ,依题意, ,则 ,
19所以数据 , , , 的标准差为16, 正确.
故选: .
【点评】本题主要考查了平均数、百分位数和标准差的计算,属于基础题.
13.(2024•九龙坡区模拟)已知样本数据 , , 的平均数为2,方差为1,则下列说法正确的是
A.数据 , , 的平均数为6
B.数据 , , 的方差为9
C.数据 , , ,2的方差为1
D.数据 的平均数为5
【答案】
【考点】用样本估计总体的集中趋势参数;用样本估计总体的离散程度参数
【专题】定义法;数学运算;概率与统计;方程思想
【分析】利用平均数、方差的定义和性质求解.
【解答】解:样本数据 , , 的平均数为2,方差为1,
对于 ,数据 , , 的平均数为 ,故 错误;
对于 ,数据 , , 的方差为 ,故 正确;
对于 ,数据 , , ,2的方差为 ,故 错误;
对于 ,样本数据 , , 的平均数为2,方差为1,
,
,
,
则数据 的平均数为5,故 正确.
故选: .
20【点评】本题考查平均数、方差的定义和性质等基础知识,考查运算求解能力,是基础题.
14.(2024•丹东模拟)已知甲乙两人进行射击训练,两人各试射5次,具体命中环数如下表(最高环数
为10.0环),从甲试射命中的环数中任取3个,设事件 表示“至多1个超过平均环数”,事件 表示
“恰有2个超过平均环数”,则下列说法正确的是
人 甲 乙
员
命 9.0 9.8 9.0 9.2 9.5 9.3 9.5 9.2 9.1 9.4
中
环
数
A.甲试射命中环数的平均数小于乙试射命中环数的平均数
B.甲试射命中环数的方差大于乙试射命中环数的方差
C.乙试射命中环数的的 分位数是9.2
D.事件 , 互为对立事件
【答案】
【考点】互斥事件与对立事件;用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数
【专题】数学运算;综合法;概率与统计;整体思想
【分析】根据平均数、方差和百分位数的定义可判断 ,根据对立事件的定义可判断 .
【解答】解:对于 ,甲试射命中环数的平均数为 ,乙试射命中环数的平均
数为 ,
所以甲试射命中环数的平均数等于乙试射命中环数的平均数,故 错误;
对 于 , 甲 试 射 命 中 环 数 的 方 差 为
,
乙试射命中环数的方差为 ,
所以甲试射命中环数的方差大于乙试射命中环数的方差,故 正确;
对于 ,乙试射命中环数从小到大排列为9.1,9.2,9.3,9.4,9.5,
因为 ,所以乙试射命中环数的的 分位数是9.2,故 正确;
对于 ,甲试射命中的环数中有2个超过平均环数,所以事件 与事件 是对立事件,故 正确.
故选: .
【点评】本题主要考查了平均数、方差和百分位数的定义,考查了对立事件的定义,属于基础题.
2115.(2024•河南模拟)下列说法正确的是
A.在经验回归方程 中,当解释变量 每增加1个单位时,响应变量 平均减少3.6个
单位
B.在经验回归方程 中,相对于样本点 的残差为
C.在残差图中,残差分布的水平带状区域的宽度越宽,其模型的拟合效果越差
D.若两个变量的决定系数 越大,表示残差平方和越小,即模型的拟合效果越好
【答案】
【考点】样本相关系数;经验回归方程与经验回归直线;回归分析
【专题】数学抽象;对应思想;定义法;概率与统计
【分析】由线性回归方程判断 ;由残差的定义判断 ;由残差图与拟合效果间的关系判断 ;根据决
定系数 的意义判断 .
【解答】解:根据经验回归方程 ,当解释变量 每增加1个单位时,
响应变量 平均减少0.65个单位,故选项 错误;
在经验回归方程 中,相对于样本点 的残差为 ,故选
项 正确;
在残差图中,残差分布的水平带状区域的宽度越宽,其模型的拟合效果越差,故选项 正确;
若两个变量的决定系数 越大,表示残差平方和越小,即模型的拟合效果越好,故 正确.
故选: .
【点评】本题考查线性回归方程的应用,是基础题.
三.填空题(共5小题)
16.(2024•杨浦区校级三模)对于没有重复数据的样本 、 、 、 ,记这 个数的第 百分位数
为 .若 不在这组数据中,且在区间 , 中的数据有且只有5个,则 的所有可
能值组成的集合为 , .
22【答案】 , .
【考点】百分位数
【专题】函数思想;分析法;概率与统计;数据分析
【分析】根据 是否为正整数分类讨论,若为正整数,则5个数分别为 , , ,若不为整数,
则5个数分别为 , , ,根据 , 的范围分类计算.
【解答】解:设 ,
则 不在这组数据,
为正整数,
, ,
在区间 , 中的数据有且只有5个,
故这个5个数分别为 , , ,即 ,
当 ,6,7,
当 时, , , ,即为 , , , ,共5个,符合;
当 时, , , ,即为 , , , , , ,共6个,不符合;
当 时, , , , , , , ,共7个,不符合,
若 为整数,可得 ,即有 ;
若 不为整数,故 ,其中 为正奇数,
设 ,其中 为正整数,
则 ,且 ,故 ,
, ,
在区间 , 中的数据有且只有5个,
这5个数分别为 , , , ,即 ,
23但当 , ,此时 , , 至少有6个,
,6,7,
当 时, , , 即为 , , , , ,共5个,符合,此时 ;
当 时, , , 即为 , , , , , ,共6个,不符合;
当 时, , , 即为 , , , , , , ,共7个,不符合.
综上,符合条件的 为50,55.
故答案为: , .
【点评】本题考查百分位数的定义和集合的表示,考查运算求解能力,是基础题.
17.(2024•渭南二模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题
共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得 6分,
有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题
正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的
考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地
选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 1 1 分 .
【答案】11分.
【考点】用样本估计总体的集中趋势参数
【专题】概率与统计;数学运算;整体思想;综合法
【分析】根据题意,求出小明同学多选题所有可能总得分,再结合中位数的定义求解.
【解答】解:由题意可知,小明同学三个多选题中第一小题得6分,第二小题可能得0分或4分或6分,
第三小题可能得0分或2分或3分,
所以小明同学多选题所有可能总得分(相同总分只记录一次)为:6分,8分,9分,10分,12分,13分,
14分,15分,
所以中位数为 分.
故答案为:11分.
【点评】本题主要考查了中位数的定义,属于基础题.
18.(2024•闵行区校级三模)记一组样本数据10,18,8,4,16,24,6,8,32的中位数为 ,平均数
为 ,则 .
【答案】 .
【考点】用样本估计总体的集中趋势参数
24【专题】综合法;整体思想;概率与统计;数学运算
【分析】利用中位数和平均数的定义求解.
【解答】解:数据从小到大排列为:4,6,8,8,10,16,18,24,32,
所以中位数 ,平均数 ,
所以 .
故答案为: .
【点评】本题主要考查了中位数和平均数的定义,属于基础题.
19.(2024•烟台模拟)数据3.2,3.4,3.8,4.2,4.3,4.5, ,6.6的第63百分位数是4.5,则实数 的
最小值是 4. 5 .
【答案】4.5.
【考点】百分位数
【专题】综合法;数学运算;概率与统计;转化思想
【分析】根据百分位数的定义进行求解即可.
【解答】解:由题意可知这组数据一个有8个,
因为 ,
所以这组数据第63百分位数是这组数据从小到大排列的第6个数据,
因为这组数据第63百分位数是4.5,
所以实数 的最小值是4.5,
故答案为:4.5.
【点评】本题考查了百分位数的求解,属于基础题.
20.(2024•雁峰区校级模拟)随机数表是人们根据需要编制出来的,由 0,1,2,3,4,5,6,7,8,9
这10个数字组成,表中每一个数都是用随机方法产生的,随机数的产生方法主要有抽签法、抛掷骰子法
和计算机生成法.现有甲、乙、丙三位同学合作在一个正二十面体(如图)的各面写上 这10个数字
(相对的两个面上的数字相同),这样就得到一个产生 的随机数的骰子.依次投掷这个骰子,并逐
个记下朝上一面的数字,就能按顺序排成一个随机数表,若甲、乙、丙依次投掷一次,按顺序记下三个
数,三个数恰好构成等差数列的概率为 .
25【答案】 .
【考点】抽签法简单随机抽样及其步骤
【专题】数学运算;综合法;概率与统计;整体思想
【分析】甲投1次,记下数字有10种可能,乙投1次也有10种可能;丙投1次也有10种可能,所以甲、
乙、丙依次投掷1次,由分步乘法原理可得所有记下数字的总情况数,再列举出等差数列的公差为0,
1,2,3,4的所有情况,将公差为1,2,3,4的等差数列中的第1项和第3项的数字交换,分别构成公
差为 , , , 的等差数列,可得出构成等差数列的可能情况数,根据古典概率公式计算可得选
项.
【解答】解:甲投1次,记下数字有10种可能,乙投1次也有10种可能;丙投1次也有10种可能,
所以甲、乙、丙依次投掷1次,记下数字有 种情况,
这10个数字中选3个,能构成等差数列的情况如下:
公差为0的等差数列有:0,0,0;1,1,1;2,2,2; ;9,9,9共10种情况;
公差为1的等差数列有:0,1,2;1,2,3;2,3,4;3,4,5;4,5,6;5,6,7;6,7,8;7,8,
9共8种情况;
公差为2的等差数列有:0,2,4;1,3,5;2,4,6;3,5,7;4,6,8;5,7,9共6种情况;
公差为3的等差数列有:0,3,6;1,4,7;2,5,8;3,6,9共4种情况;
公差为4的等差数列有:0,4,8;1,5,9共2种情况;
公差为1,2,3,4的等差数列中的第1项和第3项的数字交换,分别构成公差为 , , , 的等
差数列,
所以构成等差数列的可能情况有 种,
所以若甲、乙、丙依次投掷一次,按顺序记下三个数,三个数恰好构成等差数列的概率为 .
故答案为: .
【点评】本题主要考查了等差数列的性质,考查了古典概型的概率公式,属于中档题.
四.解答题(共5小题)
2621.(2024•毕节市模拟)某地区工会利用“健步行 ”开展健步走活动.为了解会员的健步走情况,
工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为 ,
, , , , , , , , , 九组,整理得到如图所示的频率分布直方图.
(Ⅰ)根据频率分布直方图,估计样本数据的 分位数;
(Ⅱ)据统计,在样本数据 , , , , , 的会员中体检为“健康”的比例分别为 ,
以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
【答案】(Ⅰ)估计样本数据的 分位数为14.5;
(Ⅱ)在该地区工会会员中任取一人,体检为“健康”的概率为0.38.
【考点】频率分布直方图的应用
【专题】数学运算;综合法;计算题;概率与统计;转化思想
【分析】(Ⅰ)根据频率分布直方图结合结合百分位数的定义运算求解即可;
(Ⅱ)先列举出所有的基本事件,再从中找出符合条件的基本事件,根据古典概型的概率公式运算求解.
【解答】解:(Ⅰ)由于在 , 的样本数据比例为: ,
样本数据的 分位数在 , 内,
估计样本数据的 分位数为: ;
(Ⅱ)设任取的会员数据在 , , , , , 中分别设为事件 , , ,
, ,
,
27设事件 在该地区工会会员中任取一人体检为“健康”,
,
即在该地区工会会员中任取一人,体检为“健康”的概率为0.38.
【点评】本题考查了频率分布直方图和百分位数的求法问题,也考查列举法求概率,是基础题.
22.(2024•峨眉山市校级模拟)亚运聚欢潮,璀璨共此时 年9月第19届亚洲运动会在杭州举办,
来自亚洲45个国家和地区的1万多名运动员在这里团结交流、收获友谊,奋勇拼搏、超越自我,共同创
造了亚洲体育新的辉煌和荣光,赢得了亚奥理事会大家庭和国际社会的广泛好评.亚运会圆满结束后,
杭州某学校组织学生参加与本届亚运会有关的知识竞赛.为更好地了解该校学生对本届亚运会有关赛事
和知识的掌握情况,采用随机抽样的方法抽取了600名学生进行调查,成绩全部分布在 分之间,
根据调查的结果绘制的学生成绩频率分布直方图如图所示,
(1)求频率分布直方图中 的值;
(2)估计这600名学生成绩的中位数;
(3)根据频率分布直方图,按分层抽样的方法从成绩在 , , , 的学生中选取5人,再从
这5人中任意选取2人,求这2人中至少有1人成绩不低于90分的概率.
【答案】(1) ;(2)80;(3) .
【考点】补全频率分布直方图
【专题】定义法;概率与统计;方程思想;数学运算
【分析】(1)根据各矩形面积之和为1,列式计算,即可求得 的值;
(2)根据频率分布直方图,结合中位数的求解方法,即可求得答案;
(3)求出 , , , 内的人数之比,根据分层抽样可求得两组各抽取的人数,列举出从这5
人中任意选取2人的所有可能情况,再列举出这2人中至少有1人成绩不低于90分的情况,根据古典概
型的概率公式,即可求得答案.
【解答】解:(1)由频率分布直方图,得 ,
28解得 ;
(2)由频率分布直方图,得 ,
,
则估计这600名学生成绩的中位数为80;
(3)由题意得,成绩在 , 的频率为 ,
成绩在 , 的频率为 ,频率之比为 ,
所以按分层抽样的方法从中选取5人,成绩在 , 的学生有2人,分别记为 , ,
成绩在 , 的学生有3人,分别记为 , , ,
从这5人中任意选取2人,有 , , , , , , , , , ,共10种选
法,
其中至少有1人成绩不低于90分的选法有 , , , , , , , , ,共9
种,
所以这2人中至少有1人成绩不低于90分的概率 .
【点评】本题考查频率分布直方图、中位数、古典概型、列举法等基础知识,考查运算求解能力,是基
础题.
23.(2024•宁化县校级一模)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的
平均产卵数 (个 和平均温度 有关,现收集了以往某地的7组数据,得到下面的散点图及一些统
计量的值.
(1)根据散点图判断, 与 (其中 为自然对数的底数)哪一个更适合作为平
均产卵数 (个 关于平均温度 的回归方程类型?
(2)由(1)的判断结果及表中数据,求出 关于 的回归方程.(计算结果精确到 附:回归方程
29中, , .
参考数据
5215 17713 717 27 81.3 3.6
(3)根据以往每年平均气温以及对果园年产值的统计,得到以下数据:平均气温在 以下的年数占
,对柚子产量影响不大,不需要采取防虫措施;平均气温在 至 的年数占 ,柚子产量
会下降 ;平均气温在 以上的年数占 ,柚子产量会下降 、为了更好的防治红蜘蛛虫害,
农科所研发出各种防害措施供果农选择.
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益
产值 防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施 ,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施 ,可以防治 至 的蜘蛛虫害,但无法防治 以上的红蜘蛛虫害,费用
是10万;
方案3:不采取防虫害措施.
【考点】经验回归方程与经验回归直线
【专题】综合题;对应思想;分析法;概率与统计;逻辑推理;数学运算
【分析】(1)由题意,结合散点图进行判断即可;
(2)结合(1)中的判断结果以及题目所给信息求出 的值,进而即可求解;
(3)用 , , 分别表示选择三种方案的收益,分别求出每种方案中的最高收益,再进行比较即可
求解.
30【解答】解:(1)由散点图可以判断 更适宜作为平均产卵数 关于平均温度 的回归方程类型;
(2)将 两边同时取对数,
可得 ,
令 ,
易知 , ,
所以 ,
则 ,
故 关于 的回归方程为 ;
(3)不妨用 , , 分别表示选择三种方案的收益,
若采用第1种方案,无论气温如何,产值不受影响,收益为 万,
即 ;
若采用第2种方案,在不发生 以上的红蜘蛛虫害,收益为 万,
如果发生,则收益为 万,
即 ;
若采用第3种方案,
可得 ,
所以 ,
,
31,
因为 ,
所以选择方案1最佳.
【点评】本题考查线性回归方程的应用,考查了逻辑推理和运算能力.
24.(2024•静安区二模)某高中随机抽取100名学生,测得他们的身高(单位: ,按照区间 ,
, , , , , , , , 分组,得到样本身高的频率分布直方图(如
图所示).
(1)求身高不低于 的学生人数;
(2)将身高在 , , , , , 区间内的学生依次记为 , , 三个组,用分层
抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求 组中至少有1人被抽中的概率.
【答案】(1)60.
(2)①3,2,1.② .
【考点】频率分布直方图的应用
【专题】计算题;数学运算;综合法;整体思想;概率与统计
【分析】(1)先求出 , 的频率可得结果.
32(2)由分层抽样可得各组的人数,分别列举各种情况可得概率.
【解答】解:(1)由频率分布直方图可知
,所以 .
身高在 以上的学生人数为 (人 .
(2) , , 三组的人数分别为30人,20人,10人.
因此应该从 , , 三组中每组各抽取 (人 , (人 , (人 .
设 组的3位同学为 , , , 组的2位同学为 , , 组的1位同学为 ,则从6名学生中
抽取2人有15种可能:
, , , , , . , , , , , , , , , ,
, , , , , , , , , , , , , .
其中 组的2位学生至少有1人被抽中有9种可能: , , , , , , , ,
, , , , , , , , , .
所以 组中至少有1人被抽中的概率为 .
【点评】本题主要考查频率分布直方图和分层抽样,属于中档题.
25.(2024•包头模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽
车流量 (单位:辆)和空气中的 的平均浓度 (单位: .调研人员采集了50天的数据,
制作了关于 , ,2,3, , 的散点图,并用直线 与 将散点图分成如图所
示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的 列联表,并判断至少有多大把握认为“ 平均浓度不小于 与“汽车
日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
的平均浓度
33的平均浓度
合计
(2)经计算得回归方程为 ,且这50天的汽车日流量 的标准差 , 的平均
浓度 的标准差 .
①求相关系数 ,并判断该回归方程是否有价值;
②若这50天的汽车日流量 满足 ,试推算这50天的 日均浓度 的平均数 .(精确
到
参考公式: ,其中 .
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程 ,其中 .
相关系数 .若 ,则认为 与 有较强的线性相关性.
【答案】(1)列联表见解析,至少有 的把握;
(2)①0.84,有价值;② .
【考点】独立性检验;经验回归方程与经验回归直线
34【专题】转化思想;数学运算;转化法;概率与统计
【分析】(1)根据题意,完成 列联表,再计算 ,结合表格即可求得结果.
(2)代入 公式计算可判断 与 的相关性强弱,由 可得 ,结合回归直线必过样本中心可求得
的值.
【解答】解:(1) 列联表如下:
汽车日流量 汽车日流量 合计
16 8 24
的平均浓度
6 20 26
的平均浓度
合计 22 28 50
零假设 :“ 平均浓度不小于 ”与“汽车日流量不小于1500辆”无关,
因为 ,
所以至少有 的把握(但还不能有 的把握)认为“ 平均浓度不小于 ”与“汽车
日流量不小于1500辆有关”.
(2)①因为回归方程为 ,
所以 ,
又因为 , ,
所以 .
, 与 有较强的相关性,
35该回归方程有价值.
② ,解得
而样本中心点 位于回归直线 上,
因此可推算 .
【点评】本题主要考查线性回归方程的应用,以及独立性检验公式,属于中档题.
36考点卡片
1.互斥事件与对立事件
【知识点的认识】
1.互斥事件
(1)定义:一次试验中,事件A和事件B不能同时发生,则这两个不能同时发生的事件叫做互斥事件.
如果A ,A ,…,A 中任何两个都不可能同时发生,那么就说事件A ,A ,…A 彼此互斥.
1 2 n 1 2 n
(2)互斥事件的概率公式:
在一个随机试验中,如果随机事件A和B是互斥事件,则有:
P(A+B)=P(A)+P(B)
注:上式使用前提是事件A与B互斥.
推广:一般地,如果事件A ,A ,…,A 彼此互斥,那么事件发生(即A ,A ,…,A 中有一个发生)
1 2 n 1 2 n
的概率等于这n个事件分别发生的概率之和,即:
P(A +A +…+A )=P(A )+P(A )+…+P(A )
1 2 n 1 2 n
2.对立事件
(1)定义:一次试验中,两个事件中必有一个发生的互斥事件叫做对立事件,事件A的对立事件记做 .
注:①两个对立事件必是互斥事件,但两个互斥事件不一定是对立事件;
②在一次试验中,事件A与 只发生其中之一,并且必然发生其中之一.
(2)对立事件的概率公式:
P( )=1﹣P(A)
373.互斥事件与对立事件的区别和联系
互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一
必须有一个发生.因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件,即“互斥”是
“对立”的必要但不充分条件,而“对立”则是“互斥”的充分但不必要条件.
【命题方向】
1.考查对知识点概念的掌握
例1:从装有2个红球和2个黑球的口袋内任取2个球,那么互斥而不对立的两个事件是( )
A.“至少有一个红球”与“都是黑球”
B.“至少有一个黑球”与“都是黑球”
C.“至少有一个黑球”与“至少有1个红球”
D.“恰有1个黑球”与“恰有2个黑球”
分析:列举每个事件所包含的基本事件,结合互斥事件和对立事件的定义,依次验证即可
解答:对于A:事件:“至少有一个红球”与事件:“都是黑球”,这两个事件是对立事件,∴A不正确
对于B:事件:“至少有一个黑球”与事件:“都是黑球”可以同时发生,如:一个红球一个黑球,∴B
不正确
对于C:事件:“至少有一个黑球”与事件:“至少有1个红球”可以同时发生,如:一个红球一个黑球,
∴C不正确
对于D:事件:“恰有一个黑球”与“恰有2个黑球”不能同时发生,∴这两个事件是互斥事件,
又由从装有2个红球和2个黑球的口袋内任取2个球,
得到所有事件为“恰有1个黑球”与“恰有2个黑球”以及“恰有2个红球”三种情况,故这两个事件是
不是对立事件,
∴D正确
故选D
点评:本题考查互斥事件与对立事件.首先要求理解互斥事件和对立事件的定义,理解互斥事件与对立
事件的联系与区别.同时要能够准确列举某一事件所包含的基本事件.属简单题.
例2:下列说法正确的是( )
A.互斥事件一定是对立事件,对立事件不一定是互斥事件
B.互斥事件不一定是对立事件,对立事件一定是互斥事件
C.事件A,B中至少有一个发生的概率一定比A,B中恰有一个发生的概率大
D.事件A,B同时发生的概率一定比A,B中恰有一个发生的概率小.
分析:根据对立事件和互斥事件的概率,得到对立事件一定是互斥事件,两个事件是互斥事件不一定是
对立事件,这两者之间的关系是一个包含关系.
解答:根据对立事件和互斥事件的概念,
38得到对立事件一定是互斥事件,
两个事件是互斥事件不一定是对立事件,
故选B.
点评:本题考查互斥事件与对立事件之间的关系,这是一个概念辨析问题,这种题目不用运算,只要理
解两个事件之间的关系就可以选出正确答案.
2.互斥事件概率公式的应用
例:甲乙两人下棋比赛,两人下成和棋的概率是 ,乙获胜的概率是 ,则乙不输的概率是
分析:记“两人下成和棋”为事件A,“乙获胜”为事件B,则A,B互斥,且 , ,
则乙不输即为事件A+B,由互斥事件的概率公式可得,P(A+B)=P(A)+P(B)可求.
解答:甲乙两人下棋比赛,记“两人下成和棋”为事件A,“乙获胜”为事件B,则A,B互斥,
则 , ,
则乙不输即为事件A+B,
由互斥事件的概率公式可得,P(A+B)=P(A)+P(B)=
故答案为:
点评:本题主要考查互斥事件的关系,不可能同时发生的两个事件叫做互斥事件,也叫互不相容事件,
考查了互斥事件的概率的加法公式在概率计算中的应用.
3.对立事件概率公式的应用
例:若事件A与B是互为对立事件,且P(A)=0.4,则P(B)=( )
A.0 B.0.4 C.0.6 D.1
分析:根据对立事件的概率公式p( )=1﹣P(A),解得即可.
解答:因为对立事件的概率公式p( )=1﹣P(A)=0.6,
故选C.
点评:本题主要考查对立事件的定义,属于基础题.
2.求解条件概率
【知识点的认识】
﹣条件概率:在事件B发生的条件下事件A发生的概率,记作P(A|B).
﹣计算: 其中P(B)>0.
39【解题方法点拨】
﹣计算条件概率时,确定事件B的发生对事件A的影响,通过交事件的概率和条件事件的概率进行计算.
【命题方向】
﹣主要考察条件概率的计算及其应用问题.
3.正态分布曲线的特点及曲线所表示的意义
【知识点的认识】
1.正态曲线及性质
(1)正态曲线的定义
函数 , (x)= ,x (﹣∞,+∞),其中实数 和σ(σ>0)为参数,我们
σ
称 φ,μ σ(x)的图象(如图)为正态分布密度曲∈线,简称正态曲线. μ
(φ2μ)正态曲线的解析式
①指数的自变量是x定义域是R,即x (﹣∞,+∞).
②解析式中含有两个常数: 和e,这∈是两个无理数.
③解析式中含有两个参数:π和σ,其中 可取任意实数,σ>0这是正态分布的两个特征数.
μ μ
④解析式前面有一个系数为 ,后面是一个以 e 为底数的指数函数的形式,幂指数为﹣
.
2.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)= ,σ(x)dx,则称X的分布为
μ
正态分布,记作N( ,σ2). φ
(2)正态总体在三μ个特殊区间内取值的概率值
①P( ﹣σ<X≤ +σ)=0.6826;
②P(μ﹣2σ<X≤μ +2σ)=0.9544;
μ μ
40③P( ﹣3σ<X≤ +3σ)=0.9974.
3.正态μ曲线的性质μ
正态曲线 , (x)= ,x R有以下性质:
σ
(1)曲线φ位μ于x轴上方,与x轴不相交;
∈
(2)曲线是单峰的,它关于直线x= 对称;
μ
(3)曲线在x= 处达到峰值 ;
(4)曲线与xμ 轴围成的图形的面积为1;
(5)当σ一定时,曲线随着 的变化而沿x轴平移;
(6)当 一定时,曲线的形μ状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲
线越“μ矮胖”,表示总体的分布越分散.
4.三个邻域
会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小
概率事件,这也是对产品进行质量检测的理论依据.
【解题方法点拨】
正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高
考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下
手或计算错误.对正态分布N( ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第
二个数值应该为σ2而不是σ,同μ时,记住正态密度曲线的六条性质.
【命题方向】
题型一:概率密度曲线基础考察
典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)= ,则这
个正态总体的平均数与标准差分别是( )
A.10与8 B.10与2 C.8与10 D.2与10
解析:由 = ,可知σ=2, =10.
答案:B. μ
41典例2:已知随机变量 服从正态分布N(2,σ2),且P( <4)=0.8,则P(0< <2)等于( )
A.0.6 B.0.4ξ C.0.3 D.0.2 ξ ξ
解析:由P( <4)=0.8知P( >4)=P( <0)=0.2,
故P(0< <ξ2)=0.3.故选Cξ. ξ
ξ
典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.682 6,则P(X>4)等于(
)
A.0.158 8 B.0.158 7 C.0.158 6 D.0.158 5
解析 由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣ P(2≤X≤4)=0.5﹣
×0.682 6=0.1587.故选B.
题型二:正态曲线的性质
典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为 .
(1)求该正态分布的概率密度函数的解析式;
(2)求正态总体在(﹣4,4]的概率.
分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数 ,σ的值,其中
决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关. μ μ
解 (1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于 y轴对称,即 =0.由
μ
= ,得σ=4,故该正态分布的概率密度函数的解析式是
,σ(x)= ,x (﹣∞,+∞).
μ
φ ∈
(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)
=P( ﹣σ<X≤ +σ)=0.6826.
点评μ:解决此类μ问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变
化对曲线的影响.
典例2:设两个正态分布N( , )(σ >0)和N( , )(σ >0)的密度函数图象如图所示,
1 1 2 2
μ μ
42则有( )
A. < ,σ <σ
1 2 1 2
B.μ
1
<μ
2
,σ
1
>σ
2
C.μ
1
>μ
2
,σ
1
<σ
2
D.μ
1
>μ
2
,σ
1
>σ
2
解μ析:μ根据正态分布N( ,σ2)函数的性质:正态分布曲线是一条关于直线x= 对称,在x= 处取得
最大值的连续钟形曲线;μσ越大,曲线的最高点越低且较平缓;反过来,σ越小μ,曲线的最高点μ越高且较
陡峭,故选A.
答案:A.
题型三:服从正态分布的概率计算
典例1:设X~N(1,22),试求
(1)P(﹣1<X≤3);
(2)P(3<X≤5);
(3)P(X≥5).
分析:将所求概率转化到( ﹣σ, +σ].( ﹣2σ, +2σ]或[ ﹣3σ, +3σ]上的概率,并利用正态密度曲
线的对称性求解. μ μ μ μ μ μ
解析:∵X~N(1,22),∴ =1,σ=2.
(1)P(﹣1<X≤3)=P(μ1﹣2<X≤1+2)
=P( ﹣σ<X≤ +σ)=0.682 6.
(2)μ∵P(3<μX≤5)=P(﹣3<X≤﹣1),
∴P(3<X≤5)= [P(﹣3<X≤5)﹣P(﹣1<X≤3)]
= [P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2)]
= [P( ﹣2σ<X≤ +2σ)﹣P( ﹣σ<X≤ +σ)]
μ μ μ μ
= ×(0.954 4﹣0.682 6)
=0.1359.
43(3)∵P(X≥5)=P(X≤﹣3),
∴P(X≥5)= [1﹣P(﹣3<X≤5)]
= [1﹣P(1﹣4<X≤1+4)]
= [1﹣P( ﹣2σ<X≤ +2σ)]
μ μ
= ×(1﹣0.954 4)=0.0228.
求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知
概率的三个区间上.
典例2:随机变量 服从正态分布N(1,σ2),已知P( <0)=0.3,则P( <2)= .
解析:由题意可ξ知,正态分布的图象关于直线x=1对称ξ,所以P( >2)=ξP( <0)=0.3,P( <2)
=1﹣0.3=0.7. ξ ξ ξ
答案:0.7.
题型4:正态分布的应用
典例1:2011年中国汽车销售量达到1 700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽
车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了 1
200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量 服从正态分布N
(8,σ2),已知耗油量 [7,9]的概率为0.7,那么耗油量大于9升的汽车大约有 ξ辆.
解析:由题意可知 ~ξN(∈8,σ2),故正态分布曲线以 =8为对称轴,又因为P(7≤ ≤9)=0.7,故P
(7≤ ≤9)=2Pξ(8≤ ≤9)=0.7,所以P(8≤ ≤μ9)=0.35,而P( ≥8)=0.5,ξ所以P( >9)=
0.15ξ,故耗油量大于9ξ升的汽车大约有1 200×0.1ξ5=180辆. ξ ξ
点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x轴之间的曲边梯
形的面积,根据正态密度曲线的对称性,当P( >x )=P( <x )时必然有 = ,这是解决正态
1 2
ξ ξ μ
分布类试题的一个重要结论.
典例2:工厂制造的某机械零件尺寸X服从正态分布N(4, ),问在一次正常的试验中,取1 000个
零件时,不属于区间(3,5]这个尺寸范围的零件大约有多少个?
44解∵X~N(4, ),∴ =4,σ= .
∴不属于区间(3,5]的μ概率为
P(X≤3)+P(X>5)=1﹣P(3<X≤5)
=1﹣P(4﹣1<X≤4+1)
=1﹣P( ﹣3σ<X≤ +3σ)
=1﹣0.9μ974=0.002μ6≈0.003,
∴1 000×0.003=3(个),
即不属于区间(3,5]这个尺寸范围的零件大约有3个.
4.抽签法简单随机抽样及其步骤
【知识点的认识】
﹣抽签法:将每个个体标记,随机抽取一定数量的标记来选择样本.
【解题方法点拨】
﹣步骤包括列出所有个体、编号、随机抽取标记.
【命题方向】
﹣主要考察随机抽样的操作步骤和方法.
5.补全频率分布直方图
【知识点的认识】
﹣补全:解决直方图中图形或数据缺失的问题.
【解题方法点拨】
﹣补全:通过对频率分布表的检查,找出并填补直方图中的缺失部分.
【命题方向】
﹣常见于直方图的制作和数据补全问题中.
6.频率分布直方图的应用
【知识点的认识】
﹣应用:用于数据的分布可视化,帮助分析数据集中趋势、离散程度等.
【解题方法点拨】
﹣分析:通过直方图观察数据的分布特征,识别数据的集中区域和离散程度.
45【命题方向】
﹣重点考察如何解读频率分布直方图及其对数据分析的贡献.
7.茎叶图
【知识点的认识】
1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.
例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,
44,49,50
得分表示成茎叶图如下:
2.茎叶图的优缺点:
优点:
(1)所有信息都可以从茎叶图上得到
(2)茎叶图便于记录和表示
缺点:
分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.
【解题方法点拨】
茎叶图的制作步骤:
(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分
(2)将最小的茎和最大的茎之间的数按小大次序排成一列
(3)将各个数据的叶按大小次序写在茎右(左)侧
第1步中,
①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.
②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:23.
对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.
8.用样本估计总体的集中趋势参数
【知识点的认识】
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均
数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
46(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均
数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即 .
2.众数、中位数、平均数的优缺点
【解题方法点拨】
众数、中位数、平均数的选取:
(1)平均数能较好地反映一组数据的总体情况;
(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);
(3)众数能反映一组数据的集中情况(即多数水平).
根据频率分布直方图估算众数、中位数、平均数:
(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.
(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小
矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.
9.用样本估计总体的离散程度参数
【知识点的认识】
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中
各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映
这组数据波动的大小,方差越大,数据的波动越大.
47【解题方法点拨】
例:求数据98,100,101,102,99的极差,方差,标准差.
解:极差是:102﹣98=4;
平均数 = (98+100+101+102+99)=100,
则方差是:S2= [(98﹣100)2+(100﹣100)2+(101﹣100)2+(102﹣100)2+(99﹣100)2]=2;
标准差S= .
可以看出这类题考查的基本上是对概念的理解,根据概念去解题就可以了.
【命题方向】
这个考点很重要,也很容易,所以大家都应该好好的看看概念,理解方差的含义和怎么求就可以了.
10.百分位数
【知识点的认识】
百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p (0,1),总体的p分位数有这样
的特点,总体数据中的任意一个数小于或等于它的可能性是p. ∈
四分位数:25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百
分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是 .因此这三个百分位数也称为总体
的四分位数.
【解题方法点拨】
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,
且至少有(100﹣p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数步骤如下:
①按从小到大排列原始数据;
②计算i=n×p%;
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数
为第i项与第(i+1)项数据的平均数.
【命题方向】
理解连续变量的百分位数的统计含义,考察百分位数的计算,学会用样本估计总体的百分位数.
11.样本相关系数
【知识点的认识】
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的
程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相
48关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,
通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相
关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平
方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程: = x+ );
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方
程不是形如: = x+ 时,我们称之为非线性回归方程.
12.经验回归方程与经验回归直线
【知识点的认识】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计
分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线
性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表
示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和
自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设
随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认
49为关于的回归函数的类型为线性函数.
【解题方法点拨】
例:对于线性回归方程 ,则 =
解: ,因为回归直线必过样本中心( ),
所以 .
故答案为:58.5.
方法就是根据线性回归直线必过样本中心( ),求出 ,代入即可求 .这里面可以看出线性规划
这类题解题方法比较套路化,需要熟记公式.
【命题方向】
这类题记住公式就可以了,也是高考中一个比较重要的点.
13.回归分析
【知识点的认识】
1、回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,
这条直线叫作回归直线.记为: = x+ .求回归直线方程的一般步骤:
①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系;
②求回归系数;
③写出回归直线方程,并利用回归直线方程进行预测说明.
2、回归分析:
对具有相关关系的两个变量进行统计分析的一种常用方法.
建立回归模型的基本步骤是:
①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系).
③由经验确定回归方程的类型.
④按一定规则估计回归方程中的参数 (最小二乘法);
⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,模型是否合适等.
14.独立性检验
【知识点的认识】
501、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这
种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X
和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2 (0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤∈:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k 比较,得出事件有关的可能性大小.
0
声明:试题解析著作权属菁优网所有,未经书面同意,不得复制发布日期:2024/11/4 19:00:11;用户:组卷36;邮箱:zyb036@xyh.com;学号:41418999
51