文档内容
2025年菁优高考数学压轴训练23
一.选择题(共10小题)
1.(2024•射洪市校级三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员
年龄分布饼状图(图 、“90后”从事快递行业岗位分布条形图(图 ,则下列结论中错误的是
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
2.(2024•四川模拟)甲、乙两人进行了10轮的投篮练习,每轮各投10个,现将两人每轮投中的个数制
成如图所示折线图.下列说法正确的是
A.甲投中个数的平均数比乙投中个数的平均数小
B.甲投中个数的中位数比乙投中个数的中位数小
C.甲投中个数的标准差比乙投中个数的标准差小
D.甲投中个数的极差比乙投中个数的极差大
3.(2024•福建一模)已知变量 和 的统计数据如表:
11 2 3 4 5
6 6 7 8 8
根据上表可得回归直线方程 ,据此可以预测当 时,
A.8.5 B.9 C.9.5 D.10
4.(2024•临汾模拟)人生因阅读而气象万千,人生因阅读而精彩纷呈.腹有诗书气自华,读书有益于
开拓眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.对某校高中
学生的读书情况进行了调查,结果如下:
喜欢读书 不喜欢读书 合计
男生 260 60 320
女生 200
合计 460
附: ,其中 .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
根据小概率值 的独立性检验,推断是否喜欢阅读与性别有关,则 的值可以为
A.10 B.20 C.30 D.40
5.(2024•成都模拟)如图,由观测数据 , ,2,3,4,5, 的散点图可知, 与 的关系可
以用模型 拟合,设 ,利用最小二乘法求得 关于 的回归方程 .已知
, ,则
A. B. C.1 D.
26.(2024•锦江区校级模拟)第一组样本点为 , , , ,
第二组样本点为 , , , ,
第一组变量的线性相关系数为 ,第一组变量的线性相关系数为 ,则
A. B. C. D.
7.(2024•遂宁模拟)某公司研发新产品投入 (单位:百万)与该产品的收益 (单位:百万)的5组
统计数据如下表所示:由表中数据求得投入金额 与收益 满足经验回归方程 ,则下列结论不
正确的是
5 6 8 9 12
16 20 25 28 36
A. 与 有正相关关系 B.回归直线经过点
C. D. 时,残差为0.2
8.(2024•重庆模拟)假设变量 与变量 的 对观测数据为 , , , , , , ,两
个变量满足一元线性回归模型 .要利用成对样本数据求参数 的最小二乘估计 ,即
求使 取最小值时的 的值,则
A.
B.
3C.
D.
9.(2024•赤峰模拟)下列说法中,正确命题的个数为
①已知随机变量 服从二项分布 ,若 ,则 .
②对具有线性相关关系的变量 , ,其线性回归方程为 ,若样本点的中心为 ,则实
数 的值是 .
③以模型 去拟合一组数据时,为了求出回归方程,设 ,求得线性回归方程为 ,
则 , 的值分别是 和0.3.
④若样本数据 , , 的方差为2,则数据 , , , 的方差为16.
A.0个 B.1个 C.2个 D.3个
10.(2024•长沙模拟)设集合 ,2,3, , ,现对 的任意一非空子集 ,令 表示
中最大数与最小数之和,则所有这样的 的算术平均数为
A.501 B.500 C.1002 D.1001
二.多选题(共5小题)
11.(2024•鼓楼区校级模拟)下列说法中,正确的是
A.一组数据5,8,8,9,12,13,15,16,20,22的第80百分位数为18
B.若随机变量 ,且 ,则
C.袋中装有除颜色外完全相同的4个红球和2个白球,从袋中不放回地依次抽取2个球,记事件
4第一次抽到的是白球,事件 第二次抽到的是白球,则
D.设随机事件 , ,已知 (A) , , ,则 (B)
12.(2024•青秀区校级二模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了
100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算
得到这100名学生中,成绩位于 , 内的学生成绩方差为12,成绩位于 , 内的同学成绩方
差为10.则
参考公式:样本划分为2层,各层的容量、平均数和方差分别为: .记样本平均数为 ,
样本方差为 ,
A.
B.估计该年级学生成绩的中位数为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
13.(2024•山西模拟)某市举办了“爱国爱党”知识竞赛.把1000名参赛者的成绩(满分100分,成绩
取整数)按 , , , , , , , 分成四组,并整理成如图所示的频率分布直方
图,则下列说法错误的为
5A. 的值为0.035
B.估计这组数据的众数为90
C.估计这组数据的第70百分位数为89
D.估计成绩低于80分的有350人
14.(2024•海州区校级模拟)在某次学科期末检测后,从全部考生中选取100名考生的成绩(百分制,
均为整数)分成 , , , , , , , , , 五组后,得到如图的频率分
布直方图,则
A.图中 的值为0.005
B.低于70分的考生人数约为40人
C.考生成绩的平均分约为73分
D.估计考生成绩第80百分位数为83分
15.(2024•历城区校级模拟)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了
100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算
得到这100名学生中,成绩位于 , 内的学生成绩方差为12,成绩位于 , 内的同学成绩方
差为10.则
6A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
三.填空题(共5小题)
16.(2024•岳麓区校级模拟)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样
本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是 ,缴获的该月生产
的 辆坦克编号从小到大为 , , , ,即最大编号为 ,且缴获的坦克是从所生产的坦克中随机
获取的,因为生产坦克是连续编号的,所以缴获坦克的编号 , , , ,相当于从 , 中随机
抽取的 个整数,这 个数将区间 , 分成 个小区间,
由于 是未知的,除了最右边的区间外,其他 个区间都是已知的.由于这 个数是随机抽取的,所以可
以用前 个区间的平均长度 估计所有 个区间的平均长度 ,进而得到 的估计值.
例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为
.
17.(2024•大理州二模)已知某种商品的广告费支出 (单位:万元)与销售额 (单位:万元)之间
有如下表对应数据:
1 3 4 5 7
15 20 30 40 45
根据表中数据得到 关于 的经验回归方程为 ,则当 时,残差为 .(残差 观测值
7预测值)
18.(2024•江苏模拟)寰宇巨星知更鸟的新专辑《空气蛹》发布在某平台后,其一周内的累计播放量如
表所示,其中, ,2,3,4,5,6, 为该专辑发布后截至第 天的累计播放量.若将表中数据用
经验回归方程 进行拟合,则 .(结果保留3位小数)
天 1 2 3 4 5 6 7
万次 120 240 340 510 760 1200 1730
参考数据及公式,在回归直线 中, , ,对于表中
的数据已知 , .
19.(2024•黄浦区校级三模)已知 , 是两个具有线性相关的两个变量,其取值如下表:
1 2 3 4 5
4 9 11
其回归方程为 ,则 .
20.(2024•吕梁一模)某市2018年至2022年新能源汽车年销量 (单位:百台)与年份代号 的数据
如下表:
年份 2018 2019 2020 2021 2022
年份代号 0 1 2 3 4
年销量 10 15 20 30 35
若根据表中的数据用最小二乘法求得 关于 的回归直线方程为 ,据此计算相应于样本点
的残差为 .
四.解答题(共5小题)
21.(2024•静安区二模)某高中随机抽取100名学生,测得他们的身高(单位: ,按照区间 ,
, , , , , , , , 分组,得到样本身高的频率分布直方图(如
8图所示).
(1)求身高不低于 的学生人数;
(2)将身高在 , , , , , 区间内的学生依次记为 , , 三个组,用分层
抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求 组中至少有1人被抽中的概率.
22.(2024•包头模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽
车流量 (单位:辆)和空气中的 的平均浓度 (单位: .调研人员采集了50天的数据,
制作了关于 , ,2,3, , 的散点图,并用直线 与 将散点图分成如图所
示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的 列联表,并判断至少有多大把握认为“ 平均浓度不小于 与“汽车
日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为 ,且这50天的汽车日流量 的标准差 , 的平均
9浓度 的标准差 .
①求相关系数 ,并判断该回归方程是否有价值;
②若这50天的汽车日流量 满足 ,试推算这50天的 日均浓度 的平均数 .(精确
到
参考公式: ,其中 .
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程 ,其中 .
相关系数 .若 ,则认为 与 有较强的线性相关性.
23.(2024•长春模拟)入冬以来,东北成为全国旅游话题的“顶流”.南方游客纷纷北上,体验东北最
美的冬天.某景区为给顾客更好的体验,推出了 和 两个套餐服务,并在购票平台上推出了优惠券活
动,顾客可自由选择 和 两个套餐之一,下表是该景区在购票平台10天销售优惠券情况.
日期 1 2 3 4 5 6 7 8 9 10
销售量 (千 1.9 1.98 2.2 2.36 2.43 2.59 2.68 2.76 2.7 0.4
张)
经计算可得: , , .
(1)由于同时在线人数过多,购票平台在第10天出现网络拥堵,导致当天顾客购买的优惠券数量大幅
10减少,现剔除第10天数据,求 关于 的回归方程(精确到 ,并估计第10天的正常销量;
(2)假设每位顾客选择 套餐的概率为 ,选择 套餐的概率为 ,其中 套餐包含一张优惠券, 套
餐包含两张优惠券,截止某一时刻,该平台恰好销售了 张优惠券,设其概率为 ,求 ;
(3)记(2)中所得概率 的值构成数列 .
①求数列 的最值;
②数列收敛的定义:已知数列 ,若对于任意给定的正数 ,总存在正整数 ,使得当 时,
, 是一个确定的实数),则称数列 收敛于 .根据数列收敛的定义证明数列 收敛.
回归方程 中斜率和截距的最小二乘估计公式分别为:
, .
24.(2024•阳江模拟)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了 500名高中
学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成
, , , , , , , , , , , , , , , , , 九组,绘
制成如图所示的频率分布直方图.
(1)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在 , , ,
, , 三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参
加公益劳动时间在 , 内的学生人数为 ,求 的分布列和期望;
(2)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“ ”表示这20
名学生中恰有 名学生参加公益劳动时间在 , (单位:小时)内的概率,其中 ,1,2, ,
1120.当 最大时,写出 的值.
25.(2024•高碑店市校级模拟)甲、乙两人在相同条件下各射击10次,每次命中的环数如表:
甲 8 6 7 8 6 5 9 10 4 7
乙 6 7 7 8 6 7 8 7 9 5
(1)分别计算以上两组数据的平均数;
(2)分别计算以上两组数据的方差;
(3)根据计算的结果,对甲乙两人的射击成绩作出评价.
122025年菁优高考数学压轴训练23
参考答案与试题解析
一.选择题(共10小题)
1.(2024•射洪市校级三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员
年龄分布饼状图(图 、“90后”从事快递行业岗位分布条形图(图 ,则下列结论中错误的是
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
【答案】
【考点】统计图表获取信息
【专题】数形结合;数形结合法;概率与统计;数学运算
【分析】利用快递行业从业人员年龄分布饼状图、“90后”从事快递行业岗位分布条形图,分析数据能
求出结果.
【解答】解:由快递行业从业人员年龄分布饼状图、“90后”从事快递行业岗位分布条形图得:
由题图可知,快递行业从业人员中,“90后”占总人数的 ,超过一半,故 正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为 ,超
过 ,
快递行业从业人员中,从事技术岗位的“90”后的人数超过总人数的 , 正确;
快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为 ,
超过“80前”的人数占总人数的百分比,故 正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为 ,
小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的比未知,故
13错误.
故选: .
【点评】本题考查饼状图、条形图等基础知识,考查运算求解能力,是基础题.
2.(2024•四川模拟)甲、乙两人进行了10轮的投篮练习,每轮各投10个,现将两人每轮投中的个数制
成如图所示折线图.下列说法正确的是
A.甲投中个数的平均数比乙投中个数的平均数小
B.甲投中个数的中位数比乙投中个数的中位数小
C.甲投中个数的标准差比乙投中个数的标准差小
D.甲投中个数的极差比乙投中个数的极差大
【答案】
【考点】用样本估计总体的集中趋势参数;用样本估计总体的离散程度参数;统计图表获取信息;频率
分布折线图、密度曲线
【专题】概率与统计;数学运算;转化思想;综合法
【分析】 .利用平均数公式求解判断; .利用中位数定义求解判断; .根据折线图的波动判断;
.利用极差的定义求解判断.
【解答】解:甲的数据:8,10,9,6,7,9,6,9,10,8,乙的数据:9,5,10,5,3,6,4,3,
6,10,
.甲投中个数的平均数为 ,
乙投中个数的平均数为 ,故错误;
.甲的数据从小到大排序为:6,6,7,8,8,9,9,9,10,10,则中位数为 ,
乙的数据从小到大排序为:3,3,4,5,5,6,6,9,10,10,则中位数为 ,故错误;
.由折线图知:甲的波动相对乙的波动较小,所以甲投中个数的标准差比乙投中个数的标准差小,故
14正确;
.甲投中个数的极差为 ,乙投中个数的极差为: ,故错误.
故选: .
【点评】本题考查折线图的应用,平均数与中位数的概念,极差的定义,属中档题.
3.(2024•福建一模)已知变量 和 的统计数据如表:
1 2 3 4 5
6 6 7 8 8
根据上表可得回归直线方程 ,据此可以预测当 时,
A.8.5 B.9 C.9.5 D.10
【答案】
【考点】经验回归方程与经验回归直线
【分析】由已知求得样本点的中心的坐标,代入线性回归方程求解 ,再取 得答案.
【解答】解: , ,
则样本点的中心为 ,代入 ,
得 , ,
,
取 时,预测 .
故选: .
【点评】本题考查线性回归方程及其应用,考查运算求解能力,是基础题.
4.(2024•临汾模拟)人生因阅读而气象万千,人生因阅读而精彩纷呈.腹有诗书气自华,读书有益于
开拓眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.对某校高中
学生的读书情况进行了调查,结果如下:
喜欢读书 不喜欢读书 合计
男生 260 60 320
女生 200
合计 460
附: ,其中 .
0.1 0.05 0.01 0.005 0.001
152.706 3.841 6.635 7.879 10.828
根据小概率值 的独立性检验,推断是否喜欢阅读与性别有关,则 的值可以为
A.10 B.20 C.30 D.40
【答案】
【考点】独立性检验
【专题】综合法;计算题;数学运算;转化思想;概率与统计
【分析】代入公式计算相关指数 的观测值,可得 ,再代入选项一一判断即可.
【解答】解:根据小概率值 的独立性检验,推断是否喜欢阅读与性别有关,可得 ,
根 据 列 联 表 中 各 数 据 之 间 的 关 系 得 :
,
即 ,
将 ,20,30,40,分别代入验证,可得只有 成立,
故 的可能性为10.
故选: .
【点评】本题考查了独立性检验的思想方法,是中档题.
5.(2024•成都模拟)如图,由观测数据 , ,2,3,4,5, 的散点图可知, 与 的关系可
以用模型 拟合,设 ,利用最小二乘法求得 关于 的回归方程 .已知
, ,则
16A. B. C.1 D.
【答案】
【考点】经验回归方程与经验回归直线
【专题】转化法;数学运算;概率与统计;转化思想
【分析】结合对数的运算性质,以及线性回归方程的性质,即可求解.
【解答】解: ,
则 ,
则 ,
,
则 ,
关于 的回归方程 ,
则 ,解得 .
故选: .
【点评】本题专考查线性回归方程的应用,属于中档题.
6.(2024•锦江区校级模拟)第一组样本点为 , , , ,
第二组样本点为 , , , ,
第一组变量的线性相关系数为 ,第一组变量的线性相关系数为 ,则
A. B. C. D.
【答案】
【考点】样本相关系数
【专题】计算题;概率与统计
【分析】根据题意,由所给的样本点坐标分析可得 以及 ,比较即可得答案.
17【解答】解:根据题意,第一组样本点为 , , , ,
可得:两个变量之间的正相关,因此 ;
第二组样本点为 , , , ,
可得:两个变量之间的负相关,因此 ;
则有 ;
故选: .
【点评】本题考查变量之间的线性相关系数,注意 与变量间相关性的关系.
7.(2024•遂宁模拟)某公司研发新产品投入 (单位:百万)与该产品的收益 (单位:百万)的5组
统计数据如下表所示:由表中数据求得投入金额 与收益 满足经验回归方程 ,则下列结论不
正确的是
5 6 8 9 12
16 20 25 28 36
A. 与 有正相关关系 B.回归直线经过点
C. D. 时,残差为0.2
【答案】
【考点】经验回归方程与经验回归直线
【专题】整体思想;综合题;综合法;数学运算;概率与统计
【分析】根据 和 的变化规律,即可判断 ;计算 ,即可判断 ;将样本点中心代入回归直线方
程,即可求 ,即可判断 ;根据回归直线方程计算 时的 ,计算 ,即可判断 .
【解答】解:对于 ,由表格可知, 越大, 越大,所以 与 有正相关关系,故 正确;
对于 , , ,
则样本点中心为 ,所以经验回归直线经过点 ,故 正确;
18对于 ,将样本点中心代入直线方程,得 ,所以 ,故 错误;
对于 , ,当 时, ,
则残差为 ,故 正确.
故选: .
【点评】本题主要考查线性回归,属于中档题.
8.(2024•重庆模拟)假设变量 与变量 的 对观测数据为 , , , , , , ,两
个变量满足一元线性回归模型 .要利用成对样本数据求参数 的最小二乘估计 ,即
求使 取最小值时的 的值,则
A.
B.
C.
D.
【答案】
【考点】经验回归方程与经验回归直线
【专题】综合法;对应思想;数学运算;概率与统计
【分析】化简为二次函数形式,根据二次函数性质得到最值.
19【解答】解:因为
,
上式是关于 的二次函数,
因此要使 取得最小值,
当且仅当 的取值为 .
故选: .
【点评】本题考查最小二乘估计,属于中档题.
9.(2024•赤峰模拟)下列说法中,正确命题的个数为
①已知随机变量 服从二项分布 ,若 ,则 .
②对具有线性相关关系的变量 , ,其线性回归方程为 ,若样本点的中心为 ,则实
数 的值是 .
③以模型 去拟合一组数据时,为了求出回归方程,设 ,求得线性回归方程为 ,
则 , 的值分别是 和0.3.
④若样本数据 , , 的方差为2,则数据 , , , 的方差为16.
A.0个 B.1个 C.2个 D.3个
【答案】
【考点】 重伯努利试验与二项分布;经验回归方程与经验回归直线
【专题】概率与统计;数学运算;综合法;整体思想
【分析】利用二项分布的期望公式可判断①,利用线性回归方程一定过样本点中心可判断②,对
两边取对数可判断③,利用方差的性质可判断④.
【解答】解:对于①, ,
20,
,解得 ,故①正确;
对于②, 线性回归方程 一定过样本点中心 ,
,
解得 ,故②正确;
对于③, 设 ,求得线性回归方程为 ,
,
又 ,
, ,
,故③正确;
对于④,若样本数据 , , 的方差为2,
则数据 , , , 的方差为 ,故④错误,
综上所述,正确命题的个数为3个.
故选: .
【点评】本题主要考查了二项分布的期望公式,考查了线性回归方程的性质,以及方差的性质,属于中
档题.
10.(2024•长沙模拟)设集合 ,2,3, , ,现对 的任意一非空子集 ,令 表示
中最大数与最小数之和,则所有这样的 的算术平均数为
A.501 B.500 C.1002 D.1001
【答案】
【考点】子集与真子集;用样本估计总体的集中趋势参数
【专题】数学运算;综合法;转化思想;计算题;概率与统计;方程思想
【分析】根据题意,由集合子集的定义分2种情况讨论:①满足 ,②满足 ,求
21出 的算术平均数,综合可得答案.
【解答】解:根据题意,集合 ,2,3, , ,设 的非空子集为 , , ,
, , , , ,
对集合 的子集分为两类讨论:
①满足 ,这样的子集 ;
②满足 ,此时可把两个非空集合 , , 与 , , ,
配对,
易知这是两个不同的集合,且都是 的非空子集,
它们的最大数与最小数之和是 ,所以此时非空子集的 的平
均数为1001.
综上, 的所有非空子集的特征数 的平均数为1001.
故选: .
【点评】本题考查算术平均数的计算,涉及集合的子集,属于中档题.
二.多选题(共5小题)
11.(2024•鼓楼区校级模拟)下列说法中,正确的是
A.一组数据5,8,8,9,12,13,15,16,20,22的第80百分位数为18
B.若随机变量 ,且 ,则
C.袋中装有除颜色外完全相同的4个红球和2个白球,从袋中不放回地依次抽取2个球,记事件
第一次抽到的是白球,事件 第二次抽到的是白球,则
D.设随机事件 , ,已知 (A) , , ,则 (B)
【答案】
【考点】正态分布曲线的特点及曲线所表示的意义;求解条件概率;百分位数
【专题】数学运算;转化思想;概率与统计;综合法
【分析】根据百分位数的定义计算即可判断选项 ;根据正态分布的性质计算即可判断选项 ;根据条
22件概率的计算方法求解即可判断选项 ;根据条件概率与对立事件的计算公式计算即可判断选项 .
【解答】解:对于 ,共有10个数, ,
所以数据的第80百分位数为16和20的平均数,即为18,故 正确.
对于 ,因为 ,且 ,
所以 ,
则 ,故 正确.
对于 ,因为 ,
所以 ,则 ,故 错误.
对于 ,因为 (A) , ,
所以 (A) ,
又因为 (A) ,所以 ,
则 ,
所以 ,故 正确.
故选: .
【点评】本题考查百分位数的求解,正态分布的性质,条件概率问题,属中档题.
12.(2024•青秀区校级二模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了
100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算
得到这100名学生中,成绩位于 , 内的学生成绩方差为12,成绩位于 , 内的同学成绩方
差为10.则
参考公式:样本划分为2层,各层的容量、平均数和方差分别为: .记样本平均数为 ,
样本方差为 ,
23A.
B.估计该年级学生成绩的中位数为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
【答案】
【考点】频率分布直方图的应用
【专题】综合法;概率与统计;转化思想;数学运算
【分析】根据直方图中的性质逐项计算即可.
【解答】解: 项, , , 项错误;
项, , 内频率为: ,
, 内频率为: ,
则中位数在 , 内,设中位数为 ,则 ,
则 , 正确;
成绩在80分及以上的同学的成绩的平均数为 分,
方差为 , , 正确.
故选: .
【点评】本题考查频率分布直方图,属于中档题.
13.(2024•山西模拟)某市举办了“爱国爱党”知识竞赛.把1000名参赛者的成绩(满分100分,成绩
取整数)按 , , , , , , , 分成四组,并整理成如图所示的频率分布直方
图,则下列说法错误的为
24A. 的值为0.035
B.估计这组数据的众数为90
C.估计这组数据的第70百分位数为89
D.估计成绩低于80分的有350人
【答案】
【考点】频率分布直方图的应用
【专题】综合法;数学运算;计算题;转化思想;概率与统计
【分析】根据频率分布直方图的性质可判断 ,根据众数,百分位数的定义可以判断 , ,根据频率、
频数的关系判断 .
【解答】解:对于选项 :根据频率分布直方图的性质易知 ,
解得 ,所以选项 错误;
对于选项 :由频率分布直方图可知众数落在 , 区间,用区间中点表示众数即85,所以选项 错
误;
对于选项 :由频率分布直方图可知前两组频率之和为 ,
前三组频率之和为 .
故第70百分位数落在区间 , ,
设第70百分位数为 ,
则 ,解得 ,所以选项 正确;
对于选项 :成绩低于80分的频率为 ,
所以估计成绩低于80分的有 人.故选项 错误.
故选: .
【点评】本题考查了频率分布直方图,众数,百分位数的定义,频率、频数的关系,是基础题.
14.(2024•海州区校级模拟)在某次学科期末检测后,从全部考生中选取100名考生的成绩(百分制,
25均为整数)分成 , , , , , , , , , 五组后,得到如图的频率分
布直方图,则
A.图中 的值为0.005
B.低于70分的考生人数约为40人
C.考生成绩的平均分约为73分
D.估计考生成绩第80百分位数为83分
【答案】
【考点】频率分布直方图的应用
【专题】数形结合法;数形结合;概率与统计;数学运算
【分析】利用频率分布直方图逐项求解.
【解答】解:由频率分布直方图得:
,解得 ,故 正确;
低于70分的考生人数约为 ,故 错误;
考生成绩的平均分约为:
,故 正确;
成绩落在 , 内的频率为 ,
落在 , 内频率为 ,
考生成绩第80百分位数落在 , ,设为 ,
由 ,解得 ,
26考生成绩第80百分位数为82.5分,故 错误.
故选: .
【点评】本题考查频率分布直方图的性质、频率、平均分、百分位数等基础知识,考查运算求解能力,
是基础题.
15.(2024•历城区校级模拟)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了
100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算
得到这100名学生中,成绩位于 , 内的学生成绩方差为12,成绩位于 , 内的同学成绩方
差为10.则
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
【答案】
【考点】频率分布直方图的应用
【专题】概率与统计;数形结合;方程思想;综合法;数学运算
【分析】对于 ,由各组频率之和为1求参数 ;
对于 ,可由频率分布直方图面积与0.5比较,估计中位数所在区间,利用面积关系建立方程求解可得;
对于 ,两组求加权平均数可得;
对于 ,由两组成绩的方差与两组总方差的关系求解即可.
【解答】解:对于 ,在频率分布直方图中,所有直方图的面积之和为1,
则 ,解得 ,故 错误;
对于 ,前两个矩形的面积之和为 ,
27前三个矩形的面积之和为 ,
设该年级学生成绩的中位数为 ,则 , ,
根据中位数的定义得 ,解得 分,
所以估计该年级学生成绩的中位数约为77.14分,故 正确;
对于 ,估计成绩在80分以上的同学的成绩的平均数为:
分,故 正确;
对于 ,估计该年级成绩在80分及以上的学生成绩的方差为:
,故 正确.
故选: .
【点评】本题考查频率分布直方图的应用,属于中档题.
三.填空题(共5小题)
16.(2024•岳麓区校级模拟)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样
本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是 ,缴获的该月生产
的 辆坦克编号从小到大为 , , , ,即最大编号为 ,且缴获的坦克是从所生产的坦克中随机
获取的,因为生产坦克是连续编号的,所以缴获坦克的编号 , , , ,相当于从 , 中随机
抽取的 个整数,这 个数将区间 , 分成 个小区间,
由于 是未知的,除了最右边的区间外,其他 个区间都是已知的.由于这 个数是随机抽取的,所以可
以用前 个区间的平均长度 估计所有 个区间的平均长度 ,进而得到 的估计值.
例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为
24 .
【答案】24.
【考点】系统抽样方法
【专题】数学运算;分析法;对应思想;概率与统计
28【分析】根据统计学家利用的方法列比例式计算,即可求得答案.
【解答】解:由于用前 个区间的平均长度 估计所有 个区间的平均长度 ,
而缴获坦克的编号是3,5,12,18,20,即 , ,
故 , ,
即则统计学家利用上述方法估计德军每月生产的坦克数为24.
故答案为:24.
【点评】本题考查系统抽样方法,属于基础题.
17.(2024•大理州二模)已知某种商品的广告费支出 (单位:万元)与销售额 (单位:万元)之间
有如下表对应数据:
1 3 4 5 7
15 20 30 40 45
根据表中数据得到 关于 的经验回归方程为 ,则当 时,残差为 .(残差
观测值 预测值)
【答案】 .
【考点】经验回归方程与经验回归直线
【专题】对应思想;定义法;数学运算;概率与统计
【分析】根据线性回归方程相关知识结合残差定义可解.
【解答】解:根据表中数据可得 ,
则回归直线方程过点 ,将其代入 ,可得 ,
当 时, ,
根据残差计算公式可得,残差为 .
故答案为: .
【点评】本题考查线性回归方程相关知识,属于中档题.
18.(2024•江苏模拟)寰宇巨星知更鸟的新专辑《空气蛹》发布在某平台后,其一周内的累计播放量如
表所示,其中, ,2,3,4,5,6, 为该专辑发布后截至第 天的累计播放量.若将表中数据用
经验回归方程 进行拟合,则 4.92 7 .(结果保留3位小数)
29天 1 2 3 4 5 6 7
万次 120 240 340 510 760 1200 1730
参考数据及公式,在回归直线 中, , ,对于表中
的数据已知 , .
【答案】4.927.
【考点】经验回归方程与经验回归直线
【专题】概率与统计;数学运算;转化思想;综合法
【分析】利用线性回归方程即可求解.
【解答】解: ,则 ,设 ,
, ,
,
,
,
.
故答案为:4.927.
【点评】本题考查线性回归方程,属于中档题.
19.(2024•黄浦区校级三模)已知 , 是两个具有线性相关的两个变量,其取值如下表:
1 2 3 4 5
4 9 11
其回归方程为 ,则 1 1 .
【答案】11.
【考点】经验回归方程与经验回归直线
30【专题】综合法;数据分析;整体思想;概率与统计
【分析】利用线性回归方程经过样本中心即可求解.
【解答】解:由题设, ,
又 在回归直线上,所以,必有 ,故 .
【点评】本题考查线性回归方程,属于基础题.
20.(2024•吕梁一模)某市2018年至2022年新能源汽车年销量 (单位:百台)与年份代号 的数据
如下表:
年份 2018 2019 2020 2021 2022
年份代号 0 1 2 3 4
年销量 10 15 20 30 35
若根据表中的数据用最小二乘法求得 关于 的回归直线方程为 ,据此计算相应于样本点
的残差为 .
【答案】 .
【考点】经验回归方程与经验回归直线
【专题】逻辑推理;概率与统计;整体思想;综合题;综合法
【分析】首先计算 和 ,并代入回归直线方程求 ,并求 的估计值,根据残差的定义,即可求解.
【解答】解:依题意, , ,
代入回归直线 ,解得 ,
所以回归直线为 ,
当 时, ,因此残差为 .
故答案为: .
【点评】本题主要考查线性回归方程的应用,属于中档题.
四.解答题(共5小题)
21.(2024•静安区二模)某高中随机抽取100名学生,测得他们的身高(单位: ,按照区间 ,
, , , , , , , , 分组,得到样本身高的频率分布直方图(如
31图所示).
(1)求身高不低于 的学生人数;
(2)将身高在 , , , , , 区间内的学生依次记为 , , 三个组,用分层
抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求 组中至少有1人被抽中的概率.
【答案】(1)60.
(2)①3,2,1.② .
【考点】频率分布直方图的应用
【专题】计算题;数学运算;综合法;整体思想;概率与统计
【分析】(1)先求出 , 的频率可得结果.
(2)由分层抽样可得各组的人数,分别列举各种情况可得概率.
【解答】解:(1)由频率分布直方图可知
,所以 .
身高在 以上的学生人数为 (人 .
(2) , , 三组的人数分别为30人,20人,10人.
因此应该从 , , 三组中每组各抽取 (人 , (人 , (人 .
设 组的3位同学为 , , , 组的2位同学为 , , 组的1位同学为 ,则从6名学生中
32抽取2人有15种可能:
, , , , , . , , , , , , , , , ,
, , , , , , , , , , , , , .
其中 组的2位学生至少有1人被抽中有9种可能: , , , , , , , ,
, , , , , , , , , .
所以 组中至少有1人被抽中的概率为 .
【点评】本题主要考查频率分布直方图和分层抽样,属于中档题.
22.(2024•包头模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽
车流量 (单位:辆)和空气中的 的平均浓度 (单位: .调研人员采集了50天的数据,
制作了关于 , ,2,3, , 的散点图,并用直线 与 将散点图分成如图所
示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的 列联表,并判断至少有多大把握认为“ 平均浓度不小于 与“汽车
日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为 ,且这50天的汽车日流量 的标准差 , 的平均
浓度 的标准差 .
①求相关系数 ,并判断该回归方程是否有价值;
②若这50天的汽车日流量 满足 ,试推算这50天的 日均浓度 的平均数 .(精确
33到
参考公式: ,其中 .
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程 ,其中 .
相关系数 .若 ,则认为 与 有较强的线性相关性.
【答案】(1)列联表见解析,至少有 的把握;
(2)①0.84,有价值;② .
【考点】独立性检验;经验回归方程与经验回归直线
【专题】转化思想;数学运算;转化法;概率与统计
【分析】(1)根据题意,完成 列联表,再计算 ,结合表格即可求得结果.
(2)代入 公式计算可判断 与 的相关性强弱,由 可得 ,结合回归直线必过样本中心可求得
的值.
【解答】解:(1) 列联表如下:
汽车日流量 汽车日流量 合计
16 8 24
的平均浓度
346 20 26
的平均浓度
合计 22 28 50
零假设 :“ 平均浓度不小于 ”与“汽车日流量不小于1500辆”无关,
因为 ,
所以至少有 的把握(但还不能有 的把握)认为“ 平均浓度不小于 ”与“汽车
日流量不小于1500辆有关”.
(2)①因为回归方程为 ,
所以 ,
又因为 , ,
所以 .
, 与 有较强的相关性,
该回归方程有价值.
② ,解得
而样本中心点 位于回归直线 上,
因此可推算 .
【点评】本题主要考查线性回归方程的应用,以及独立性检验公式,属于中档题.
23.(2024•长春模拟)入冬以来,东北成为全国旅游话题的“顶流”.南方游客纷纷北上,体验东北最
美的冬天.某景区为给顾客更好的体验,推出了 和 两个套餐服务,并在购票平台上推出了优惠券活
35动,顾客可自由选择 和 两个套餐之一,下表是该景区在购票平台10天销售优惠券情况.
日期 1 2 3 4 5 6 7 8 9 10
销售量 (千 1.9 1.98 2.2 2.36 2.43 2.59 2.68 2.76 2.7 0.4
张)
经计算可得: , , .
(1)由于同时在线人数过多,购票平台在第10天出现网络拥堵,导致当天顾客购买的优惠券数量大幅
减少,现剔除第10天数据,求 关于 的回归方程(精确到 ,并估计第10天的正常销量;
(2)假设每位顾客选择 套餐的概率为 ,选择 套餐的概率为 ,其中 套餐包含一张优惠券, 套
餐包含两张优惠券,截止某一时刻,该平台恰好销售了 张优惠券,设其概率为 ,求 ;
(3)记(2)中所得概率 的值构成数列 .
①求数列 的最值;
②数列收敛的定义:已知数列 ,若对于任意给定的正数 ,总存在正整数 ,使得当 时,
, 是一个确定的实数),则称数列 收敛于 .根据数列收敛的定义证明数列 收敛.
回归方程 中斜率和截距的最小二乘估计公式分别为:
, .
【答案】(1) ,据此可估计第10天的正常销量约为2.94千张;
(2) ;
(3)①数列 的最大值为 ,最小值为 ;
②证明过程见解析.
【考点】经验回归方程与经验回归直线
【专题】综合法;概率与统计;数学运算;整体思想
36【分析】(1)计算出新数据的相关数值,代入公式求出 , 的值,进而得到 关于 的回归方程,再令
求出 的值即可;
(2)由题意可知 ,其中 , ,构造等比数列,再利用等比
数列的通项公式求解;
(3)①分 为偶数和 为奇数两种情况讨论,结合指数函数的单调性求解;
②利用数列收敛的定义证明.
【解答】解:(1)剔除第10天数据后的 , ,
, ,
所以 ,
故 ,
所以 ,
当 时, ,
即估计第10天的正常销量约为2.94千张;
(2)由题意可知 ,其中 , ,
则 ,
所以 是以首项为 ,公比为 的等比数列,
故 成立,
则有 ,
故 ,
37又因为 ,
所以 ;
(3)①当 为偶数时, 单调递减,最大值为 ,
当 为奇数时, 单调递增,最小值为 ,
综上:数列 的最大值为 ,最小值为 ;
②证明:对任意 总存在正整数 ,(其中 表示取整函数),
当 时, .
【点评】本题主要考查了线性回归方程的求解,考查了数列的递推式,属于中档题.
24.(2024•阳江模拟)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了 500名高中
学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成
, , , , , , , , , , , , , , , , , 九组,绘
制成如图所示的频率分布直方图.
(1)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在 , , ,
, , 三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参
加公益劳动时间在 , 内的学生人数为 ,求 的分布列和期望;
(2)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“ ”表示这20
名学生中恰有 名学生参加公益劳动时间在 , (单位:小时)内的概率,其中 ,1,2, ,
20.当 最大时,写出 的值.
38【答案】(1)分布列见解析, ;
(2)当 最大时, .
【考点】频率分布直方图的应用
【专题】综合法;概率与统计;数学运算;对应思想
【分析】(1)利用统计知识可得抽取的10人中有4人参加公益劳动时间在 , 内,则 的可能取
值为0,1,2,3,然后利用超几何分布的知识求出对应的概率即可得解;
( 2 ) 由 题 可 得 , 要 使 最 大 , 则 应 满 足
,然后解此不等式组即可得解.
【解答】解:(1)由频率分布直方图得:
,解得: ,
这500名学生中参加公益劳动时间在 , , , , , 三组内的学生人数分别为:
人, 人, 人,
若采用分层抽样的方法抽取了10人,
则应从参加公益劳动时间在 , 内的学生中抽取: 人,
现从这10人中随机抽取3人,则 的可能取值为0,1,2,3,
,
39,
故 的分布列为:
0 1 2 3
则其期望为 ;
(2)由(1)可知参加公益劳动时间在 , 的概率 ,
所以 ,
依题意 ,即 ,
即 ,解得 ,
因为 为非负整数,所以 ,
即当 最大时, .
【点评】本题考查了概率统计的综合应用,属于中档题.
25.(2024•高碑店市校级模拟)甲、乙两人在相同条件下各射击10次,每次命中的环数如表:
甲 8 6 7 8 6 5 9 10 4 7
乙 6 7 7 8 6 7 8 7 9 5
(1)分别计算以上两组数据的平均数;
(2)分别计算以上两组数据的方差;
(3)根据计算的结果,对甲乙两人的射击成绩作出评价.
【考点】用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数
【专题】概率与统计;转化法;对应思想
【分析】(1)根据平均数的计算公式求出平均数即可;
(2)根据方差的计算公式求出方差即可;
(3)根据(1),(2)判断即可.
【解答】解:(1)甲的平均分为: ;
40乙的平均分为: (4分)
(2)甲的方差为: ;
乙的方差为: (8分)
(3)甲、乙的平均分相同,说明甲、乙两人射击的平均水平相当,又 ,
说明乙的射击水平要比甲的射击水平更稳定. (12分)
【点评】本题考查了求数据的平均数和方差问题,是一道基础题.
41考点卡片
1.子集与真子集
【知识点的认识】
1、子集定义:一般地,对于两个集合A,B,如果集合A中任意一个元素都是集合B中的元素,我们就
说这两个集合有包含关系,称集合A为集合B的子集(subset).
记作:A B(或B A).
⊆ ⊇
2、真子集是对于子集来说的.
真子集定义:如果集合A B,但存在元素x B,且元素x不属于集合A,我们称集合A是集合B的真子集.
⊆ ∈
也就是说如果集合A的所有元素同时都是集合 B 的元素,则称 A 是 B 的子集,
若 B 中有一个元素,而A 中没有,且A 是 B 的子集,则称 A 是 B 的真子集,
注:①空集是所有集合的子集;
②所有集合都是其本身的子集;
③空集是任何非空集合的真子集
例如:所有亚洲国家的集合是地球上所有国家的集合的真子集.
所有的自然数的集合是所有整数的集合的真子集.
{1,3} {1,2,3,4}
{1,2,⊂3,4} {1,2,3,4}
⊆
3、真子集和子集的区别
子集就是一个集合中的全部元素是另一个集合中的元素,有可能与另一个集合相等;
真子集就是一个集合中的元素全部是另一个集合中的元素,但不存在相等;
注意集合的元素是要用大括号括起来的“{}”,如{1,2},{a,b,g};
另外,{1,2}的子集有:空集,{1},{2},{1,2}.真子集有:空集,{1},{2}.一般来说,真子集是在
所有子集中去掉它本身,所以对于含有n个(n不等于0)元素的集合而言,它的子集就有2n个;真子集
就有2n﹣1.但空集属特殊情况,它只有一个子集,没有真子集.
【解题方法点拨】
注意真子集和子集的区别,不可混为一谈,A B,并且B A时,有A=B,但是A B,并且B A,
是不能同时成立的;子集个数的求法,空集与自身是⊆不可忽视的⊆. ⊂ ⊂
42【命题方向】
本考点要求理解,高考会考中多以选择题、填空题为主,曾经考查子集个数问题,常常与集合的运
算,概率,函数的基本性质结合命题.
2.求解条件概率
【知识点的认识】
﹣条件概率:在事件B发生的条件下事件A发生的概率,记作P(A|B).
﹣计算: 其中P(B)>0.
【解题方法点拨】
﹣计算条件概率时,确定事件B的发生对事件A的影响,通过交事件的概率和条件事件的概率进行计算.
【命题方向】
﹣主要考察条件概率的计算及其应用问题.
3.n重伯努利试验与二项分布
【知识点的认识】
1、二项分布:
一般地,在n次独立重复的试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,
则
P(X=k)= pk(1﹣p)n﹣k,k=0,1,2,…n,此时称随机变量X服从二项分布,记作X~B(n,
p),并记
pk(1﹣p)n﹣k=b(k,n,p).
2、独立重复试验:
(1)独立重复试验的意义:做n次试验,如果它们是完全同样的一个试验的重复,且它们相互独立,那
么这类试验叫做独立重复试验.
(2)一般地,在n次独立重复试验中,设事件A发生的次数为X,在每件试验中事件A发生的概率为
p,那么在n次独立重复试验中,事件A恰好发生k次的概率为P(X=k)= pk(1﹣p)n﹣k,k=0,
1,2,…n,此时称随机变量X服从二项分布,记作X~B(n,p),并称p为成功概率.
(3)独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这
n次试验是独立的.
43(4)独立重复试验概率公式的特点:P (k)= pk(1﹣p)n﹣k,是n次独立重复试验中某 事件A恰好
n
发生k次的概率.其中,n是重复试验的次数,p是一次试验中某事件A发生的概率,k是在n次独立重复
试验中事件A恰好发生的次数,需要弄清公式中n,p,k的意义,才能正确运用公式.
【解题方法点拨】
独立重复试验是相互独立事件的特例(概率公式也是如此),就像对立事件是互斥事件的特例一样,只
要有“恰好”字样的用独立重复试验的概率公式计算更简单,就像有“至少”或“至多”字样的题用对
立事件的概率公式计算更简单一样.
【命题方向】
典例1:如果ζ~B(100, ),当P(ζ=k)取得最大值时,k= 5 0 .
解:∵ζ~B(100, ),
当 ,
由组合数知,当k=50时取到最大值.
故答案为:50.
典例2:一个盒子里有2个黑球和m个白球(m≥2,且m N*).现举行摸奖活动:从盒中取球,每次取
2个,记录颜色后放回.若取出2球的颜色相同则为中奖,∈否则不中.
(Ⅰ)求每次中奖的概率p(用m表示);
(Ⅱ)若m=3,求三次摸奖恰有一次中奖的概率;
(Ⅲ)记三次摸奖恰有一次中奖的概率为f(p),当m为何值时,f(p)取得最大值?
解:(Ⅰ)∵取出2球的颜色相同则为中奖,
∴每次中奖的概率p= = ;
(Ⅱ)若m=3,每次中奖的概率p= ,
∴三次摸奖恰有一次中奖的概率为 = ;
(Ⅲ)三次摸奖恰有一次中奖的概率为f(p)= =3p3﹣6p2+3p(0<p<1),
∴f′(p)=3(p﹣1)(3p﹣1),
44∴f(p)在(0, )上单调递增,在( ,1)上单调递减,
∴p= 时,f(p)取得最大值,即p= =
∴m=2,即m=2时,f(p)取得最大值.
4.正态分布曲线的特点及曲线所表示的意义
【知识点的认识】
1.正态曲线及性质
(1)正态曲线的定义
函数 , (x)= ,x (﹣∞,+∞),其中实数 和σ(σ>0)为参数,我们
σ
称 φ,μ σ(x)的图象(如图)为正态分布密度曲∈线,简称正态曲线. μ
(φ2μ)正态曲线的解析式
①指数的自变量是x定义域是R,即x (﹣∞,+∞).
②解析式中含有两个常数: 和e,这∈是两个无理数.
③解析式中含有两个参数:π和σ,其中 可取任意实数,σ>0这是正态分布的两个特征数.
μ μ
④解析式前面有一个系数为 ,后面是一个以 e 为底数的指数函数的形式,幂指数为﹣
.
2.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)= ,σ(x)dx,则称X的分布为
μ
正态分布,记作N( ,σ2). φ
(2)正态总体在三μ个特殊区间内取值的概率值
①P( ﹣σ<X≤ +σ)=0.6826;
②P(μ﹣2σ<X≤μ +2σ)=0.9544;
③P(μ﹣3σ<X≤μ+3σ)=0.9974.
μ μ
453.正态曲线的性质
正态曲线 , (x)= ,x R有以下性质:
σ
(1)曲线φ位μ于x轴上方,与x轴不相交;
∈
(2)曲线是单峰的,它关于直线x= 对称;
μ
(3)曲线在x= 处达到峰值 ;
(4)曲线与xμ 轴围成的图形的面积为1;
(5)当σ一定时,曲线随着 的变化而沿x轴平移;
(6)当 一定时,曲线的形μ状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲
线越“μ矮胖”,表示总体的分布越分散.
4.三个邻域
会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小
概率事件,这也是对产品进行质量检测的理论依据.
【解题方法点拨】
正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高
考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下
手或计算错误.对正态分布N( ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第
二个数值应该为σ2而不是σ,同μ时,记住正态密度曲线的六条性质.
【命题方向】
题型一:概率密度曲线基础考察
典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)= ,则这
个正态总体的平均数与标准差分别是( )
A.10与8 B.10与2 C.8与10 D.2与10
解析:由 = ,可知σ=2, =10.
答案:B. μ
46典例2:已知随机变量 服从正态分布N(2,σ2),且P( <4)=0.8,则P(0< <2)等于( )
A.0.6 B.0.4ξ C.0.3 D.0.2 ξ ξ
解析:由P( <4)=0.8知P( >4)=P( <0)=0.2,
故P(0< <ξ2)=0.3.故选Cξ. ξ
ξ
典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.682 6,则P(X>4)等于(
)
A.0.158 8 B.0.158 7 C.0.158 6 D.0.158 5
解析 由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣ P(2≤X≤4)=0.5﹣
×0.682 6=0.1587.故选B.
题型二:正态曲线的性质
典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为 .
(1)求该正态分布的概率密度函数的解析式;
(2)求正态总体在(﹣4,4]的概率.
分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数 ,σ的值,其中
决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关. μ μ
解 (1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于 y轴对称,即 =0.由
μ
= ,得σ=4,故该正态分布的概率密度函数的解析式是
,σ(x)= ,x (﹣∞,+∞).
μ
φ ∈
(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)
=P( ﹣σ<X≤ +σ)=0.6826.
点评μ:解决此类μ问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变
化对曲线的影响.
典例2:设两个正态分布N( , )(σ >0)和N( , )(σ >0)的密度函数图象如图所示,
1 1 2 2
μ μ
47则有( )
A. < ,σ <σ
1 2 1 2
B.μ
1
<μ
2
,σ
1
>σ
2
C.μ
1
>μ
2
,σ
1
<σ
2
D.μ
1
>μ
2
,σ
1
>σ
2
解μ析:μ根据正态分布N( ,σ2)函数的性质:正态分布曲线是一条关于直线x= 对称,在x= 处取得
最大值的连续钟形曲线;μσ越大,曲线的最高点越低且较平缓;反过来,σ越小μ,曲线的最高点μ越高且较
陡峭,故选A.
答案:A.
题型三:服从正态分布的概率计算
典例1:设X~N(1,22),试求
(1)P(﹣1<X≤3);
(2)P(3<X≤5);
(3)P(X≥5).
分析:将所求概率转化到( ﹣σ, +σ].( ﹣2σ, +2σ]或[ ﹣3σ, +3σ]上的概率,并利用正态密度曲
线的对称性求解. μ μ μ μ μ μ
解析:∵X~N(1,22),∴ =1,σ=2.
(1)P(﹣1<X≤3)=P(μ1﹣2<X≤1+2)
=P( ﹣σ<X≤ +σ)=0.682 6.
(2)μ∵P(3<μX≤5)=P(﹣3<X≤﹣1),
∴P(3<X≤5)= [P(﹣3<X≤5)﹣P(﹣1<X≤3)]
= [P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2)]
= [P( ﹣2σ<X≤ +2σ)﹣P( ﹣σ<X≤ +σ)]
μ μ μ μ
= ×(0.954 4﹣0.682 6)
=0.1359.
48(3)∵P(X≥5)=P(X≤﹣3),
∴P(X≥5)= [1﹣P(﹣3<X≤5)]
= [1﹣P(1﹣4<X≤1+4)]
= [1﹣P( ﹣2σ<X≤ +2σ)]
μ μ
= ×(1﹣0.954 4)=0.0228.
求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知
概率的三个区间上.
典例2:随机变量 服从正态分布N(1,σ2),已知P( <0)=0.3,则P( <2)= .
解析:由题意可ξ知,正态分布的图象关于直线x=1对称ξ,所以P( >2)=ξP( <0)=0.3,P( <2)
=1﹣0.3=0.7. ξ ξ ξ
答案:0.7.
题型4:正态分布的应用
典例1:2011年中国汽车销售量达到1 700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽
车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了 1
200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量 服从正态分布N
(8,σ2),已知耗油量 [7,9]的概率为0.7,那么耗油量大于9升的汽车大约有 ξ辆.
解析:由题意可知 ~ξN(∈8,σ2),故正态分布曲线以 =8为对称轴,又因为P(7≤ ≤9)=0.7,故P
(7≤ ≤9)=2Pξ(8≤ ≤9)=0.7,所以P(8≤ ≤μ9)=0.35,而P( ≥8)=0.5,ξ所以P( >9)=
0.15ξ,故耗油量大于9ξ升的汽车大约有1 200×0.1ξ5=180辆. ξ ξ
点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x轴之间的曲边梯
形的面积,根据正态密度曲线的对称性,当P( >x )=P( <x )时必然有 = ,这是解决正态
1 2
ξ ξ μ
分布类试题的一个重要结论.
典例2:工厂制造的某机械零件尺寸X服从正态分布N(4, ),问在一次正常的试验中,取1 000个
零件时,不属于区间(3,5]这个尺寸范围的零件大约有多少个?
49解∵X~N(4, ),∴ =4,σ= .
∴不属于区间(3,5]的μ概率为
P(X≤3)+P(X>5)=1﹣P(3<X≤5)
=1﹣P(4﹣1<X≤4+1)
=1﹣P( ﹣3σ<X≤ +3σ)
=1﹣0.9μ974=0.002μ6≈0.003,
∴1 000×0.003=3(个),
即不属于区间(3,5]这个尺寸范围的零件大约有3个.
5.系统抽样方法
【知识点的认识】
1.定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按
照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.
2.系统抽样的特征:
(1)当总体容量N较大时,适宜采用系统抽样;
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此系统抽样又称等距抽样,
这里的间隔一般为k=
(3)在第一部分的抽样采用简单随机抽样;
(4)每个个体被抽到的可能性相等
3.系统抽样与简单随机抽样的关系:
(1)系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是
简单随机抽样;
(2)系统抽样和简单随机抽样都是等概率抽样,它是公平的.
4.系统抽样与简单随机抽样的优缺点:
(1)当总体的个体数较大时,用系统抽样比用简单随机抽样更易实施,更节约成本;
(2)系统抽样比简单随机抽样应用范围更广;
(3)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与编号
无关,如果编号的特征随编号的变化呈一定的周期性,可能造成系统抽样的代表性很差.
【解题方法点拨】
系统抽样的一般步骤:
(1)编号:采用随机的方式将总体中的个体编号;
(2)分段:确定分段间隔k,对编号进行分段(N为总体个数,n为样本容量):
50①当 时,k= ,
②当 时,通过从总体中剔除一些个体,使剩下的总体中的个体数N′能被n整除,这时k=
(注意这时要重新编号1﹣N′后,才能再分段)
(3)确定起始编号:在第一段用简单随机抽样确定起始的个体编号l(l N,l≤k);
(4)抽样:按事先确定的规则抽取样本,即l,l+k,l+2k,…,l+(n﹣∈1)k.
【命题方向】
1.考查系统抽样的定义
例:某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了了解有关
情况,留下了座位号是15的25名学生进行测试,这里运用的抽样方法是( )
A.抽签法 B.随机数表法 C.系统抽样法 D.分层抽样法
分析:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,符合系统抽样的定
义.
解答:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,故属于系统抽样,
故选C.
点评:本题考查系统抽样的定义和方法,属于容易题.
2.考查系统抽样的应用
例:将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的
样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是
分析:根据系统抽样的定义,即可得到结论.
解答:∵样本容量为20,首个号码为003,
∴样本组距为100÷20=5
∴对应的号码数为3+5(x﹣1)=5x﹣2,
由48≤5x﹣2≤81,
得10≤x≤16.6,
即x=10,11,12,13,14,15,16,共7个,
故答案为:7.
点评:本题主要考查系统抽样的应用,利用系统抽样的定义建立号码关系是解决本题的关键,比较基础.
6.频率分布直方图的应用
【知识点的认识】
﹣应用:用于数据的分布可视化,帮助分析数据集中趋势、离散程度等.
【解题方法点拨】
51﹣分析:通过直方图观察数据的分布特征,识别数据的集中区域和离散程度.
【命题方向】
﹣重点考察如何解读频率分布直方图及其对数据分析的贡献.
7.频率分布折线图、密度曲线
【知识点的认识】
1.频率分布折线图:
如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频
率折线图.
2.总体分布的密度曲线:
如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率分布折线图将趋于一条光滑曲线,
我们称这条光滑曲线为总体分布的密度曲线.
8.统计图表获取信息
【知识点的认识】
统计图表反映了被描述对象的重要内容和数据情况,它简单明了,有利于我们把握数据的特点,统计图
还能直观、生动地传递信息.
【解题方法点拨】
由统计图表获取信息的步骤:
一、看统计图表特征;
二、读统计图表数据信息并进行分析;
三、寻找出统计图表中数据的变化趋势或规律;
四、对统计图表的数据与信息作分析、推测,为对解决问题作出合理的判断提供依据.
注意:①要避免统计图的误导,首先要仔细观察统计图,其次要关注数据的来源、收集方式及描述形式,
这样才能获得准确的信息;
②对数据的收集、整理等一定要重视它的普遍性、代表性、公正性,不能以点带面,以偏概全,夸大局
部的作用.
【命题方向】
能正确解读统计图表,从中获取必要、准确的信息,并进站简单的决策;处理生活中常见的不规范统计
图带来的错误信息,提高对统计图表的认识能力.
9.用样本估计总体的集中趋势参数
【知识点的认识】
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均
52数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均
数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即 .
2.众数、中位数、平均数的优缺点
【解题方法点拨】
众数、中位数、平均数的选取:
(1)平均数能较好地反映一组数据的总体情况;
(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);
(3)众数能反映一组数据的集中情况(即多数水平).
根据频率分布直方图估算众数、中位数、平均数:
(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.
(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小
矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.
10.用样本估计总体的离散程度参数
【知识点的认识】
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中
53各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映
这组数据波动的大小,方差越大,数据的波动越大.
【解题方法点拨】
例:求数据98,100,101,102,99的极差,方差,标准差.
解:极差是:102﹣98=4;
平均数 = (98+100+101+102+99)=100,
则方差是:S2= [(98﹣100)2+(100﹣100)2+(101﹣100)2+(102﹣100)2+(99﹣100)2]=2;
标准差S= .
可以看出这类题考查的基本上是对概念的理解,根据概念去解题就可以了.
【命题方向】
这个考点很重要,也很容易,所以大家都应该好好的看看概念,理解方差的含义和怎么求就可以了.
11.百分位数
【知识点的认识】
百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p (0,1),总体的p分位数有这样
的特点,总体数据中的任意一个数小于或等于它的可能性是p. ∈
四分位数:25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百
分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是 .因此这三个百分位数也称为总体
的四分位数.
【解题方法点拨】
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,
且至少有(100﹣p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数步骤如下:
①按从小到大排列原始数据;
②计算i=n×p%;
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数
为第i项与第(i+1)项数据的平均数.
【命题方向】
理解连续变量的百分位数的统计含义,考察百分位数的计算,学会用样本估计总体的百分位数.
12.样本相关系数
【知识点的认识】
1、概念:
54相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的
程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相
关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,
通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相
关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平
方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程: = x+ );
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方
程不是形如: = x+ 时,我们称之为非线性回归方程.
13.经验回归方程与经验回归直线
【知识点的认识】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计
分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线
性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表
示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和
55自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设
随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认
为关于的回归函数的类型为线性函数.
【解题方法点拨】
例:对于线性回归方程 ,则 =
解: ,因为回归直线必过样本中心( ),
所以 .
故答案为:58.5.
方法就是根据线性回归直线必过样本中心( ),求出 ,代入即可求 .这里面可以看出线性规划
这类题解题方法比较套路化,需要熟记公式.
【命题方向】
这类题记住公式就可以了,也是高考中一个比较重要的点.
14.独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这
种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X
和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
564、范围:K2 (0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤∈:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k 比较,得出事件有关的可能性大小.
0
声明:试题解析著作权属菁优网所有,未经书面同意,不得复制发布日期:2024/11/4 19:45:39;用户:组卷36;邮箱:zyb036@xyh.com;学号:41418999
57