文档内容
人教A版数学--概率专题十一
知识点一 由频率分布直方图计算频率、频数、样本容量、总体容量,由频率分布直方
图估计平均数,指定区间的概率
典例1、为了提高生产效率,某企业引进一条新的生产线,现要定期对产品进行检测.
每次抽取100件产品作为样本,检测新产品中的某项质量指标数,根据测量结果得到如
下频率分布直方图.
(1)指标数不在 和 之间的产品为次等品,试估计产品为次等品的概率;
(2)技术评估可以认为,这种产品的质量指标数 服从正态分布 ,其中 近
似为样本的平均数(同一组中的数据用该组区间的中点值为代表),计算 值,并
计算产品指标数落在 内的概率.
参考数据: ,则 , .随堂练习:2021年是“十四五”规划开局之年,也是建党100周年.为了传承红色基因,
某学校开展了“学党史,担使命”的知识竞赛.现从参赛的所有学生中,随机抽取100
人的成绩作为样本,得到成绩的频率分布直方图,如图.
(1)求频率分布直方图中 的值,并估计该校此次竞赛成绩的平均分 (同一组中的数
据用该组区间中点值代表);
(2)在该样本中,若采用分层抽样的方法,从成绩高于75分的学生中随机抽取7人查
看他们的答题情况,再从这7人中随机抽取3人进行调查分析,求这3人中至少有1
人成绩在 内的概率;
(3)假设竞赛成绩服从正态分布 ,已知样本数据的方差为121,用平均分 作
为 的近似值,用样本标准差 作为 的估计值,求该校本次竞赛的及格率(60分
及以上为及格).
参考数据: , ,
.典例2、2022年北京冬季奥运会将在北京市和河北省张家口市联合举行,北京市延庆区
张山营镇的2022北京冬奥森林公园于2020年4月22日正式启动了冬奥赛区的树木移植
工作.本次移植的树木来自2022北京冬奥赛区树木假植区,包含暴马丁香、核桃楸、
大叶白蜡等多个品种.现从冬奥赛区树木假植区中抽取300棵暴马丁香,并对树木高度
(单位: )进行测量,将测量结果绘制为如图所示的频率分布直方图.
(1)估计抽取的300棵暴马丁香树木高度的平均值(同一组中的数据可用该区间的中
点值为代表);
(2)北京冬奥赛区树木假植区内的暴马丁香的高度 ( )服从正态分布 ,
其中 近似为样本平均数 .记 为假植区内10000棵暴马丁香中高度位于区间的数量,求 ;
(3)在树木移植完成后,采取施用生根粉、加挂营养液等方式确保了移植树木的成活
率,经验收,单棵移植成活率达到了90%.假设各棵树木成活与否相互不影响,求移
植五棵暴马丁香成活四棵及以上的概率.(保留三位小数)
附:若 ,则 , .
随堂练习:某科技公司新研制生产一种特殊疫苗,为确保疫苗质量,定期进行质量检验.
某次检验中,从产品中随机抽取100件作为样本,测量产品质量体系中某项指标值,根
据测量结果得到如下频率分布直方图:
(1)求频率分布直方图中a的值;
(2)技术分析人员认为,本次测量的该产品的质量指标值X服从正态分布 ,
若同组中的每个数据用该组区间的中间值代替,计算 ,并计算测量数据落在内的概率;
(3)设生产成本为y元,质量指标值为x,生产成本与质量指标值之间满足函数关系
假设同组中的每个数据用该组区间的中间值代替,试计算生产疫
苗的平均成本.
参考数据: ,则 , .
20-5(提升) 为落实体育总局和教育部发布的《关于深化体教融合,促进青少年健康
发展的意见》,某校组织学生加强100米短跑训练.在某次短跑测试中,抽取 100名男
生作为样本,统计他们的成绩(单位:秒),整理得到如图所示的频率分布直方图(每
组区间包含左端点,不包含右端点).1、若规定男生短跑成绩小于13.5秒为优秀,求样本中男生短跑成绩优秀的概率.
2、估计样本中男生短跑成绩的平均数.(同一组的数据用该组区间的中点值为代表)
3、根据统计分析,该校男生的短跑成绩X服从正态分布 ,以(2)中所求的
样本平均数作为 的估计值.若从该校男生中随机抽取10人,记其中短跑成绩在
以外的人数为Y,
求 .
附:若 ,则 . .随堂练习:《中国制造2025》是经国务院总理李克强签批,由国务院于2015年5月印
发的部署全面推进实施制造强国的战略文件,是中国实施制造强国战略第一个十年的行
动纲领.制造业是国民经济的主体,是立国之本、兴国之器、强国之基.发展制造业的基
本方针为质量为先,坚持把质量作为建设制造强国的生命线 某制造企业根据长期检测
结果,发现生产的产品质量与生产标准的质量差都服从正态分布 ,并把质量差
在 内的产品为优等品,质量差在 内的产品为一等品,其余范围
内的产品作为废品处理 优等品与一等品统称为正品 现分别从该企业生产的正品中随机
抽取1000件,测得产品质量差的样本数据统计如下:
(1)根据频率分布直方图,求样本平均数
(2)根据大量的产品检测数据,检查样本数据的方差的近似值为100,用样本平均数
作为 的近似值,用样本标准差 作为 的估计值,求该厂生产的产品为正品的概
率.(同一组中的数据用该组区间的中点值代表)
[参考数据:若随机变量 服从正态分布 ,则: ,
, ].
(3)假如企业包装时要求把3件优等品球和6件一等品装在同一个箱子中,质检员每
次从箱子中摸出三件产品进行检验,记摸出三件产品中优等品球的件数为 ,求
的分布列以及期望值.知识点二 求回归直线方程,卡方的计算,独立性检验解决实际问题
典例4、近年来,随着网络时代的发展,线上销售成为了一种热门的发展趋势.为了了
解产品A的线上销售对象对该产品的满意程度,研究人员随机抽取了部分客户作出调查,
得到的数据如下表:
表示满意 表示不满意
男性 60 45
女性 30 45
(1)判断能否在犯错误的概率不超过0.025的前提下认为客户的满意程度与性别有关?
(2)根据以往数据,产品A的部分销售年份 和线上销售总额 之间呈现
线性相关,数据统计如图所示,其中 , ,求 关于 的回归
直线方程 .附: , , ,其中 .
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
随堂练习:时值金秋十月,正是秋高气爽,阳光明媚的美好时刻.复兴中学一年一度的
校运会正在密锣紧鼓地筹备中,同学们也在热切地期盼着,都想为校运会出一份力.小
智同学则通过对学校有关部门的走访,随机地统计了过去许多年中的五个年份的校运会
“参与”数及相关数据,并进行分析,希望能为运动会组织者科学地安排提供参考.
附:①过去许多年来学校的学生数基本上稳定在3500人左右;②“参与”人数是指运
动员和志愿者,其余同学均为“啦啦队员”,不计入其中;③用数字 表示小智
同学统计的五个年份的年份数,今年的年份数是6;
统计表(一)
年份数 1 2 3 4 5
“参与”人数( 千人) 1.9 2.3 2.0 2.5 2.8
统计表(二)
高一(3)(4)班参加羽毛球比赛的情况:
男生 女生 小计
参加(人数) 26 50不参加(人数) 20
小计 44 100
1、请你与小智同学一起根据统计表(一)所给的数据,求出“参与”人数 关于年份
数 的线性回归方程 ,并预估今年的校运会的“参与”人数;
2、根据统计表(二),请问:你能否有超过 的把握认为“羽毛球运动”与“性
别”有关?
参考公式和数据一: , , ,
参考公式二: ,其中 .
参考数据:
典例5、某食品店为了了解气温对销售量的影响,随机记录了该店1月份其中5天食品
的日销售量 (单位:千克)与该地当日最低气温 (单位: )的数据,如下表:
2 5 8 9 11
12 10 8 8 7
(1)求 关于 的线性回归方程;查看当天天气预报知道,第二天气温可能降至 左右,为第二天准备食品 多少千克比较恰当?(精确到个位数)
(2)填写下列2×2列联表,并判断是否有 的把握认为气温是否超过 对销售量
是否低于9千克具有影响?
销量低于 销量不低于 合计
气温高于
气温不高于
合计
附:参考公式与数据:①回归方程 中, ,
.
② .
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
随堂练习:为推动实施健康中国战略,树立大卫生、大健康理念,某单位组织职工参加
“万步有约”健走激励大赛活动,且每月评比一次,对该月内每日运动都达到一万步及以上的职工授予该月“健走先锋”称号,其余参与的职工均获得“健走之星”称号,下
表是该单位职工2021年1月至5月获得“健走先锋”称号的统计数据:
月份 1 2 3 4 5
“健走先锋”职工数 120 105 100 95 80
(1)请利用所给数据求“健走先锋”职工数y与月份x之间的回归直线方程 ,
并预测该单位10月份的“健走先锋”职工人数;
(2)为进一步了解该单位职工的运动情况,现从该单位参加活动的职工中随机抽查70
人,调查获得“健走先锋”称号与性别的关系,统计结果如下:
健走先锋 健走之星
男员工 24 16
女员工 16 14
能否据此判断有90%的把握认为获得“健走先锋”称号与性别有关?
参考公式: , .
(其中 )
0.15 0.10 0.05 0.025 0.010
2.072 2.706 3.841 5.024 6.635
典例6、棉花是我国主要经济作物、纺织工业原料、重要战略物资.量化我国棉花生产碳足迹,解析其时空变化规律,阐明其主要构成因素与影响要素,对于“碳达峰,碳中
和”愿景下我国棉花绿色可持续生产具有重要意义.某地因地制宜发展特色棉花种植,
随着人们种植意识的提升和科技人员的大力指导,越来越多的农田开始种植棉花,近4
年该地区棉花种植面积如下表:(单位:百亩)
年度 2018 2019 2020 2021
年度代码x 1 2 3 4
种植面积y 306 347 390 420
(1)请利用所给数据求棉花种植面积y与年度代码x之间的回归直线方程 ,并
估计该地区2022年棉花的种植面积;
(2)针对近几年来棉花出现的生理性蕾铃脱落,及棉花枯、黄萎病等问题,某科研小组
随机抽查了100亩棉花,对是否按时足量施用硼肥和棉花产量进行统计得到如下数
据:
亩产 亩产
未按时足量施用硼肥 20 10
按时足量施用硼肥 58 12
问:是否有90%的把握认为棉花产量与是否按时足量施用硼肥有关?
参考公试:线性回归方程: ,其中 ,
,其中 .
临界值表:
0.15 0.10 0.05 0.01
2.072 2.706 3.841 6.635随堂练习:某校高一(1)班总共50人,现随机抽取7位学生作为一个样本,得到该7
位学生在期中考试前一周参与政治学科这一科目的时间(单位:h)及他们的政治原始
成绩(单位:分)如下表:
复习时间 2 3 5 6 8 12 16
考试分数 60 69 78 81 85 90 92
甲同学通过画出散点图,发现考试分数与复习时间大致分布在一条直线附近,似乎可以
用一元线性回归方程模型建立经验回归方程,但是当他以经验回归直线为参照,发现这
个经验回归方程不足之处,这些散点并不是随机分布在经验回归直线的周围,成对样本
数据呈现出明显的非线性相关特征,根据散点图可以发现更趋向于落在中间上凸且递增
的某条曲线附近,甲同学回顾已有函数知识,可以发现函数 具有类似特征中,因
此,甲同学作 变换,得到新的数据 ,重新画出散点图,发现 与 之
间有很强的线性相关,并根据以上数据建立 与 之间的线性经验回归方程 .
政治成绩
考前一周复习投入时间(单位:h) 合计
优秀 不优秀
≥6h
<6h
合计 50
(1)预测当 时该班学生政治学科成绩(精确到小数点后1位);
(2)经统计,该班共有25人政治成绩不低于85分,评定为优秀,而且在考前一周投
入政治学可复习时间不低于6h共有30人,除去抽走的7位学生,剩下学生中考前一周
复习政治的时间不少于6h政治不优秀共有6人,请填写下面的 列联表,依据小概率值 的 独立性检验,能否认为政治成绩与考前一周复习时间有关.
附: , , , , ,
, .
0.01 0.005 0.001
6.635 7.879 10.828
人教A版数学--概率专题十一答案
典例1、答案: (1) (2) ,0.9544
解:(1)由 ,解得 ,
样本中指标数不在 和 之间的频率为 ,
所以产品为次等品的概率估计值为 .
(2)依题意 .
所以 ,
所以 .
随堂练习:答案: (1) ;平均分为71分;(2) ;(3) .
解:(1)由频率分布直方图可得, , 解得 .
这组样本数据的平均数为: .
所以估计该校此次竞赛成绩的平均分为71分;(2)自频率分布直方图可知,成绩在 , 内的频率分别为0.25,0.1.
所以采用分层抽样的方法从样本中抽取的7人,
成绩在 内的有5人,成绩在 内的有2人.
记事件 这3人至少有1人成绩在 内 则 ;
(3)由题意知,样本方差 ,故 , 所以竞赛成绩
该校竞赛的及格率 .
典例2、答案:(1) ;(2) ;(3) .
解:(1)抽取树木高度为 的频率为 ,
所以样本均值: .
(2)由第一问估计 ,
,
一棵树的高度位于区间 的概率为0.1359,
依题意知 ,所以 .
(3)记移植五棵树中成活了 棵. .
随堂练习:答案: (1) ;(2) ; ;(3) 元.
解:(1)由 解得 .(2)依题意,
故 所以
故测量数据落在 内的概率约为
(3)根据题意得
故生产该疫苗的平均成本为 .
典例3、答案: (1) (2) (3)
解:(1)由频率分布直方图可得 , 解得 ,
所以样本中男生短跑成绩优秀的概率为 .
(2)估计样本中男生短跑成绩的平均数为:
.
(3)由(2)知 ,所以 ,
所以该校男生短跑成绩在 以外的概率为:
根据题意 , 所以 .
随堂练习:答案: (1)70 (2)0.8186 (3)分布列见解析
解:(1)由频率分布直方图可知,.
(2)由题意可知,样本方差 ,故 ,所以 ,
该厂生产的产品为正品的概率:
.
(3)X所有可能值为0,1,2,3.
, , ,
.
所以 的分布列为
数学期望 .
典例4、答案: (1)能; (2) .
解:(1)根据统计数据,可得 列联表如下表:
表示满意 表示不满意 总计
男性 60 45 105
女性 30 45 75
总计 90 90 180则 ,
故能够在犯错误的概率不超过0.025的前提下认为客户的满意程度与性别有关.
(2)由题意得, , , 则 ,
,
∴ 关于 的回归直线方程为 .
随堂练习:答案: (1) ;2.9千人.
(2)没有超过 的把握认为“羽毛球运动”与“性别”有关.
解:(1)由题意得 , ,
所以 , ∴
∴线性回归方程为 , ∴预计今年的“参与“人数为:
(千人).
由题意可确定列联表如下:
男生 女生 小计
参加(人数) 26 24 50
不参加(人数) 30 20 50
小计 56 44 100
(2)则,
所以没有超过 的把握认为“羽毛球运动”与“性别”有关.
典例5、答案:(1) , ;(2)表格见解析,有.
解:(1) , ,
,
, ,
,
所以,所求回归方程是 , 将 代入回归方程得 千
克,
所以依据第二天气温可能降至 天气预报,为第二天准备该商品 左右较
合适;
(2)根据已知条件构造分类变量列联表:
销量低于 销量不低于 合计
气温高于 3 0 3
气温不高于 0 2 2
合计 3 2 5
计算随机变量 的观测值:
, ,.
所以,具有 的把握认为气温是否超过 对销售量是否低于 具有影响.
随堂练习:答案: (1) ;约为37人;
(2)没有90%的把握认为获得“健走先锋”称号与性别有关.
解:(1)由表中的数据可知, , ,
所以 ,故 .
所以所求的回归直线方程为 ;
当 时, ,
所以该单位10月份的“健走先锋”职工人数约为37人.
(2)由表中数据可得, .
因为 ,
所以没有90%的把握认为获得“健走先锋”称号与性别有关.
典例6、答案: (1) ,面积为462百亩
(2)有90%的把握认为棉花产量与是否按时足量施用硼肥有关
解:(1)根据题意得到 ,
因为 ,所以,
所以棉花种植面积y与年度代码x之间的回归直线方程 ,
(2)当 时, ,
所以估计该地区2022年棉花的种植面积为462百亩.
结合已知数据得到 列联表如下表所示:
亩产 亩产 合计
未按时足量施用硼肥 20 10 30
按时足量施用硼肥 58 12 70
合计 78 22 100
,
所以有90%的把握认为棉花产量与是否按时足量施用硼肥有关.
随堂练习:答案: (1)51.9分;
(2)表格见解析,认为政治成绩与考前一周复习时间有关,此推断犯错误的概率不超
过0.001.
解:(1) ,
,
所以 ,且 ,
所以预测当 时, ,
即该班学生政治学科成绩约为51.9分.(2) 列联表:
政治成绩
考前一周复习投入时间(单位:h) 合计
优秀 不优秀
≥6h 23 7 30
<6h 2 18 20
合计 25 25 50
零假设为 :认为政治成绩与考前一周复习时间无关,
,
依据 的独立性检验,推断 不成立,
即认为政治成绩与考前一周复习时间有关,此推断犯错误的概率不超过0.001.