文档内容
专题 09 概率与统计
1.(2021·江苏高考真题)下图是某项工程的网络图(单位:天),则从开始节点①到终止节点⑧的路径共有
( )
A.14条 B.12条 C.9条 D.7条
【答案】B
【分析】根据分步乘法计算原理即可求解.
【详解】由图可知,由① ④有3条路径,由④ ⑥有2条路径,由⑥ ⑧有2条路径,根据分步乘法
计算原理可得从① ⑧共有 条路径.
故选:B.
2.(2021·天津高考真题)从某网络平台推荐的影视作品中抽取 部,统计其评分分数据,将所得
个评分数据分为 组: 、 、 、 ,并整理得到如下的费率分布直方图,
则评分在区间 内的影视作品数量是( )A. B. C. D.
【答案】D
【分析】利用频率分布直方图可计算出评分在区间 内的影视作品数量.
【详解】由频率分布直方图可知,评分在区间 内的影视作品数量为 .
故选:D.
3.(2021·全国高考真题(文))在区间 随机取1个数,则取到的数小于 的概率为( )
A. B. C. D.
【答案】B
【分析】根据几何概型的概率公式即可求出.
【详解】设 “区间 随机取1个数” ,
“取到的数小于 ” ,所以 .
故选:B.
【点睛】本题解题关键是明确事件“取到的数小于 ”对应的范围,再根据几何概型的概率公式即可准确求出.
4.(2021·全国高考真题(文))将3个1和2个0随机排成一行,则2个0不相邻的概率为( )
A.0.3 B.0.5 C.0.6 D.0.8
【答案】C
【分析】利用古典概型的概率公式可求概率.
【详解】解:将3个1和2个0随机排成一行,可以是:
,
共10种排法,
其中2个0不相邻的排列方法为:
,
共6种方法,
故2个0不相邻的概率为 ,
故选:C.
5.(2021·全国高考真题)下列统计量中,能度量样本 的离散程度的是( )
A.样本 的标准差 B.样本 的中位数
C.样本 的极差 D.样本 的平均数
【答案】AC
【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
1.(2021·陕西高三其他模拟(文))魏晋时期数学家刘徽在他的著作《九章算术注》中,称一个正方体内两个互相垂直的内切圆柱所围成的几何体为“牟合方盖”(如图),通过计算得知正方体的体积与“牟
合方盖”的体积之比应为 .若在该“牟合方盖”内任取一点,此点取自正方体内切球内的概率为(
)
A. B. C. D.
【答案】B
【分析】根据内切球体积和“牟合方盖”体积与正方体体积的关系,利用几何概型中的体积比即可得解.
【详解】设正方体的边长为 ,
正方体体积为 ,“牟合方盖”的体积为 ,
而内切球的体积为 ,
所以在该“牟合方盖”内任取一点,
由内切圆在“牟合方盖”内部,
此点取自正方体内切球内的概率为 ,
故选:B.
2.(2021·贵州黔东南苗族侗族自治州·凯里一中高三三模(文))数学家阿基米德建立了这样的理论:
“任何由直线与抛物线所围成的弓形,其面积都是其同底同高的三角形面积的三分之四.”如图,直线
与抛物线 交于 、 两点, 、 两点在 轴上的射影分别为 、 ,从长方形
内任取一点,则该点落在阴影部分的概率为( )A. B. C. D.
【答案】B
【分析】求出 , 两点坐标,由阿基米德理论计算抛物线中弓形,从而得阴影部分面积,然后由几何
概型概率公式计算概率.
【详解】由题可知, , ,
,
由阿基米德理论可知:弓形面积为 , ,
概率 .
故选:B.
3.(2021·重庆高三三模)孪生素数猜想是希尔伯特在1900年提出的23个问题中的第8个:存在无穷多
个素数P,使得 是素数,素数对 称为孪生素数,2013年华人数学家张益唐发表的论文《素
数间的有界距离》第一次证明了存在无穷多组间距小于定值的素数对,那么在不超过16的素数中任意取出
不同的两个.可组成孪生素数的概率为( )
A. B. C. D.
【答案】A【分析】先列出不超过16以内的素数,然后利用列举法写出在这些素数中任取两个构成素数对的所有可能
情况,得出为孪生素数的个数,然后计算其概率.
【详解】不超过16的素数有 , , , , , ,共 个,任取两个构成素数对,则有:
, , , , , , , , , , , ,
, , ,共 中取法,而是孪生素数的有 , , ,这三种取法,所
以其概率为 .
故选:A.
【点睛】方法点睛:本题考查古典概型及概率计算,一般可采用列举法、列表法或树状图法求解.
4.(2021·广西南宁三中高三其他模拟(文))英因数学家泰勒(B.Taylor,1685-1731)以发现泰勒公式和泰
勒级数闻名于世.由泰勒公式,我们能得到 (其中 为自然对数的底数,
, ),其拉格朗日余项是 .可以看出,右边的项用得
越多,计算得到的 的近似值也就越精确.若 近似地表示 的泰勒公式的拉格朗日余项 , 不超
过 时,正整数 的最小值是( )
A.5 B.6 C.7 D.8
【答案】B
【分析】根据题意建立不等式,利用验证的方式求解即可.
【详解】依题意得 ,即 , ,,所以 的最小值是6.
故选:B
5.(2021·天水市第一中学高三其他模拟(文))我国古代数学名著《数书九章》中有“米谷粒分”问题;
“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒内
有谷二十八颗,凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来米1534
石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.153石 B.154石 C.169石 D.170石
【答案】C
【分析】这批米内夹谷约为 石,则 ,由此能求出这批米内夹谷数量.
【详解】这批米内夹谷约为 石,根据题意可得
解得
故选:C
6.(2021·合肥市第六中学高三其他模拟(文))质检机构为检测一大型超市某商品的质量情况,从编号
为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号
一定被抽到的是( )
A.112 B.53 C.38 D.9
【答案】A
【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.
【详解】由题意知,组距为 ,
设第一组抽取编号为 ,则第 组抽取的编号为 ,
样本中含有编号67的商品,即 ,可得 ,
因为 ,即第8组中抽取商品的编号为 .
故选:A.7.(2021·陕西西安市·西安中学高三其他模拟(文))某单位有200名职工,现用系统抽样法,从中抽取
40名职工作样本,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,
196~200号).若第5组抽出的号码为22,则第9组抽出的号码应是___________.
【答案】42
【分析】利用系统抽样法的特性,及第5组抽出的号码为22,分析出抽出的各组号码的共同属性即可得解.
【详解】因系统抽样即为等距离抽样,即各组抽出的号码依次排成一列,组成以第一组所抽号码为首项,
相邻两组间距离为公差的等差数列,
40个号码依次排成一列构成等差数列 , ,公差 ,
所以第9组抽出的号码应是 .
故答案为:42
8.(2021·黑龙江哈尔滨市第六中学校高三三模(文))从 中任取两个数,它们均小于这五个
数的平均数的概率是_________________.
【答案】 .
【分析】先计算 的平均数,然后分析基本事件的总数以及满足选取的两个数都小于平均数的
基本事件个数,由此可求目标事件的概率.
【详解】解: 的平均数为: ,
从 中任取两个数,基本事件总数 ,
它们均小于这五个数的平均数包含的基本事件个数 ,
∴它们均小于这五个数的平均数的概率 .
故答案为: .
9.(2021·河南高三其他模拟(文))由一组样本点 、 、 、 、 ,根据最小二乘法求得的回归方程为 ,则 ___________.
【答案】
【分析】求出样本中心点的坐标,代入回归直线方程即可求得 的值.
【详解】由已知条件可得 , ,
将点 的坐标代入回归直线方程可得 ,解得 .
故答案为: .
10.(2021·四川德阳市·高三二模(文))如图是一次数学考试成绩的样本频率分布直方图(样本容量
),若成绩在60分到80分之间的学生称为“临界生”,那么样本中“临界生”人数约为
___________.
【答案】30
【分析】利用频率直方图,结合频率的计算方法以及频数、频率、样本容量之间的关系,求解即可.
【详解】解:由频率分布直方图可得,样本中“临界生”人数约为:
(人 .故答案为:30.
11.(2021·陕西西安市·西北工业大学附属中学高三其他模拟(文))利用计算机产生0~1之间的均匀随
机数 ,则事件“ ”发生的概率为___________.
【答案】
【分析】所求概率为几何概型长度的比值,求出 的范围计算比值即可.
【详解】解: ,即 ,
又 为计算机产生0~1之间的均匀随机数,所以 ,则所求概率为长度比,
所以发生的概率为 .
故答案为: .
12.(2021·全国高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了
比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可
【详解】(1)甲机床生产的产品中的一级品的频率为 ,
乙机床生产的产品中的一级品的频率为 .
(2) ,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
13.(2021·陕西高三其他模拟(文))某社区随机选取了部分居民,调查他们对今年春节期间社区组织文
艺和体育活动的意见(每人只选择其中一项),调查结果如下表所示:
文艺活动 体育活动
男性居民
女性居民
(1)估计该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率;
(2)判断能否有 的把握认为居民选择的活动类型与性别有关.
附: ,其中 .
【答案】(1)该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率均为 ;(2)有,
理由见解析.
【分析】(1)利用表格中数据可计算得出该社区男性居民中选择体育活动的概率和全体居民中选择文艺
活动的概率;(2)计算出 的观测值,结合临界值表可得出结论.
【详解】(1)由表格中的数据可知,该社区男性居民中选择体育活动的概率为 ,
该社区全体居民中选择文艺活动的概率 ;
(2)由表格中数据可得 ,
因此,有 的把握认为居民选择的活动类型与性别有关.
14.(2021·四川遂宁市·高三三模(文))我国的高等教育中对于硕士研究生的培养,按照培养方向分类,
可分为普通硕士和专业硕士两类;一类是普通硕士,根据我国的有关规定,普通硕士教育以培养教学和科
研人才为主,授予学位的类型主要是学术型学位.另一类是专业硕士,根据国务院学位委员会的定位,专业
型学位为具有职业背景的学位,培养特定职业高层次专门人才.专业硕士教育的学习方式比较灵活,大致可
分为在职攻读和全日制学习两类.某大学团委为了解该校大学一年级的学生对未来的考硕士研究生的规划,
从中随机抽取容量为100的样本,其中有考硕士研究生规划的有24人(其中有考普通硕士规划的6人中,2
名是男生,4名是女生).
(1)若从样本中选一位学生,那么该同学是有考普通硕士规划的概率有多大?
(2)从这6名有考普通硕士规划的学生中,选出3个人,求其中男生至少一人的概率.
【答案】(1) ;(2) .
【分析】(1)利用事件样本数除以样本总数即得所求;
(2)利用列举法计数,求得从6人中任取3人的取法种数,并计数至少有一个男生的取法种数,然后根据
古典概型公式计算.
【详解】(1)样本容量为 ,其中有考普通硕士规划的有 人,
故该同学是有考普通硕士规划的概率 ;
(2)设男生为 ,女生 ,从 人中选取 人的所以情况有:, , , , , , , , , , ,
, , , , , , , , 共 种情况,
至少有一个男生的有 种情况,
故其中男生至少一人的概率 .
15.(2021·河南高三其他模拟(文))2021年7月1日是中国共产党百年华诞,某社区将组织主题为“红
歌献给党”的百人大合唱,将这100人的年龄分成 , , , , ,
, 7段后得到如图所示的频率分布直方图.
(1)求这100人年龄的平均数(同一组中的数据用该组的区间中点值代表),并求中位数的估计值;
(2)若从样本中年龄在 的人员中按分层抽样法选取5人,然后从这5人中选出2人做领队,求这
2名领队分别来自 与 两组的概率.
【答案】(1)平均数为 ,中位数的估计值为 ;(2) .
【分析】(1)将每组数据的组中值乘以频率,再将结果相加即可得到平均数;根据频率分布直方图计算
频率之和为 时对应的年龄即为中位数;(2)先根据分层抽样计算出 , 中抽取的人数,然后列出所有基本事件,再找出满足条件
的基本事件,根据基本事件的数量之比求解出对应概率.
【详解】解:(1)这100人年龄的平均数为
,
前两组数据所占频率之和为 ,
前三组数据所占频率之和为 .
设中位数的估计值为 ,则 ,解得 .
(2)由题意可知,年龄在 内的人数为 , 内的人数为 ,
按分层抽样法选取 人,则在 内抽取 人,记为 , , ,
在 内抽取 人,记为 , .
从这 人中选出 人做领队的所有情况是 , , , ,
, , , , , ,共 种.
这2名领队分别来自 与 两组的情况有 , , ,
, , ,共 种.
所以这 名领队分别来自 与 两组的概率 .
16.(2021·黑龙江哈尔滨市·哈尔滨三中高三其他模拟(文))2021年春节,由贾玲导演的春节档电影
《你好,李焕英》总票房已突破50亿元,影片的感人情节引起同学们广泛热议.开学后,哈三中团委在高
二年级中(其中男生200名,女生150名),对是否观看该影片进行了问卷调查,各班男生观看人数统计记
为 组,各班女生观看人数统计记为 组,得到如图的茎叶图.(1)根据茎叶图补全 列联表;
观看 没观看 合计
男生 200
女生 150
合计 350
(2)判断是否有 的把握认为观看该影片与性别有关?
0.05 0.025 0.005 0.001
3.841 5.024 7.879 10.828
, .
【答案】(1)列联表答案见解析;(2)没有 的把握认为观看该影片与性别有关.
【分析】(1)根据已知条件填写 列联表.
(2)计算 的值,由此作出判断.
【详解】(1)依题意得
观看 没观看 合计
男生 140 60 200
女生 120 30 150
合计 260 90 350
(2) ,
所以没有 的把握认为观看该影片与性别有关.17.(2021·四川成都市·树德中学高三其他模拟(文))某公司为确定下一年度投入某种产品的宣传费,
需了解年宣传费对年销售量(单位: )的影响.该公司对近7年的年宣传费和年销售量数据进行了研究,发
现年宣传费 (万元)和年销售量 (单位: )具有线性相关关系,并对数据作了初步处理,得到下面的一些
统计量的值.
(万元) 1 2 3 4 5 6 7
(单位: ) 2.8 5.3 6.8 9.2 10.9 13.2 14.8
(1)根据表中数据建立年销售量 关于年宣传费 的回归方程(结果保留到0.001);
(2)已知这种产品的年利润 与 , 的关系为 ,根据(1)中的结果,估算该公
司应该投入多少宣传费,才能使得年利润z最大.
附:回归方程 中的斜率和截距的最小二乘法估计公式分别为
, ,参考数据: ,
【答案】(1) ;(2) (万元).
【分析】(1)由题求得 ,代入最小二乘估计公式,求得 ,从而求得回归方程;
(2)根据(1)中结果,知 ,在对称轴处
取最大值.
【详解】(1)由题意 ,, ,
所以 ;
(2)由(1)知 ,
可知,当 时,年利润 最大,
所以估算该公司.应该投入3.992万元宣传费,才能使得年利润最大.
18.(2021·四川德阳市·高三二模(文))针对时下的“网络文学热”,某班团委对“学生性别是否与喜
欢网络文学有关”作了一次抽样调查,在抽取的样本中,女生人数是男生人数的 ,男生喜欢“网络文
学”的人数占男生人数的 ,女生喜欢“网络文学”的人数占女生人数的 .设抽取的男生人数为
.
(1)完成 列联表,若有95%以上的把握认为喜欢“网络文学”与性别有关,求男生人数 的最小值;
喜欢网络文学 不喜欢网络文学 总计
男生
女生
(2)已知数学科代表女生甲和语文科代表男生乙都喜欢网络文学且都在样本中,当 取(1)中的最小值
时,从喜欢网络文学的同学中抽取3名同学进行问卷调查,求同时抽到女生甲及男生乙的概率.
附: , .
【答案】(1)列联表答案见解析,男生人数 的最小值为 ;(2) .【分析】(1)根据已知条件填写 列联表,计算出 ,由此列不等式,从而求得 的最小值.
(2)利用列举法,结合古典概型概率计算公式,计算出所求概率.
【详解】(1) 列联表为
喜欢网络文学 不喜欢网络文学 总计
男生
女生
总计
所以 .
故男生人数 的最小值为 .
(2)喜欢网络文学的同学中有男生2人(包含乙),女生4人(包含甲).
分别用 ,乙表示男生,1,2,3,甲表示女生,则从6人中任意抽取3人的所有可能情况为
乙1, 乙2, 乙3, 乙甲, , , 甲, , 甲, 甲,
乙12,乙13,乙1甲,乙23,乙2甲,乙3甲,
123,12甲,13甲,23甲,共20种,
其中同时抽到女生甲及男生乙的有 乙甲,乙1甲,乙2甲,乙3甲共4种情况,
所以同时抽到女生甲及男生乙的概率为 .
19.(2021·四川省绵阳南山中学高三其他模拟(文))2020年3月,工业和信息化部信息通信发展司发布
《工业和信息化部关于推动5G加快发展的通知》,鼓励基础电信企业通过套餐升级优惠、信用购机等举
措,促进5G终端消费,加快用户向5G迁移.为了落实通知要求,掌握用户升级迁移情况及电信企业服务
措施,某巿调研部门]随机选取了甲、乙两个电信企业的用户共165户作为样本进行满意度调查,并针对企
业服务措施设置了达标分数线,按照不低于80分的定为满意,低于80分的为不满意,调研人员制作了如
图所示的 列联表.满意 不满意 合计
甲企业用户 75
乙企业用户 20
合计
已知从样本的165户中随机抽取1户为满意的概率是 .
(1)请将 列联表补充完整,并判断能否有95%的把握认为“满意度与电信企业服务描施有关系”?
(2)用分层抽样方法抽取6个对甲、乙企业服务不满意用户,再从这6个用户中随机抽取3个进行不满意
原因调查,求3个用户中有1个对甲企业不满意的概率.
下面临界值表仅供参考:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
(参考公式: ,其中 )
【答案】(1)填表见解析;有;(2) .
【分析】(1)根据题意分析数据进行填表,根据列联表计算卡方,最后根据独立性检验做出判断即可;
(2)根据分层抽样确定抽样取的6户中,不满意甲的有2户,不满意乙的有4户,接着分析从这6个用户中
随机抽取3个的所有情况,再列出所有满足事件“3个用户中有1个对甲企业不满意”的基本事件,最后
根据古典概型公式计算概率即可.
【详解】解:(1)设样本中乙企业用户中满意的有 户,结合列联表知
所以, 列联表是:
满意 不满意 合计
甲企业用户 75 10 85
乙企业用户 60 20 80
合计 135 30 165所以, 列联表是:
从而 ,
故可以判断有95%的把握认为“满意度与电信企业服务措施有关系”
(2)由(1)可知,对甲不满意的由10户,对乙不满意的由20户,按系统抽样取6户,则不满意甲的取2
户,用 , 表示,不满意乙的取4户,用1,2,3,4表示,从其中取3户的基本事件有:
, , , , , , , , , , , , , ,
, ,123,124,134, 共20个且互斥,
其中符合要求的有 , , , , , , , , , , , 共
12个基本事件,
设有1个对甲企业不满意为事件 ,
则 ,
故3个用户中有1个对甲企业不满意的概率为 .
20.(2021·河南高三其他模拟(文))某生物研究小组准备探究某种蜻蜒的翼长分布规律,随机捕捉20
只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶图和一部分频率分布直方
图,其中基叶图中有一处数字看不清(用 表示),但已知茎叶图中每一行的数据都按照从小到大的顺序
排列且无相同数据频率分布直方图每个分组含左端点不含右端点.
(1)求 的值;
(2)根据茎叶图将频率分布直方图补充完整;(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以更准确地反映蜻
蜓翼长的总体情况.
【答案】(1) ;(2)作图见解析;(3)茎叶图,中位数为 ;频率分布直方图中,中位数为
50;答案见解析.
【分析】(1)先计算出 区间中的个体数,然后根据茎叶图分析 的取值;
(2)根据茎叶图分别计算 , , , , 对应的频率除以组距的值,
由此可补充频率分布直方图;
(3)茎叶图:取第 个和第 数据相加然后除以 即可得到结果;频率分布直方图:计算频率和为
时对应的横坐标的值即为中位数;然后根据茎叶图、频率分布直方图对数据的保存特点分析哪一个统计图
的中位数更准确地反映蜻蜓翼长的总体情况.
【详解】解:(1) 区间对应的个体个数为 ,对应的三个数据分别为41,42,
43,
因此 必须要大于4且小于6,从而 .
(2)区间 , , , , 对应的纵坐标分别为
, , , , .
所以频率分布直方图如下:
(3)根据茎叶图,中位数为 .频率分布直方图中,区间 的频率为 ,因此中位数为50.
利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据的分组对数字特征
的估计结果也有影响;
茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况.
21.(2021·贵州黔东南苗族侗族自治州·凯里一中高三三模(文))2020年7月29日,贵州省林业局发布
全省2019年度森林覆盖率,黔东南州森林覆盖率为 ,这是自2012年全省开展小康森林覆盖率指
标监测工作以来,黔东南州连续 年位居全省市州第一,“绿水青山就是金山银山”已成为新时代中国特
色社会主义生态文明建设的重要内容.某社团在一次研学旅活动中,为了解某苗圃基地的红豆杉幼苗生长情
况,从基地的树苗中随机抽取了 株测量高度(单位: ),经统计,树苗的高度均在区间 内,
将其按 , , , , , 分成 组,制成如图所示的频率分布
直方图:
(1)求直方图中 的值,并估计树苗的平均高度;
(2)该社团决定从树苗的高度在 中采用分层抽样的方法抽取 株树苗带回学校栽种,然后再从这
株树苗中随机抽取 株跟踪研究,求恰有 株树苗高度在 的概率.
【答案】(1) ,平均数为 ;(2) .【分析】(1)根据频率分布直方图的所有矩形面积之和为1,可得 1
进一步计算出a,则根据频率分布直方图可算出树苗的平均高度的估计值.
(2)根据题意可先分别计算出树苗高度在[36,37)、[37,39)、[39,41]内的数量,再根据古典概型的概率
公式计算出所求概率.
【详解】解:(1)由于频率分布直方图的所有矩形面积之和为 ,
则 ,解得 ,
第一、二、三、四、五、六组的频率分别为 、 、 、 、 、 ,
则平均数为 .
(2)由题意可知,树苗高度在 内的有 株,在 内的有 株,
在 内的有 株,
则树苗高度在 内抽取 株,在 内抽取 株,在 内抽取
株,
记树苗高度在 内的 株为 , ,在 内的 株为 , ,在 内的 株为 ,
则从 株树苗中随机抽取3两株的基本事件有 , , , ,
, , , , , 共 种,其中恰有 株树苗高度
在 的有 种,
故所求概率为 .
22.(2021·黑龙江大庆市·大庆实验中学高三其他模拟(文))某企业销售部门为了解员工的销售能力,
设计了关于销售的问卷调查表,从该部门现有员工中性别(男生占45%)分层抽取n名进行问卷调查,得分分为1,2,3,4,5五个档次,各档次中参与问卷调查的员工的人数如条形图所示,已知第5档员工的人
数占总人数的 .
(1)(i)求n与a的值;
(ii)若将某员工得分所在的档次作为该员工的销售能力基数(记销售能力基数 为能力基数高,其他
均为能力基数不高).在销售能力基数为5的员工中,女生与男生的比例为7∶3,以抽的n名员工为研究对
象,完成下面的 列联表,并判断是否有90%的把握认为销售能力基数高不高与性别有关.
男生 女生 合计
销售能力基数高
销售能力基数不高
合计
(2)为提高员工的销售能力,部门组织员工参加各种形式的培训讲座,经过培训,每位员工的营销能力
指数y与销售能力基数 以及参加培训的次数t满足函数关系式 .如果员工甲的销
售能力基数为4,员工乙的销售能力基数为2,则在甲不参加培训的情况下,乙至少需要参加多少次培训,
其营销能力指数才能超过甲?
参考数据及参考公式: ,
附: ,其中 .
0.15 0.10 0.05 0.012.072 2.706 3.841 6.635
【答案】(1)(i) ;(ii)列联表答案见解析,没有90%的把握认为销售能力基数高不高
与性别有关;(2)乙至少需要参加17次培训,其营销能力指数才能超过甲.
【分析】(1)(i)根据题意,列方程求出n、a的值;
(ii)根据题意,填写 列联表,计算出K2,对照临界值表即可得出结论;
(2)计算员工甲的学习能力以及员工乙在参加了t次学习方法课程后的学习能力,建立不等式即可求解.
【详解】解:(1)(i)由题意,可得 ,所以 ;
(ii) 列联表如表所示:
男生 女生 合计
销售能力基数高 6 14 20
销售能力基数不高 39 41 80
合计 45 55 100
∴ ,
所以没有90%的把握认为销售能力基数高不高与性别有关;
(2)员工甲不参加培训的营销能力指数 ,
员工乙参加t次培训后的营销能力指数 ,
由已知得 ,则 ,
所以乙至少需要参加17次培训,其营销能力指数才能超过甲.
23.(2021·黑龙江哈尔滨市第六中学校高三三模(文))“一本书,一条街,一教堂,一条江”曾是哈尔
滨的城市名片,而现在“哈马”又成为了哈尔滨的另一张名片,随着全民运动健康意识的提高,马拉松运
动不仅在哈尔滨,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人口逐年增加.为此,某市对
人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数 不大于2天 3天或4天 不少于5天
人数 30 130 40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否能有99%的把握认为“是否热烈参与
马拉松”与性别有关?
热烈参与者 非热烈参与者 合计
男 140
女 55
合
计
参考公式及数据:K2= ,其中n=a+b+c+d.
P
0.15 0.10 0.05 0.025 0.010 0.005 0.001
(K2≥k)
0
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
【答案】(1)4000人;(2)填表见解析;能有99%的把握认为“是否热烈参与马拉松”与性别有关.
【分析】(1)以频率作为概率计算求解即可;
(2)补全2×2列联表,计算K2的值,对照临界表中的数据,判断即可.
【详解】(1)以200人中“热烈参与者”的频率作为概率,
则该市2万人参与马拉松运动,其中“热烈参与者”的人数约为 =4000人;
(2)由题意,2×2列联表如下:
热烈参与者 非热烈参与者 合计
男 35 105 140
女 5 55 60
合计 40 160 200因为K2= ,
所以能有99%的把握认为“是否热烈参与马拉松”与性别有关.
24.(2021·合肥市第六中学高三其他模拟(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,
树木的高度也就越高.某块山地上种植了 树木,某农科所为了研究 树木的根部半径与树木的高度之间
的关系,从这些地块中用简单随机抽样的方法抽取6棵 树木,调查得到 树木根部半径 (单位:米)与
树木高度 (单位:米)的相关数据如表所示:
0.1 0.2 0.3 0.4 0.5 0.6
1.1 1.3 1.6 1.5 2.0 2.1
(1)求 关于 的线性回归方程;
(2)对(1)中得到的回归方程进行残差分析,若某 树木的残差为零则认为该树木“长势标准”,在此
片树木中随机抽取1棵 树木,估计这棵树木“长势标准”的概率.
参考公式:回归直线方程为 ,其中 , .
【答案】(1) ;(2)
【分析】(1)由最小二乘法先求样本点中心 ,再代入公式求 ,即可得到答案;
(2)先计算6棵A树木中残差为零的有3棵,占比为 ,即可得到答案;
【详解】(1)由 ,
,
,,
有 ,
,
故 关于 的回归方程为: .
(2)当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
由这6棵A树木中残差为零的有3棵,占比为 ,
这棵树木“长势标准”的概率为 .
25.(2021·黑龙江哈尔滨市·哈九中高三其他模拟(文))十三届全国人大三次会议表决通过了《中华人
民共和国民法典》这部法律自 年 月 日起施行,某市相关部门进行法律宣传,某宣传小分队记录了
前 周每周普及宣传的人数与时间的数据,得到下表:
时间 周
人数(1)若可用线性回归模型拟合 与 的关系,求 关于 的线性回归方程;
(2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.
参考公式及数据:
回归方程 中斜率和截距的最小二乘估计公式分别为 , ,
.
【答案】(1) ;(2)预测该宣传小分队第 周普及宣传《民法典》的人数为 .
【分析】(1)求出 、 的值,将表格中的数据代入最小二乘法公式,求出 、 的值,可得出 关于
的线性回归方程;
(2)将 代入回归直线方程,可得出结果.
【详解】(1)由题意得 , ,
,
所以 ,
所以 ,
所以线性回归方程为 ;
(2)由(1)知 ,令 ,解得 ,故预测该宣传小分队第 周普及宣传《民法典》的人数为 .
26.(2021·吉林白城市·白城一中高三其他模拟(文))企业在商业活动中有依法纳税的基本义务,不依
法纳税叫做逃税,是一种违法行为.某地区有2万家企业,政府部门抽取部分企业统计其去年的收入,得
到下面的频率分布表.根据当地政策综合测算,企业应缴的税额约为收入的5%,而去年该地区企业实际
缴税的总额为291亿元.
收入(千万元)
频率 0.3 0.5 0.12 0.06 0.02
(1)估计该地区去年收入大于等于4千万元的企业数量;
(2)估计该地区企业去年的平均收入,并以此估计该地区逃税的企业数量;
注:每组数据以区间中点值为代表,假设逃税的企业缴税额为0,未逃税的企业都足额缴税.
【答案】(1)4000;(2) (亿元),600.
【分析】(1)先根据表格计算收入大于等于4千万元的频率,再计算企业的数量即可;
(2)利用平均数的计算公式求出该企业去年的平均收入,先计算未逃税的企业数量,从而求出该地区逃
税的企业数量.
【详解】(1)去年收入大于等于4千万元的频率为 ,
所以估计该地区去年收入大于等于4千万元的企业数量为 .
(2)该地区企业去年的平均收入的估计值为 (千万元).
平均缴税额为 (千万元) (亿元),
所以未逃税的企业数量为 ,
因此逃税的企业数量为 .