文档内容
第 01 讲 统计
一、单选题
1.为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机
抽取100名家长进行评分调查,发现他们的评分都在40~100分之间,将数据按 ,
, , , , 分成6组,整理得到如图所示的频率分布
直方图,则在抽取的家长中,评分落在区间 内的人数是( )
A.55 B.60 C.70 D.75
【答案】D
【分析】根据频率直方图求出 内频率,进而求出其中的人数.
【详解】由题图, 内频率为 ,
所以评分落在区间 内的人数是 人.
故选:D
2.某旅行社统计了三条路线的旅游人数,具体分布如下表(每人参加且仅参加一条路线):
南北湖景区 东湖景区 西塘古镇景区
男性 30 60
女性 50 40 60
现要对这三条路线的选择情况进行抽样调查,从参加这三条路线的人中采用按小组分层随
机抽样的方法抽取60人,从参加南北湖景区路线的人中抽出16人,则 ( )
A.30 B.60 C.80 D.100
【答案】B
【分析】由分层抽样按比例求出各景区抽取的人数后可得 值.
【详解】设东湖景区抽取的人数为 ,则 , ,从而西塘古镇景区抽取的人数为 ,
因此 , .故选:B.
3.现给出一位同学在7月和8月进行的50米短跑测试成绩(单位:秒):
7月 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
8月 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
记7月、8月成绩的样本平均数分别记为 , ,样本方差分别记为 , .①已知统计
量 可在一定程度上说明两个月跑步成绩的稳定性(当 或 时,可
认为成绩不稳定);②若满足 ,则可说明成绩有显著提高.则这位同学
( )
A.成绩稳定,且有显著提高 B.成绩稳定,且无显著提高
C.成绩不稳定,且有显著提高 D.成绩不稳定,且无显著提高
【答案】B
【分析】利用数表分别计算 , , , ,结合①②条件即可求解.
【详解】由题意可知, ,
,
由方差公式可知, , ,
故 , ,
从而成绩稳定;
而 ,
从而成绩无显著提高.
故选:B.
4.某校举行演讲比赛,邀请7位评委分别给选手打分,得到7个原始评分.在评定选手成
绩时,从这7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.这5个有效
评分与7个原始评分相比,数字特征保持不变的是( )
A.众数 B.标准差 C.平均数 D.中位数
【答案】D【分析】根据评分的规则容易判断选项.
【详解】7个数去掉一个最高分,去掉一个最低分,显然中位数是不变的;
故选:D.
5.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否
与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的 倍,有 的男
生喜欢滑冰,有 的女生喜欢滑冰.若根据独立性检验的方法,有 的把握认为是否喜
欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式: ,其中 .
参考数据:
A. B. C. D.
【答案】C
【分析】设男生人数为 ,则女生人数为 ,且 ,写出列联表并根据卡方计算公式,
结合题意确定卡方值的范围,即可确定 的取值范围,进而确定男生可能人数.
【详解】设男生人数为 ,则女生人数为 ,且 ,
可得列联表如下:
男生 女生 合计
喜欢滑冰
不喜欢滑
冰
合计
所以 ,
因为有 的把握认为是否喜欢滑冰和性别有关,
所以 ,解得 ,
所以 ,结合选项只有 ,故选:C.6.下列说法中错误的是( )
A.对于命题p:存在 ,使得 ,则 :任意 ,均有
B.两个变量线性相关性越强,则相关系数 就越接近1
C.在线性回归方程 中,当变量x每增加一个单位时, 平均减少0.5个单位
D.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变
【答案】D
【分析】A选项,存在量词命题的否定是全称量词命题,把存在改为任意,把结论否定;
B选项,相关系数 就越接近1,则两个变量线性相关性越强;
C选项,根据线性回归方程的解析式中 的系数得到结论;
D选项,计算出添加新数据4后的方程,作出判断.
【详解】存在 ,使得 ,的否定是:任意 ,均有 ,A正
确;
两个变量线性相关性越强,则相关系数 就越接近1,B正确;
在线性回归方程 中 的系数为 ,当变量x每增加一个单位时, 平均减少
0.5个单位,C正确;
某7个数 的平均数为4,方差为2,则 ,
现加入一个新数据4,则平均数不变,仍为4,此时这8个数的方差变为 ,
故D错误.故选:D
7.以模型 去拟合一组数据,设 将其变换后得到线性回归方程
,则原模型中 的值分别是( )
A. , B. ,
C. , D. ,
【答案】B
【分析】根据已知条件,结合对数函数的公式可得, 再结合线性回归方程即
可求解.
【详解】
两边取对数,可得 ,
令 可得∵线性回归方程
∴ , 解得 .故选:B.
二、填空题
8.为了调查高中学生参加课外兴趣活动选篮球和舞蹈是否与性别有关,现随机调查了30
名学生,得到如下图 列联表:
篮球 舞蹈 合计
男 13 7 20
女 2 8 10
合计 15 15 30
根据表中的数据,及观测值 (其中 )的参考数据:
0.05 0.025 0.010
3.841 5.024 6.635
则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.
【答案】0.025
【分析】由列联表中的数据,计算 的值,对照表中的参考数据,比较即可得到答案.
【详解】由列联表中的数据可得,
所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.
故答案为:0.025.
9.下列说法中错误的有______.
(1)残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
(2)两个模型中残差平方和越小的模型拟合的效果越好;
(3)设随机变量 服从正态分布 ,若 ,则 ;
(4)根据下表提供的数据,线性回归方程 ,那么表中 .
3 4 5 6
2.4 3.8 4.6
【答案】(1)(4)
【分析】(1)根据残差的概念与残差图的特点即可判断;
(2)根据残差平方和的概念即可判断;(3)根据正态分布 的性质求解并判断;
(4)根据表中数据计算 ,代入线性回归方程中求得 的值,即可判断.
【详解】对于(1),残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度
越高,所以(1)错误;
对于(2),两个模型中残差平方和越小的模型拟合的效果越好,所以(2)正确;
对于(3),根据正态分布 的性质可得,若 ,则 ,
, ,所以(3)正确;
对于(4),根据表中数据,计算 ,
,代入线性回归方程 中,得
,解得 ,所以(4)错误.
故答案为:(1)(4).
10.在某次数学测验中,6位学生的成绩分别为:78,85, ,82,75,80,他们的平均成
绩为81,则他们成绩的75%分位数为_________.
【答案】85
【分析】根据百分位数的定义求解即可.
【详解】解:由题意知 ,
解得 ,
把这组数据按从小到大的顺序记为:75,78,80,82,85,86,
指数 ,
因此,这组数据的75%分位数为85.
故答案为:85.
三、解答题
11.特岗教师是中央实施的一项对中西部地区农村义务教育的特殊政策,通过公开招聘高
校毕业生到中西部地区"两基"攻坚县、县以下农村学校任教,进而提高农村教师队伍的整
体素质,促进城乡教育均衡发展.某市招聘特岗教师需要进行笔试和面试,一共有600名应
聘者参加笔试考试,从中随机抽取了100名应聘者,记录他们的笔试分数,将数据分成7
组: , ,…, ,得到如图所示频率分布直方图.(1)若该市计划168人进入面试,请估计参加面试的最低分数线;
(2)已知样本中笔试分数低于40分的有5人,试估计总体中笔试分数在 内的人数.
【答案】(1)78
(2)30
【分析】(1)根据题意求得进入面试的频率 ,再判断最低分数线 所在分数区间,
结合频率的计算公式得到方程,解之即可;
(2)由频率分布直方图求得不低于50分的频率,由题意求得分数低于40分的频率,从而
求得笔试分数在 内的频率,再由频数等于总数乘以频率即可求得结果.
【详解】(1)根据题意,得进入面试的频率 ,
由频率分布直方图可知,笔试分数位于 、 的频率分别为0.4、0.2,
所以设参加面试的最低分数线 ,
得 ,解得 ,
故参加面试的最低分数线约为78.
(2)样本中笔试分数不低于50分的频率为: ,
样本中笔试分数低于40分的频率为: ,
所以样本中笔试分数在 内频率为: ,
故总体中笔试分数在 内的人数约为 (人)
12.根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染物中各年份的
氨氮总量 (单位:千吨)与年份的散点图如下:记年份代码为 , ,对数据处理后得:
6 0.5 1.5 210 76 17
(1)根据散点图判断,模型① 与模型② 哪一个适宜作为 关于 的回归方
程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立 关于 的回归方程,并预测2022年全国直排海污染物中
的氨氮总量(计算结果精确到整数).
参考公式:回归方程 中斜率和截距的最小二乘估计公式分别为:
, .
【答案】(1)模型②适宜作为 关于 的回归方程.
(2) 关于 的回归方程为 ,预计2022年全国直排海污染物中的氨氮总量为3吨
【分析】(1)可根据散点图判断出非线性回归方程模型.
(2)根据表中数据和参考数据代入公式求出回归方程,并可预测2022年全国直排海污染
物中的氨氮总量.
【详解】(1)根据散点图的趋势,可知模型②适宜作为 关于 的回归方程.
(2) , .
故 关于 的回归方程为 ,即 关于 的回归方程为 ,2022年对应的年份
代码为 , ,故预计2022年全国直排海污染物中的氨氮总量为3吨.一、单选题
1.某地区今年夏天迎来近50年来罕见的高温极端天气,当地气象部门统计了八月份每天
的最高气温和最低气温,得到如下图表:
某地区2022年8月份每天最高气温与最低气温
根据图表判断,以下结论正确的是( )
A.8月每天最高气温的平均数低于35℃
B.8月每天最高气温的中位数高于40℃
C.8月前半月每天最高气温的方差大于后半月最高气温的方差
D.8月每天最高气温的方差大于每天最低气温的方差
【答案】D
【分析】根据给定的每天最高气温与最低气温的折线图,结合平均数、中位数、方差的意
义逐项分析判断作答.
【详解】由某地区2022年8月份每天最高气温与最低气温的折线图知,
对于A,8月1日至9日的每天最高气温的平均数大于35℃,25日至28日的每天最高气温
的平均数大于35℃,
29日至31日每天最高气温大于20℃小于25℃,与35℃相差总和小于45℃,而每天最高气
温不低于40℃的有7天,
大于37℃小于40℃的有8天,它们与35℃相差总和超过45℃,因此8月每天最高气温的
平均数不低于35℃,A不正确;
对于B,8月每天最高气温不低于40℃的数据有7个,其它都低于40℃,把31个数据由小
到大排列,中位数必小于40,
因此8月每天最高气温的中位数低于40℃,B不正确;
对于C,8月前半月每天最高气温的数据极差小,波动较小,后半月每天最高气温的极差
大,数据波动很大,
因此8月前半月每天最高气温的方差小于后半月最高气温的方差,C不正确;
对于D,8月每天最高气温的数据极差大,每天最低气温的数据极差较小,
每天最高气温的数据波动也比每天最低气温的数据波动大,因此8月每天最高气温的方差
大于每天最低气温的方差,D正确.故选:D2.参加抗疫的300名医务人员,编号为1,2,…,300.为了解这300名医务人员的年龄
情况,现用系统抽样的方法从中抽取15名医务人员的年龄进行调查.若抽到的第一个编号
为5,则抽到的第二个编号为( )
A.35 B.30 C.25 D.20
【答案】C
【分析】将300个数编号:1,2,…,300,再平均分为15个小组,然后按系统抽样方法
得解.
【详解】将300个数编号:1,2,…,300,再平均分为15个小组,
则第一编号为5,第二个编号为 .故选:C
3.某微生物科研团队为了研究某种细菌的繁殖情况,工作人员配制了一种适合该细菌繁殖
的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的
细菌数 与时间 (单位:小时,且 )满足回归方程 (其中 为常数),若
,且前3个小时 与 的部分数据如下表:
1 2 3
3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数 与时间 (单
位:小时,且 )满足关系式: ,在 时刻,该细菌数达
到最大,随后细菌个数逐渐减少,则 的值为( )
A.4 B. C.5 D.
【答案】A
【分析】根据给定条件,求出样本中心点求出b值,再分段讨论y的最大值情况作答.
【详解】依题意, , ,由 , ,得 ,
且 经过点 ,
于是得 ,当 时, 单调递增,则当 时, ,
当 时, ,令 , ,
求导得: ,当 时, ,当 时,
,
即函数 在 上单调递增,在 上单调递减,当 时, ,
而 ,因此当 时,细菌数 取最大值,
所以 的值为4.故选:A4.某校高二(3)班举行迎新活动有十个不同的三等奖品,编号为01,02,…,10,现用
抽签法从中抽取3个奖品与高二(4)班进行奖品对换,设编号为02的奖品被抽到的可能
性为 ,编号为03的奖品被抽到的可能性为 ,则( )
A. , B. ,
C. , D. ,
【答案】B
【分析】由抽签法,只需3次抽签中任意一次抽到对应编号奖品即可,结合互斥事件加法、
独立乘法公式求概率.
【详解】02、03奖品被抽到,只需3次抽签中任意一次抽到即可,
所以它们被抽到的概率均为 ,即 , .
故选:B
5.以下四个命题中:
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,
这样的抽样是分层抽样;
②在线性回归分析中, 为0.98的模型比 为0.80的模型拟合的效果好;
③对分类变量X与Y的随机变量 的观测值 来说, 越小,判断“X与Y有关系的把握
程度越大;
④数据1,2,3,4的标准差是数据2,4,6,8的标准差的一半.
其中真命题的个数为( )
A.4 B.3 C.2 D.1
【答案】C
【分析】①根据系统抽样的定义进行判断,②根据回归方程中 的意义进行判断,③根据
分类变量X与Y的随机变量 的观测值 的关系进行判断,④根据数据方差之间的关系进
行判断.
【详解】①从匀速传递的产品生产流水线.上,质检员每10分钟从中抽取一件产品进行某
项指标检测,这样的抽样是系统抽样,故①错误;
②在线性回归分析中, 为0.98的模型比 为0.80的模型拟合的效果好,故 正确;
③对分类变量X与Y的随机变量 的观测值k来说,k越大,判断“X与Y有关系”的把
握程度越大,故 错误;
④ 两组数据满足 , 它们的方差满足 ,则标准差为
,即数据1,2,3,4的标准差是数据2,4,6,8的标准差的一半正确,故④正确.故选:C
6.下列说法正确的是( )
A.设 ,则
B.已知随机变量 服从正态分布 , ,则
C.随机变量 ,若 ,且 ,则
D.以模型 拟合一组数据时,为了求出回归方程,设 ,将其变换后得到线性
方程 ,则 , 的值分别是 和
【答案】D
【分析】利用二项式定理及赋值法可得各项系数,判断A选项;根据正态分布的对称性可
判断B选项;根据二项分布概率公式可得 及 ,进而可得 判断C选项;利用指
数与对数式的相互转化可判断D选项.
【详解】A选项: ,
,令 ,即 ,得 ,所以
,错误;
B选项:由已知可得该正态分布曲线的对称轴为 ,且 ,故
,错误;
C选项:由 得 ,解得 ,所以
,又 ,则 ,错误;
D选项:由 ,得 ,则 ,解得 ,正确;
故选:D.
7.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有 的男
大学生“不看”,有 的女大学生“不看”,若有99%的把握认为性别与是否看营养说明
之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
【答案】C
【分析】由题意列出2×2列联表,并计算出 ,根据有99%的把握认为性别与是否看营养
说明之间有关,列出不等式,解出 ,可得答案.【详解】设男女大学生各有m人,根据题意画出2×2列联表,如下图:
看 不看 合计
男 m
女 m
合计 2m
所以 ,因为有99%的把握认为性别与对产品是否满意
有关,所以 ,解得 ,所以总人数2m可能为240.
故选:C.
8.下列有关一元线性回归分析的命题正确的是( )
A.在经验回归方程 中,若解释变量 增加1个单位,则预测值 平均减少0.5
个单位
B.经验回归直线是经过散点图中样本数据点最多的那条直线
C.若两个变量的线性相关程度越强,则样本相关系数 就越接近于1
D.若甲、乙两个模型的决定系数 分别为0.87和0.78,则模型乙的拟合效果更好
【答案】A
【分析】根据回归方程的意义,逐项分析理解即可.
【详解】对于A,-0.5的含义就是x每增加一个单位,估计值 就平均减少0.5个单位,
故A正确;
对于B,确定回归直线的根据是误差最小,并不是经过的样本点最多,故B错误;
对于C,相关有正相关和负相关,共同点是相关性越强,相关系数的绝对值越接近于1,
故C错误;
对于D, 是描述拟合效果的, 越大拟合效果越好,应该是甲的拟合效果更好,故D
错误;
故选:A.
二、填空题
9.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常
把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限
x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据: , ,
, )
【答案】0.99
【分析】分别求出 , , ,再利用参考公式和数据计算即可.
【详解】由题意,知 ,
,
.
所以 .
所以y与x的相关系数近似为0.99.
故答案为:0.99.
10.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中
新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查
的男女生人数相同,得到如图所示的等高条形统计图,则下列说法中正确的有________.
①被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多
②被调查的女生中喜欢登山的人数比不喜欢登山的人数多
③若被调查的男女生均为100人,则可以认为喜欢登山和性别有关④无论被调查的男女生人数为多少,都可以认为喜欢登山和性别有关
【答案】①③
【分析】由等高堆积条形统计图可判断A、B;利用独立性检验,计算出 ,可判
断C、D.
【详解】因为被调查的男女生人数相同,由等高堆积条形统计图可知,喜欢登山的男生占
80%,喜欢登山的女生占30%,所以A正确,B错误;
设被调查的男女生人数均为n,则由等高堆积条形统计图可得列联表如下
男 女 合计
喜欢 0.8n 0.3n 1.1n
不喜欢 0.2n 0.7n 0.9n
合计 n n 2n
由公式可得: .
当 时, ,可以判断喜欢登山和性别有关,故C正确;
而 ,所以 的值与n的取值有关.故D错误.故答案为:①③.
三、解答题
11.第17届亚运会于2014年9月19日至10月4日在韩国仁川进行,为了搞好接待工作,
组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和
6人喜爱运动,其余人不喜爱运动.
(1)根据以上数据完成以下2×2列联表:
喜爱运动 不喜爱运动 总计
男 10 16
女 6 14
总计 30
(2)根据列联表的独立性检验,能否认为有99%把握性别与喜爱运动有关?
(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么
抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?参考公式:K2=
,其中n=a+b+c+d.
参考数据:P(K2≥k) 0.40 0.25 0.10 0.010
0
k 0.708 1.323 2.706 6.635
0
【答案】(1)答案见解析;
(2)没有99%把握认为性别与喜爱运动有关;
(3) .
【分析】(1)由已知数据完善列联表;
(2)计算 后可得结论;
(3)用列举法写出所有基本事件,得出所求概率事件包含的基本事件,计数概率.
【详解】(1)列联表如下:
喜爱运动 不喜爱运动 总计
男 10 6 16
女 6 8 14
总计 16 14 30
(2) 6.635,
所以没有99%把握认为性别与喜爱运动有关;
(3)喜欢运动的女志愿者有6人,编号为 其中 会英语能负责翻译工作,
从中任取2人,基本事件有 共15个,其中至
少有1人能胜任翻译工作的基本事件有 共14个,
所以所求概率为 .
12.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用
量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r
并加以说明(若 ,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为10千克时,西红柿亩产量的增
加量约为多少?附:相关系数公式 .
参考数据:
回归方程 中斜率和截距的最小二乘估计公式分别为
.
【答案】(1) ,说明见解析
(2) ;550千克
【分析】(1)根据散点图中的数据分别求得可得 , , , ,
,进而求得相关系数 ,再与0.75比较下结论.
(2)结合(1)中的数据,分别求得 , ,写出回归方程,然后将 代入求解.
(1)
由已知数据可得 , ,
所以 ,
,
,
所以相关系数 .
因为 ,所以可用线性回归模型拟合y与x的关系.
(2)
, ,
所以回归方程为 .当 时, .
即当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为550千克
13.红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害,每只红铃虫的平均产卵数
y和平均温度x有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
平均温度x/℃ 21 23 25 27 29 31 33
平均产卵数y/个 7 11 21 24 66 115 325
1.9 2.4 3.0 3.2 4.2 4.7 5.8
(1)根据散点图判断, 与 (其中 为自然对数的底数)哪一个更
适宜作为平均产卵数y关于平均温度x的回归方程类型?(给出判断即可,不必说明理
由)并由判断结果及表中数据,求出y关于x的回归方程,(计算结果精确到0.01)
(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防
治,其他情况均不需要人工防治,假设该地每年平均温度达到28℃以上的概率为p.若当
时,该地今后5年中恰好有3年需要人工防治的概率 最大,求 的值.
参考数据
5215 17713 717 81.3 3.6
附:回归方程 , , .
【答案】(1) 适宜作为卵数 关于温度 的回归方程类型, 关于 的回归方程为;
(2)当 时, .
【分析】(1)根据散点图判断 更适宜作为 关于 的回归方程类型;对 两
边取自然对数,求出回归方程,再化为 关于 的回归方程;
(2)由 对其求导数,利用导数判断函数单调性,求出函数的最值以及对应的 值.
(1)
解:由散点图可以判断, 适宜作为卵数 关于温度 的回归方程类型.
对 两边取自然对数,得 ,
令 , , ,则 ,
由数据得 ,
, ,
所以 , ,
所以 关于 的线性回归方程为 ,
则 关于 的回归方程为 ;
(2)由 得 ,
因为 ,令 得 ,解得 ;
所以 在 上单调递增,在 上单调递减,
所以 有唯一的极大值为 ,也是最大值;
所以当 时, .
一、单选题
1.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单
位: )的分组区间为 ,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已
知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(
)
A.8 B.12 C.16 D.18
【答案】B
【分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,
从而可以求得结果.
【详解】志愿者的总人数为 =50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.
故选:B.
2.分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
【答案】C
【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为 ,A选项
结论正确.
对于B选项,乙同学课外体育运动时长的样本平均数为:
B选项结论正确.
对于C选项,甲同学周课外体育运动时长大于 的概率的估计值 ,
C选项结论错误.
对于D选项,乙同学周课外体育运动时长大于 的概率的估计值 ,
D选项结论正确.故选:C
3.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10
位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在
讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为 ,所以 错;
讲座后问卷答题的正确率只有一个是 个 ,剩下全部大于等于 ,所以讲座后问卷答题的正确率的平均数大于 ,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确
率的标准差,所以C错;
讲座后问卷答题的正确率的极差为 ,
讲座前问卷答题的正确率的极差为 ,所以 错.故选:B.
4.在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,
为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和 的关
系,其中T表示温度,单位是K;P表示压强,单位是 .下列结论中正确的是( )
A.当 , 时,二氧化碳处于液态
B.当 , 时,二氧化碳处于气态
C.当 , 时,二氧化碳处于超临界状态
D.当 , 时,二氧化碳处于超临界状态
【答案】D
【分析】根据 与 的关系图可得正确的选项.
【详解】当 , 时, ,此时二氧化碳处于固态,故A错误.
当 , 时, ,此时二氧化碳处于液态,故B错误.
当 , 时, 与4非常接近,故此时二氧化碳处于固态,对应的是非超临
界状态,故C错误.
当 , 时,因 , 故此时二氧化碳处于超临界状态,故D正确.
故选:D
二、填空题
5.某创新企业为了解新研发的一种产品的销售情况,从编号为001,002,…480的480个
专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为
005,021,…则样本中的最后一个个体编号是______.
【答案】469
【分析】先求得编号间隔为16以及样本容量,再由样本中所有数据编号为 求解.
【详解】间隔为021-005=16,
则样本容量为 ,
样本中所有数据编号为 ,
所以样本中的最后一个个体的编号为 ,
故答案为:469
三、解答题
6.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本
数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间 的概率;
(3)已知该地区这种疾病的患病率为 ,该地区年龄位于区间 的人口占该地区总
人口的 .从该地区中任选一人,若此人的年龄位于区间 ,求此人患这种疾病的
概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,
精确到0.0001).
【答案】(1) 岁;
(2) ;
(3) .【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设 {一人患这种疾病的年龄在区间 },根据对立事件的概率公式
即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设 {一人患这种疾病的年龄在区间 },所以
.
(3)设 “任选一人年龄位于区间[40,50)”, “从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间 ,此人患这种疾病的概率为
.
7.在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到 以上(含
)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙
以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E
(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证
明)
【答案】(1)0.4
(2)
(3)丙
【分析】(1) 由频率估计概率即可
(2) 求解得X的分布列,即可计算出X的数学期望.
(3) 计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计
值最大.【详解】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,
故答案为0.4
(2)设甲获得优秀为事件A,乙获得优秀为事件A,丙获得优秀为事件A
1 2 3
,
,
,
.
∴X的分布列为
X 0 1 2 3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为 ,甲获得9.80
的概率为 ,乙获得9.78的概率为 .并且丙的最高成绩是所有成绩中最高的,比赛次数
越多,对丙越有利.
8.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材
积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量
(单位: ),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总
和为 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区
这种树木的总材积量的估计值.
附:相关系数 .
【答案】(1) ;
(2)
(3)
【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该
林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的
总材积量的估计值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为 ,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为 ,
又已知树木的材积量与其根部横截面积近似成正比,
可得 ,解之得 .
则该林区这种树木的总材积量估计为
9.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用
一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为
和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则
不认为有显著提高).
【答案】(1) ;(2)新设备生产产品的该项指标的均
值较旧设备有显著提高.
【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.
(2)根据题目所给判断依据,结合(1)的结论进行判断.
【详解】(1) ,
,
,
.
(2)依题意, , ,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.