文档内容
第 01 讲 统计
一、单选题
1.为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机
抽取100名家长进行评分调查,发现他们的评分都在40~100分之间,将数据按 ,
, , , , 分成6组,整理得到如图所示的频率分布
直方图,则在抽取的家长中,评分落在区间 内的人数是( )
A.55 B.60 C.70 D.75
2.某旅行社统计了三条路线的旅游人数,具体分布如下表(每人参加且仅参加一条路线):
南北湖景区 东湖景区 西塘古镇景区
男性 30 60
女性 50 40 60
现要对这三条路线的选择情况进行抽样调查,从参加这三条路线的人中采用按小组分层随
机抽样的方法抽取60人,从参加南北湖景区路线的人中抽出16人,则 ( )
A.30 B.60 C.80 D.100
3.现给出一位同学在7月和8月进行的50米短跑测试成绩(单位:秒):
7月 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
8月 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
记7月、8月成绩的样本平均数分别记为 , ,样本方差分别记为 , .①已知统计
量 可在一定程度上说明两个月跑步成绩的稳定性(当 或 时,可认为成绩不稳定);②若满足 ,则可说明成绩有显著提高.则这位同学
( )
A.成绩稳定,且有显著提高 B.成绩稳定,且无显著提高
C.成绩不稳定,且有显著提高 D.成绩不稳定,且无显著提高
4.某校举行演讲比赛,邀请7位评委分别给选手打分,得到7个原始评分.在评定选手成
绩时,从这7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.这5个有效
评分与7个原始评分相比,数字特征保持不变的是( )
A.众数 B.标准差 C.平均数 D.中位数
5.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否
与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的 倍,有 的男
生喜欢滑冰,有 的女生喜欢滑冰.若根据独立性检验的方法,有 的把握认为是否喜
欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式: ,其中 .
参考数据:
A. B. C. D.
6.下列说法中错误的是( )
A.对于命题p:存在 ,使得 ,则 :任意 ,均有
B.两个变量线性相关性越强,则相关系数 就越接近1
C.在线性回归方程 中,当变量x每增加一个单位时, 平均减少0.5个单位
D.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变
7.以模型 去拟合一组数据,设 将其变换后得到线性回归方程
,则原模型中 的值分别是( )
A. , B. ,
C. , D. ,
二、填空题
8.为了调查高中学生参加课外兴趣活动选篮球和舞蹈是否与性别有关,现随机调查了30名学生,得到如下图 列联表:
篮球 舞蹈 合计
男 13 7 20
女 2 8 10
合计 15 15 30
根据表中的数据,及观测值 (其中 )的参考数据:
0.05 0.025 0.010
3.841 5.024 6.635
则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.
9.下列说法中错误的有______.
(1)残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
(2)两个模型中残差平方和越小的模型拟合的效果越好;
(3)设随机变量 服从正态分布 ,若 ,则 ;
(4)根据下表提供的数据,线性回归方程 ,那么表中 .
3 4 5 6
2.4 3.8 4.6
10.在某次数学测验中,6位学生的成绩分别为:78,85, ,82,75,80,他们的平均成
绩为81,则他们成绩的75%分位数为_________.
三、解答题
11.特岗教师是中央实施的一项对中西部地区农村义务教育的特殊政策,通过公开招聘高
校毕业生到中西部地区"两基"攻坚县、县以下农村学校任教,进而提高农村教师队伍的整
体素质,促进城乡教育均衡发展.某市招聘特岗教师需要进行笔试和面试,一共有600名应
聘者参加笔试考试,从中随机抽取了100名应聘者,记录他们的笔试分数,将数据分成7
组: , ,…, ,得到如图所示频率分布直方图.(1)若该市计划168人进入面试,请估计参加面试的最低分数线;
(2)已知样本中笔试分数低于40分的有5人,试估计总体中笔试分数在 内的人数.
12.根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染物中各年份的
氨氮总量 (单位:千吨)与年份的散点图如下:
记年份代码为 , ,对数据处理后得:
6 0.5 1.5 210 76 17
(1)根据散点图判断,模型① 与模型② 哪一个适宜作为 关于 的回归方
程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立 关于 的回归方程,并预测2022年全国直排海污染物中
的氨氮总量(计算结果精确到整数).
参考公式:回归方程 中斜率和截距的最小二乘估计公式分别为:
, .一、单选题
1.某地区今年夏天迎来近50年来罕见的高温极端天气,当地气象部门统计了八月份每天
的最高气温和最低气温,得到如下图表:
某地区2022年8月份每天最高气温与最低气温
根据图表判断,以下结论正确的是( )
A.8月每天最高气温的平均数低于35℃
B.8月每天最高气温的中位数高于40℃
C.8月前半月每天最高气温的方差大于后半月最高气温的方差
D.8月每天最高气温的方差大于每天最低气温的方差
2.参加抗疫的300名医务人员,编号为1,2,…,300.为了解这300名医务人员的年龄
情况,现用系统抽样的方法从中抽取15名医务人员的年龄进行调查.若抽到的第一个编号
为5,则抽到的第二个编号为( )
A.35 B.30 C.25 D.20
3.某微生物科研团队为了研究某种细菌的繁殖情况,工作人员配制了一种适合该细菌繁殖
的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的
细菌数 与时间 (单位:小时,且 )满足回归方程 (其中 为常数),若
,且前3个小时 与 的部分数据如下表:
1 2 3
3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数 与时间 (单
位:小时,且 )满足关系式: ,在 时刻,该细菌数达
到最大,随后细菌个数逐渐减少,则 的值为( )
A.4 B. C.5 D.
4.某校高二(3)班举行迎新活动有十个不同的三等奖品,编号为01,02,…,10,现用抽签法从中抽取3个奖品与高二(4)班进行奖品对换,设编号为02的奖品被抽到的可能
性为 ,编号为03的奖品被抽到的可能性为 ,则( )
A. , B. ,
C. , D. ,
5.以下四个命题中:
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,
这样的抽样是分层抽样;
②在线性回归分析中, 为0.98的模型比 为0.80的模型拟合的效果好;
③对分类变量X与Y的随机变量 的观测值 来说, 越小,判断“X与Y有关系的把握
程度越大;
④数据1,2,3,4的标准差是数据2,4,6,8的标准差的一半.
其中真命题的个数为( )
A.4 B.3 C.2 D.1
6.下列说法正确的是( )
A.设 ,则
B.已知随机变量 服从正态分布 , ,则
C.随机变量 ,若 ,且 ,则
D.以模型 拟合一组数据时,为了求出回归方程,设 ,将其变换后得到线性
方程 ,则 , 的值分别是 和
7.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有 的男
大学生“不看”,有 的女大学生“不看”,若有99%的把握认为性别与是否看营养说明
之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
8.下列有关一元线性回归分析的命题正确的是( )
A.在经验回归方程 中,若解释变量 增加1个单位,则预测值 平均减少0.5
个单位
B.经验回归直线是经过散点图中样本数据点最多的那条直线
C.若两个变量的线性相关程度越强,则样本相关系数 就越接近于1
D.若甲、乙两个模型的决定系数 分别为0.87和0.78,则模型乙的拟合效果更好
二、填空题9.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常
把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限
x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据: , ,
, )
10.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中
新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查
的男女生人数相同,得到如图所示的等高条形统计图,则下列说法中正确的有________.
①被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多
②被调查的女生中喜欢登山的人数比不喜欢登山的人数多
③若被调查的男女生均为100人,则可以认为喜欢登山和性别有关
④无论被调查的男女生人数为多少,都可以认为喜欢登山和性别有关
三、解答题
11.第17届亚运会于2014年9月19日至10月4日在韩国仁川进行,为了搞好接待工作,
组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和
6人喜爱运动,其余人不喜爱运动.
(1)根据以上数据完成以下2×2列联表:
喜爱运动 不喜爱运动 总计
男 10 16女 6 14
总计 30
(2)根据列联表的独立性检验,能否认为有99%把握性别与喜爱运动有关?
(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么
抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?参考公式:K2=
,其中n=a+b+c+d.
参考数据:
P(K2≥k) 0.40 0.25 0.10 0.010
0
k 0.708 1.323 2.706 6.635
0
12.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用
量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r
并加以说明(若 ,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为10千克时,西红柿亩产量的增
加量约为多少?
附:相关系数公式 .
参考数据:
回归方程 中斜率和截距的最小二乘估计公式分别为
.
13.红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害,每只红铃虫的平均产卵数
y和平均温度x有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.平均温度x/℃ 21 23 25 27 29 31 33
平均产卵数y/个 7 11 21 24 66 115 325
1.9 2.4 3.0 3.2 4.2 4.7 5.8
(1)根据散点图判断, 与 (其中 为自然对数的底数)哪一个更
适宜作为平均产卵数y关于平均温度x的回归方程类型?(给出判断即可,不必说明理
由)并由判断结果及表中数据,求出y关于x的回归方程,(计算结果精确到0.01)
(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防
治,其他情况均不需要人工防治,假设该地每年平均温度达到28℃以上的概率为p.若当
时,该地今后5年中恰好有3年需要人工防治的概率 最大,求 的值.
参考数据
5215 17713 717 81.3 3.6
附:回归方程 , , .
一、单选题
1.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单
位: )的分组区间为 ,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已
知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(
)
A.8 B.12 C.16 D.18
2.分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
3.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10
位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在
讲座前和讲座后问卷答题的正确率如下图:则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
4.在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,
为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和 的关
系,其中T表示温度,单位是K;P表示压强,单位是 .下列结论中正确的是( )
A.当 , 时,二氧化碳处于液态
B.当 , 时,二氧化碳处于气态
C.当 , 时,二氧化碳处于超临界状态
D.当 , 时,二氧化碳处于超临界状态
二、填空题
5.某创新企业为了解新研发的一种产品的销售情况,从编号为001,002,…480的480个
专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为
005,021,…则样本中的最后一个个体编号是______.三、解答题
6.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本
数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间 的概率;
(3)已知该地区这种疾病的患病率为 ,该地区年龄位于区间 的人口占该地区总
人口的 .从该地区中任选一人,若此人的年龄位于区间 ,求此人患这种疾病的
概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,
精确到0.0001).
7.在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到 以上(含
)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙
以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E
(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
8.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材
积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量
(单位: ),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总
和为 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区
这种树木的总材积量的估计值.
附:相关系数 .
9.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用
一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为
和 .
(1)求 , , , ;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果
,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则
不认为有显著提高).