文档内容
第 3 讲 统计与成对数据的分析
一、单项选择题
1.某公司2022年1月至7月空调销售完成情况如图,如7月份销售量是190台,若月份为
x,销售量为y,由统计数据(x,y)(i=1,2,…,7)得到散点图,下面四个经验回归方程类型
i i
中最适合作为销售量y和月份x的经验回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
2.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,
随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位
社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
3.(2022·济南模拟)某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海
桐四种树苗共计1 200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别
为600,400,200,若每种树苗均按各年级报名人数的比例进行分配,则高三年级应分得侧柏
的数量为( )A.34 B.46 C.50 D.70
4.(2022·运城模拟)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民
生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵
量y与温度x的关系可以用模型y= (其中e为自然对数的底数)拟合,设z=ln y,其变
换后得到一组数据:
x 20 23 25 27 30
z 2 2.4 3 3 4.6
由上表可得经验回归方程z=0.2x+a,则当x=60时,蝗虫的产卵量y的估计值为( )
A.e6 B.10 C.6 D.e10
5.(2022·绵阳模拟)某车间从生产的一批产品中随机抽取了 1 000个零件进行一项质量指标
的检测,整理检测结果得此项质量指标的频率分布直方图如图所示,则下列结论错误的是(
)
A.a=0.005
B.估计这批产品该项质量指标的众数为45
C.估计这批产品该项质量指标的中位数为60
D.从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5
6.为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班
30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均
成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为( )
A.74 B.128
C.138 D.136
二、多项选择题
7.(2022·益阳调研)据新华社报道,“十三五”以来,中国建成了全球规模最大的信息通信
网络,光纤宽带用户占比从2015年底的56%提升至94%,行政村通光纤和4G的比例均超
过了99%;中国移动网络速率在全球139个国家和地区中排名第4位;在5G网络方面,中国已初步建成全球最大规模的5G移动网络.如图是某科研机构对我国2023-2029年5G用
户规模和年增长率发展的预测图,则下列结论正确的是( )
2023-2029年中国5G用户规模和年增长率发展预测图
A.2023-2029年,我国5G用户规模逐年增加
B.2023-2028年,我国5G用户规模后3年的方差小于前3年的方差
C.2023-2026年,我国5G用户规模的年增长率逐年下降
D.2023-2029年,我国5G用户规模年增长最多的是2025年
8.(2022·菏泽模拟)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,
建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
年借阅量y(万册) 4.9 5.1 5.5 5.7 5.8
根据上表,可得y关于x的经验回归方程为y=0.24x+a,下列结论正确的有( )
A.a=4.68
B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7
C.y与x的样本相关系数r>0
D.2023年的借阅量一定不少于6.12万册
9.(2022·山东联考)为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随
机抽取了50名高中生,通过问卷调查,得到以下数据:
选物理 不选物理
数学成绩优异 20 7
数学成绩一般 10 13
由以上数据,计算得到χ2=≈4.844,根据临界值表,以下说法正确的是( )
参考数据:
α 0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
αA.依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关
B.在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关
C.95%的数学成绩优异的同学选择物理
D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会发生变化
10.(2022·连云港模拟)一组数据x ,x ,…,x 是公差为-1的等差数列,若去掉首末两项
1 2 10
x,x 后,则( )
1 10
A.平均数变大 B.中位数没变
C.方差变小 D.极差没变
三、填空题
11.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过
程中收集4组对应数据(x,y),如表所示.(残差=观测值-预测值)
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为y=0.7x+a.据此计算出在样本(4,3)处的残差
为-0.15,则表中m的值为________.
12.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,
将测试结果分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18].如图是按上述分
组方法得到的频率分布直方图,若成绩低于a即为优秀,如果优秀的人数为14,则a的估计
值是________.
四、解答题
13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指
标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据
如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本均值分别记为和,样本方差分别记为s和s.(1)求,,s,s;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设
备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
14.(2022·广东大联考)中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,
力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称
“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社
会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽
车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区纯电动
汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量 y(单位:万台)关于
x(年份)的经验回归方程为y=4.7x-9 459.2,且销量y的方差为s=,年份x的方差为s=2.
(1)求y与x的样本相关系数r,并据此判断电动汽车销量y与年份x的相关程度;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
购买非电动车 购买电动车 总计
男性 39 6 45女性 30 15 45
总计 69 21 90
依据小概率值α=0.025的独立性检验,能否认为购买电动汽车与车主性别有关;
(3)在购买电动汽车的车主中按照性别进行分层随机抽样抽取 7人,再从这7人中随机抽取3
人,记这3人中,男性的人数为X,求X的分布列和均值.
参考数据:=≈25.
参考公式:①经验回归方程:y=bx+a,其中b=,a=-b.
②样本相关系数:r=,若r>0.9,则可判断y与x线性相关程度较强.
③χ2=,其中n=a+b+c+d.
附表:
α 0.10 0.05 0.025 0.010 0.001
x 2.706 3.841 5.024 6.635 10.828
α