文档内容
章末过关检测(三) 成对数据的统计分析
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只
有一项是符合题目要求的.
1.[2022·湖北部分市州高二期末]在下列所示的四个图中,两个变量间具有较强线性相
关关系的是( )
2.[2022·山东菏泽高二期末]关于线性回归的描述,下列命题错误的是( )
A.回归直线一定经过样本点的中心 B.残差平方和越小,拟合效果越好
C.决定系数R2越接近1,拟合效果越好 D.残差平方和越小,决定系数R2越小
3.[2022·湖北武汉高二期末]为大力提倡“厉行节约,反对浪费”,某大学通过随机询
问100名学生能否做到“光盘”行动,得到如下列联表:
单位:人
经计算:χ2≈3.04,得到的正确结论是( )
A.依据α=0.05的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”
B.依据α=0.01的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”
C.依据α=0.1的独立性检验,认为“该校学生能否做到‘光盘’行动与性别有关”
D.依据α=0.1的独立性检验,认为“该校学生能否做到‘光盘’行动与性别无关”
4.[2022·江苏南通高二期末]根据样本点A(0,2.2),B(2,4.4),C(4,n)绘制的散点图
知,样本点呈直线趋势,且经验回归方程为y=0.65x+2.5,则n=( )
A.6.6 B.5.1 C.4.8 D.3.8
5.假设有两个分类变量X与Y,它们的可能取值分别为{x,x}和{y,y},其2×2列
1 2 1 2
联表为
Y
y y 总计
X 1 2
x 10 18 28
1
x m 26 m+26
2
总计 m+10 44 m+54则X与Y的关系最弱时整数m取( )
A.8 B.9 C.14 D.19
6.[2022·福建泉州高二期末]色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检
一批产品测得数据列于表中:已知该产品的色度y和色差x之间满足线性相关关系,且y=
0.8x+a,现有一对测量数据为(30,23.6),则该数据的残差为( )
色差x 21 23 25 27
色度y 15 18 19 20
A.-0.96 B.-0.8 C.0.8 D.0.96
7.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有的
男大学生“不看”,有的女大学生“不看”,若有99%的把握认为性别与是否看营养说明
之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
8.[2022·河北石家庄高二期末]对具有线性相关关系的变量x,y有一组观测数据(x,
i
y)(i=1,2,…,8)其经验回归方程是y=x+a,且x +x +…+x =2(y +y +…+y)=6,
i 1 2 8 1 2 8
则当x=-时,y的估计值为( )
A.- B. C.- D.
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项
符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.[2022·江苏泰州高二期末]下列说法中正确的是( )
A.公式LW=8中的L和W具有相关关系
B.回归直线y=bx+a恒过样本点的中心(x,y)
C.相关系数r的绝对值越接近1,则两个变量的相关性越强
D.对分类变量x与y的随机变量χ2来说,χ2越小,判断“x与y有关系”的把握越大
10.[2022·福建莆田高二期末]为预测某电子商务平台2022年的销售额(单位:亿元),
建立了年销售额y与年份代码x的两个回归模型,根据该平台2012年至2021年的数据(年
份代码x的值依次为1,2,…,10)作出散点图,建立模型①:y=493x+a和模型②:y=
7x3-60x2+400x-205,如下图,则下列说法正确的是( )
A.模型②更适合作为回归模型
B.年销售额y与年份代码x呈正相关关系
C.根据模型②计算得,当x=11时,y=6 252,可预测该平台2022年的年销售额为6
252亿元
D.若模型①过样本中心,该平台2012年至2021年间年销售额的平均值为1 845亿元,
则a=-620
11.[2022·山东济南高二期末]某同学将收集到的六对数据制作成散点图如下,得到其
经验回归方程为l :y=0.68x+a,计算其相关系数为r ,决定系数为R.经过分析确定点F
1 1
为“离群点”,把它去掉后,再利用剩下的五对数据计算得到经验回归方程为l :y=bx+
2
0.68,相关系数为r,决定系数为R.下列结论正确的是( )
2A.r>r>0 B.R>R C.00.68
2 1
12.[2022·江苏常州高二期末]北京冬奥会成功举办后,大众对冰雪运动关注度不断上
升,为研究市民对冰雪运动的喜好是否和性别有关,某校学生社团对市民进行了一次抽样
调查,得到列联表如下:
若男性喜欢冰雪运动的人数占男性人数的,女性喜欢冰雪运动的人数占女性人数的,
则( )
A.列联表中n的值为60,m的值为120
B.随机对一位路人进行调查,有95%的可能性对方喜欢冰雪运动
C.有95%的把握认为市民对冰雪运动的喜好和性别有关
D.没有99%的把握认为市民对冰雪运动的喜好和性别有关
三、填空题:本题共4小题,每小题5分,共20分.
13.[2022·福建福州一中高二期末]已知变量x,y线性相关,样本相关系数r=0.9,且
x=1,y=0,则在坐标系下的散点图中,大多数的点都不落在第________象限.
14.[2022·河北保定高二期末]新能源汽车不仅降低了对石油进口的依赖,也减少了对
整个地球环境的污染,下表是某新能源车2017~2021年销量统计表:
年份 2017 2018 2019 2020 2021
年份编号x 1 2 3 4 5
销量y/十万辆 2.5 3 4 m 5
若销量y与年份编号x线性相关,且求得经验回归方程为y=0.65x+1.85,则m=
________.
15.[2022·重庆高二期末]某篮球联赛期间,某一电视台对年龄高于 30岁和不高于30
岁的人是否喜欢甲队进行调查,对高于30岁的调查了45人,不高于30岁的调查了55人,
所得数据绘制成如下列联表:若工作人员从调查的所有人中任取一人,取到喜欢甲队的人的概率为,依据小概率值
α=0.005的独立性检验,推断年龄与是否喜欢甲队________(填“有”“无”)关联.
16.[2022·福建福州高二期末]已知变量y关于x的回归方程为y=ebx-0.5,若对y=ebx-0.5
两边取自然对数,可以发现ln y与x线性相关,现有一组数据如下表所示,x=5时,预测
y值为________.
x 1 2 3 4
y e e3 e4 e6
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(本小题满分10分)随着互联网的发展,网络已成为人们日常学习、工作和生活不
可或缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多,为
了防范网络犯罪与网络诈骗,学校举办“网络安全宣传倡议”活动.学校从全体学生中随
机抽取了200人对“网络安全宣传倡议”的了解情况进行问卷调查,统计结果如下表所示:
男 女 合计
了解 70 125
不了解 45
合计
(1)根据所提供数据,完成2×2列联表;
(2)判断是否有95%的把握认为对“网络安全宣传倡议”的了解情况与性别有关.
α 0.1 0.05 0.01 0.005 0.001
x 2.706 3.841 6.635 7.879 10.828
α
18.(本小题满分12分)近几年新能源汽车越来越受到人们喜欢.某新能源汽车销售企
业在2017年至2021年的销售量y(单位:万辆)数据如表:
年份 2017年 2018年 2019年 2020年 2021年
年份代码x 1 2 3 4 5
销售量y(万辆) 17 18 20 22 23
(1)根据数据,可用一元线性回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2)预计2022年该新能源汽车企业的销售量为多少万辆?附参考数据:(x-x)(y-y)=16,(x-x)2=10.
i i i
19.(本小题满分12分)[2022·山东济南高二期末]某商场为提高服务质量,随机调查了
50位男顾客和50位女顾客,每位顾客对该商场的服务给出满意或者不满意的评价,得到
下面部分列联表:
满意 不满意
男顾客 10
女顾客 15
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
20.(本小题满分12分)[2022·广东肇庆高二期末]某市统计了该市近五年的环保投资额
y(万元)得下表:
年份 2017 2018 2019 2020 2021
年份代号x 1 2 3 4 5
年环保投资额y(万元) 12 20 35 48 55
以x为解释变量,y为响应变量,若用y=bx+a作为经验回归方程,则决定系数R=
0.986 0,若用y=c+cln x作为经验回归方程,则决定系数R=0.934 3.
1 2
(1)判断y=bx+a与y=c +cln x哪一个更适合作为年环保投资额y关于年份代号x的
1 2
经验回归方程,并说明理由;
(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的经验回归方程.
参考数据:y=624, ln x≈207.38,≈4.78.
i i i i i
21.(本小题满分12分)[2022·河北张家口高二期末]某中医研究所研制了一种治疗A疾
病的中药,为了解其对A疾病的作用,要进行双盲实验.把60名患有A疾病的志愿者随
机平均分成两组,甲组正常使用这种中药,乙组用安慰剂代替中药,全部疗期后,统计甲
乙两组的康复人数分别为20和5.(1)根据所给数据,完成下面2×2列联表,并依据小概率值α=0.001的独立性检验,
能否认为使用这种中药与A疾病康复有关联?
康复 未康复 单位
甲组
乙组
合计
(2)若将乙组未用药(用安慰剂代替中药)而康复的频率视为这种疾病的自愈概率,现从
患有A疾病的人群中随机抽取4人,记其中能自愈的人数为X,求X的分布列和数学期望.
注:双盲实验:是指在实验过程中,测验者与被测验者都不知道被测者所属的组别,
(实验组或对照组),分析者在分析资料时,通常也不知道正在分析的资料属于哪一组.旨
在消除可能出现在实验者和参与者意识当中的主观偏差和个人偏好.安慰剂:是指没有药
物治疗作用,外形与真药相像的片、丸、针剂.
22.(本小题满分12分)[2022·福建莆田一中高二期末] 甲、乙两名同学在对具有相关关
系的两个变量进行回归分析时,得到如下数据.
x 4 6 8 10 12
y 4 12 24 50 72
甲发现表中散点集中在曲线y=cx2+cx附近(其中c ,c 是参数,且c>0).他先设y′
1 2 1 2 1
=,将表中数据进行转换,得到新的成对数据(x,y′)(i=1,2,3,4,5),再用一元线性
i i
回归模型y′=bx+a拟合;乙根据数据得到线性回归方程为y=8.7x-37.2.
(1)列出新的数据表(x,y′)(i=1,2,3,4,5),并求y′=bx+a;
i i
(2)在统计学中,我们通常计算不同回归模型的残差平方和(残差平方和v2=(y-y)2)来
i i
判断拟合效果,v2越小,拟合效果越好.乙同学计算出其模型的残差平方和为143.6,请你
计算甲同学模型y=cx2+cx的残差平方和,并比较拟合效果.
1 2