文档内容
考点 10-2 回归分析与独立检验
1.(2022·河南·高三开学考试(文))在研究线性回归模型时,样本数据 所对应的
点均在直线 上,用 表示解释变量对于预报变量变化的贡献率,则 ( )
A. B. C.1 D.2
【答案】C
【分析】结合决定系数的知识确定正确答案.
【详解】因为样本数据所对应的点都在直线 上,所以 .
故选:C
2.(2023·全国·高三专题练习)如图是一组实验数据构成的散点图,以下函数中适合作为 与 的回归方
程的类型是( )
A. B. C. D.
【答案】D
【分析】由散点图中各点的变化趋势,结合题中选项给出的函数的性质,用排除法一一排除得出答案.
【详解】由散点图中各点的变化趋势知,各点不在一条直线上,排除A.
由散点图中各点呈单调递减趋势,排除B.又图中点的横坐标有正有负,故排除C.
故选:D.
3.(2023·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算
出相关指数 ,则线性相关程度最高的是( )
甲 乙 丙 丁
0.87 0.91 0.58 0.83
A.甲 B.乙 C.丙 D.丁
【答案】B
【分析】利用相关指数 的性质,通过比较四位同学的 ,即可得到线性相关程度最高的同学
【详解】 越接近于1,两个变量的线性相关程度越高.
,则线性相关程度最高的是乙
故选:B.4.(2023·全国·高三专题练习)下列是关于出生男婴与女婴调查的 列联表
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么 __________.
【答案】82
【分析】根据 列联表,可得方程,解之即可得到结论.
【详解】解:由题意, , , , ,
, , , ,
故答案为: 82.
5.(2023·全国·高三专题练习)设变量y与x的回归模型A、模型B、模型C相应的相关系数r的值分别为
0.28、0.35、0.3,则拟合效果最好的是模型______.
【答案】B
【分析】根据相关系数的绝对值越接近于 ,则回归模型的拟合效果越好,可得答案.
【详解】因为相关系数的绝对值越接近于 ,则回归模型的拟合效果越好,
又因为 ,所以拟合效果最好的是模型B.
故答案为:B.
6.(2023·全国·高三专题练习)用模型 拟合一组数 ,若 ,
,设 ,得变换后的线性回归方程为 ,则 ( )
A.12 B. C. D.7
【答案】B
【分析】由已知,可根据 , 先计算出 ,然后把样本中心点带入线性
回归方程为 中计算出 ,从而得到线性回归方程,然后将方程化为指数形式,通过待定系数法分
别对应出 、 的值,即可完成求解.
【详解】由已知, ,所以 ,
, ,所以
,由题意, 满足线性回归方程为 ,所以 ,所以 ,
此时线性回归方程为 ,即 ,
可将此式子化为指数形式 ,即为 ,
因为模型为模型 ,所以 , ,
所以 .
故选:B.
7.(2023·全国·高三专题练习)下列命题中正确的是( )
A.数据1,2,3,3,4,5的众数大于中位数
B.对一组数据 ,如果将它们变为 ,其中 ,则平均数和标准差均
发生改变
C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30
D.一般可用相关指数 来比较两个模型的拟合效果, 越大,模型拟合效果越好
【答案】D
【分析】根据中位数和众数的定义判断A;根据平均数和标准差的性质可判断B;根据分层抽样的性质判
断C;根据相关指数的定义和性质判断D.
【详解】对于A,数据1,2,3,3,4,5的众数是3,中位数是 ,众数等于中位数,故A错误;
对于B,数据 ,如果将它们变为 ,其中 ,则平均数增加C,标准
差不变,故B错误;
对于C,有甲、乙、丙三种个体按 的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为
,故C错误;
对于D,由相关指数的性质可得可以通过比较相关指数 的大小比较两个模型的拟合效果,且 越大,
模型拟合效果越好,故D正确.
故选:D.
8.(2022·全国·高三专题练习)如下表,根据变量 与 之间的对应数据可求出 .其中 .
现从这 个样本点对应的残差中任取一个值,则残差不大于 的概率为( )
A. B. C. D.
【答案】C
【分析】计算 , 的最后一个数据为5,带入回归方程得到 ,计算每个样本点对应残差,得到概率.
【详解】由表中的数据可知, ,
设 的最后一个数据为 ,则 , ,
将 , 代入 得 ,
这 个样本点对应的残差分别为:
,
,
,
,
,所以残差不大于 的概率为 .故选: .
9.(2023·全国·高三专题练习)一只红铃虫产卵数 和温度 有关,现测得一组数据 ,
可用模型 拟合,设 ,其变换后的线性回归方程为 ,若 ,
, 为自然常数,则 ________.
【答案】
【分析】经过 变换后将非线性问题转化为线性问题,在求样本点的中心,回归直线一定过该点,即
可求出参数.
【详解】 经过 变换后,得到 ,根据题意 ,故 ,又
,故 , ,故 ,于是回归方程为
一定经过 ,故 ,解得 ,即 ,于是 .
故答案为: .
10.(2023·全国·高三专题练习)已知变量 , 的关系可以用模型 拟合,设 ,其变换后
得到一组数据如下:
4 6 8 10
2 3 5 6
由上表可得线性回归方程 ,则 ______.【答案】 ##
【分析】根据表格数据求 ,代入回归方程求参数a,结合 得 ,由方程的形式可知
,即可求c.
【详解】由表格数据知: .
由 ,得 ,则 .
∴ ,
由 ,得 ,
∴ ,即 .
故答案为: .
11.(2020·河南郑州·一模(理))根据最小二乘法由一组样本点 (其中 ),求得的回
归方程是 ,则下列说法正确的是
A.至少有一个样本点落在回归直线 上
B.若所有样本点都在回归直线 上,则变量同的相关系数为1
C.对所有的解释变量 ( ), 的值一定与 有误差
D.若回归直线 的斜率 ,则变量x与y正相关
【答案】D
【分析】对每一个选项逐一分析判断得解.
【详解】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;
所有样本点都在回归直线 上,则变量间的相关系数为 ,故B错误;
若所有的样本点都在回归直线 上,则 的值与 相等,故C错误;
相关系数r与 符号相同,若回归直线 的斜率 ,则 ,样本点分布应从左到右是上升的,
则变量x与y正相关,故D正确.
故选D.
【点睛】本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析推理能力.12.(2019·黑龙江·佳木斯一中高三阶段练习(文))针对时下的“抖音热”,某校团委对“学生性别和
喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的 ,男生喜欢抖音的人数占男生
人数的 ,女生喜欢抖音的人数占女生人数 ,若有 的把握认为是否喜欢抖音和性别有关,则男生至
少有( )
参考公式:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.12人 B.18人 C.24人 D.30人
【答案】B
【分析】设男生人数为 ,女生人数为 ,完善列联表,计算 解不等式得到答案.
【详解】设男生人数为 ,女生人数为
喜欢抖音 不喜欢抖音 总计
男生
女生
总计
男女人数为整数
故答案选B
【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.
13.(2020·辽宁·蒙古族高级中学模拟预测(理))某次测量发现一组数据 具有较强的相关性,并
计算得 ,其中数据 因书写不清楚,只记得 是 上的一个值,则该数据对应的残差(残
差=真实值-预测值)的绝对位不大于0.5的概率为( )
A. B. C. D.
【答案】C【分析】求得估计值,用真实值减去估计值求得残差,根据已知残差的绝对位不大于 列不等式,解不
等式求得 的取值范围,根据几何概型概率计算公式计算出所求概率.
【详解】依题意可知,估计值为 ,残差为 ,依题意得 ,解得 ,根
据几何概型概率计算公式可得所求概率为 ,故选C.
【点睛】本小题主要考查残差的概念及计算,考查几何概型的计算,属于基础题.
14.(2022·全国·高三专题练习)有两个分类变量 和 ,其中一组观测值为如下的2×2列联表:
总计
15
50
总计 20 45 65
其中 , 均为大于5的整数,则 __________时,在犯错误的概率不超过 的前提下为“ 和
之间有关系”.附:
【答案】9
【分析】由题意,计算 ,列出不等式求出 的取值范围,再根据题意求得 的值.
【详解】解:由题意知: ,
则 ,
解得: 或 ,
因为: 且 , ,
综上得: , ,
所以: .
故答案为:9.
【点睛】本题考查独立性检验的应用问题.
15.(2022·全国·高三专题练习(理))下列命题中,正确的命题有__________.
①回归直线 恒过样本点的中心 ,且至少过一个样本点;
②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数 来刻画回归效果, 越接近 ,说明模型的拟合效果越好;
④用系统抽样法从 名学生中抽取容量为 的样本,将 名学生从 编号,按编号顺序平均分成
组( 号, 号, 号),若第 组抽出的号码为 ,则第一组中用抽签法确定的号码
为 号.
【答案】②④
【详解】回归直线 恒过样本点的中心 ,不须过样本点;①错误;将一组数据的每个数据都
加一个相同的常数后,数据的波动性不变,故方差不变;②正确;用相关指数 来刻画回归效果, 越
接近 ,说明模型的拟合效果越好;③错误;④中系统抽样方法是正确的.故本题应选②④.