文档内容
8.2 一元线性回归模型及其应用 ---A基础练
一、选择题
1.(2021·全国高二课时练)某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖
出的热饮杯数 与当天气温 的回归方程 .下列选项正确的是( )
A. 与 线性正相关 B. 与 线性负相关
C. 随 增大而增大 D. 随 减小而减小
【答案】B
【详解】由回归方程 ,可得: 与 线性负相关,且 随 增大而减小.
2.(2021·黑龙江哈尔滨市九中高二月考)下列描述中正确命题的个数为( )
(1)最小二乘法的原理是使得 最小
(2)样本相关系数 越大,相关程度越大
(3)设有一个回归方程 ,变量 增加一个单位时, 减少 个单位
A. B. C. D.
【答案】B
【详解】对于(1),最小二乘法是使得样本数据点到回归直线的距离的评分和最小的方法,即使
得 最小,故正确;对于(2),相关系数 为负数时,样本相关系数 越大,
相关程度越小,故错误;对于(3),变量 增加一个单位时, 平均减少 个单位,故错误;
所以正确的命题个数为1个.故选:B
3.(2021·江西上饶市高二月考)根据如下样本数据,得到回归直线方程 ,则( )
3 4 5 6 7 8
-3.0 -2.0 0.5 -0.5 2.5 4.0A. , B. ,
C. , D. ,
【答案】C
【详解】
从整体上看这些点大致分布在一条直线的周围,且该回归直线的斜率为正,在 轴上的截距为负则
, ,故选:C
4.(2021·四川高二月考)2020年春季.新冠肺炎疫情在全球范围内相维爆发.因为政治制度、文化
背景等因素的不同.各个国家疫情防控的效果具有明显差异.右图是西方某国在 天内感染新冠肺炎
的累计病例人数 (万人)与时间 (天)的散点图.则下列最适宜作为此模型的回归方程的类型是
( )
A. B.
C. D.【详解】根据散点图,可以看出,三点大致分布在一条“指数”函数曲线附近,
选项A对应的“直线型”的拟合函数;选项B对应的“幂函数型”的拟合函数;选项D对应的
“对数型”的拟合函数;故选:C
5.(多选题)(2021·山东德州市高二期末)19世纪中期,英国著名的统计学家弗朗西斯·高尔顿
搜集了1078对夫妇及其儿子的身高数据,发现这些数据的散点图大致呈直线状态,即儿子的身高
(单位: )与父母平均身高 (单位: )具有线性相关关系,通过样本数据
,求得回归直线方程 ,则下列结论中正确的是( )
A.回归直线方程至少过 , 中的一个点
B.若 , ,则回归直线过点
C.若父母平均身高增加 ,则儿子身高估计增加
D.若样本数据 所构成的点都在回归直线上,则线性相关系数
【答案】BCD
【详解】对于A选项,回归直线方程,不一定经过 , 中的一个点,故
A选项正确.对于B选项,回归直线方程过样本中心点 ,故B选项正确.对于C选项,由于
,所以若父母平均身高增加 ,则儿子身高估计增加 ,故C选项正确.
对于C选项,若样本数据 所构成的点都在回归直线上,则线性相关系数 ,
正确.故选:BCD
6.(多选题)(2021·河南洛阳市高二期末)在用最小二乘法进行线性回归分析时,下列说法中正
确的是( )
A.由样本数据得到的线性回归方程 必过样本点的中心 ;
B.由样本点 , ,…, 得到回归直线,则这些样本点都在回归直线上;C.利用 来刻画回归的效果, 比 的模型回归效果好;
D.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越低;
【答案】AC
【详解】线性回归直线必过样本点的中心,而样本点未必在回归直线上,即A正确,B错误;
相关指数 越大,拟合效果越好,C正确;残差图中的残差点比较均匀地落在水平的带状区域中,
宽度越窄,说明模型拟合精度越高,D错误.
二、填空题
7.(2021·江西上饶市·高二期末)上饶市婺源县被誉为“茶乡”,婺源茶业千年不衰,新时代更是
方兴未艾,其中由农业部监制的婺源大山顶特供茶“擂鼓峰茶尤为出名,为了解每壶“擂鼓峰”茶
中所放茶叶量 克与食客的满意率 的关系,抽样得一组数据如下表:
(克) 2 4 5 6 8
(%) 30 50 70 60
根据表中的全部数据,用最小二乘法得出 与 的线性回归方程为 ,则表中 的值
为________.
【答案】40
【详解】由表中数据,计算可得 , ,
因为回归直线方程 过样本中心点,所以有 ,解得 .
8.(2021·全国高三专题练)在一组样本数据 的散点图中,若所有样
本点 都在曲线 附近波动.经计算
,则实数 的值为________.【答案】
【详解】令 ,则曲线的回归方程变为线性的回归方程,即 ,
此时 ,代入 ,可得 ,解得 .
9.(2021·广东湛江市高二月考)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的
前五天数据如下表:
第 天 1 2 3 4 5
使用人数( ) 15 173 457 842 1333
由表中数据可得y关于x的回归方程为 ,则据此回归模型相应于点(2,173)的残差
为________.
【答案】
【详解】令 ,则 ,
1 4 9 16 25
使用人数( ) 15 173 457 842 1333
, ,
所以 ,所以 ,
当 时, ,所以残差为 .
10.(2021·全国高三专题练习)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8
的样本,他们的数学、物理成绩(单位:分)对应如下表:
学生编号 1 2 3 4 5 6 7 8
数学成绩 60 65 70 75 80 85 90 95
物理成绩 72 77 80 84 88 90 93 95
给出散点图如下:根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同
学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为________.
【答案】1
【详解】由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关
关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;
若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理
成绩高,故③错误.综上,正确的个数为1.
三、解答题
11.(2021·河南高二期中)为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大
农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018
年的数据进行调查,发现某地区发放粮食补贴额x(单位:亿元)与该地区粮食产量y(单位:万
亿吨)之间存在着线性相关关系,统计数据如下表:
年份 2014 2015 2016 2017 2018
补贴额x/亿元 9 10 12 11 8
粮食产量y/万亿 25 26 31 37 21
(1)请根据上表所给的数据,求出y关于x的线性回归直线方程 ;
(2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据
(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.
参考公式: , .【详解】
解:(1)由表中所给数据可得,
,
,
代入公式 ,解得 ,
所以 .
故所求的y关于x的线性回归直线方程为 .
(2)由题意,将 代入回归方程 ,可得, .
所以预测2019年该地区的粮食产量大约为19.4万亿吨.
12.(2021·全国高二专题练习)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成
分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单
随机抽样的方法抽取20个县城进行了分析,得到样本数据 ,其中 和 分
别表示第 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得 ,
, , , .
(1)请用相关系数说明该组数据中 与 之间的关系可用线性回归模型进行拟合;
(2)求 关于 的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为
多少吨?参考公式:相关系数 ,对于一组具有线性相关关系的数据
,其回归直线 的斜率和截距的最小二乘估计分别为
, .
【详解】
(1)由题意知,相关系数 .
因为 与 的相关系数接近1,
所以 与 之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)由题意可得, ,
,
所以 .
当 时, ,
所以该市10万人口的县城年垃圾产生总量约为252.5吨.