文档内容
8.2 一元线性回归模型及其应用(精讲)
思维导图
常见考法
考点一 样本中心解小题
【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价 (元)与每天的销售量 (个)统计如
下表:
16 17 18 19
50 34 31
据上表可得回归直线方程为 ,则上表中的 的值为( )A.38 B.39 C.40 D.41
【答案】D
【解析】由题意 , ,
所以 ,解得 .故选:D.
【一隅三反】
1.(2021·江西景德镇市·景德镇一中)随机变量 与 的数据如表中所列,其中缺少了一个数值,已知
关于 的线性回归方程为 ,则缺少的数值为( )
2 3 4 5 6
5 6 ▲ 7 9
A.6 B.6.6 C.7.5 D.8
【答案】A
【解析】设缺少的数值为 ,由于回归方程为 过样本中心点 ,
且 ,代入 ,所以 ,解得 .
故选:A.
2.(2021·河南信阳市)根据如下样本数据:
2 3 4 5 6
4 2.5
得到的回归方程为 ,则( )
A. , B. ,
C. , D. ,
【答案】B
【解析】由图表中的数据可得,变量 随着 的增大而减小,则 ,, ,
又回归方程 经过点 ,可得 ,故选:B.
3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频
率 (每分钟鸣叫的次数)与气温 (单位: )存在着较强的线性相关关系.某地观测人员根据下表
的观测数据,建立了 关于 的线性回归方程 .
(次数/分钟)
则当蟋蟀每分钟鸣叫 次时,该地当时的气温预报值为( )
A. B. C. D.
【答案】D
【解析】由表格中的数据可得 , ,
由于回归直线过样本中心点 ,可得 ,解得 .
所以,回归直线方程为 .在回归直线方程中,令 ,可得 .
故选:D.
考点二 一元线性方程
【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商
品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
通过分析,发现销售量y对商品的价格x具有线性相关关系,求
(1)销售量y对商品的价格x的回归直线方程;(2)若使销售量为12,则价格应定为多少.
附:在回归直线 中 ,
【答案】(1) (2) 8.75
【解析】(1)由题意知 , ,
, ,
线性回归方程是 ;
(2)令 ,可得 ,
预测销售量为12件时的售价是8.75元.
【一隅三反】
1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的
时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者
的心率 (单位:次/分钟)和配速 (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42
公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.
(1)由散点图看出,可用线性回归模型拟合 与 的关系,求 与 的线性回归方程;
(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他
能获得的名次.参考公式:线性回归方程 中, ,
参考数据: .
【答案】(1) ;(2)210分钟,192名.
【解析】(1)由散点图中数据和参考数据得 ,
,
,
,
所以 与 的线性回归方程为 .
(2)将 代入回归方程得 ,
所以该跑者跑完马拉松全程所花的时间为 分钟.
从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为
,有 的跑者成绩超过该跑者,
则该跑者在本次比赛获得的名次大约是 名.
2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别
是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度
购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易
额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:
年份 2014 2015 2016 2017 2018 2019 2020
年份代码( ) 1 2 3 4 5 6 7
总交易额 (单位:百亿) 5.7 9.1 12.1 16.8 21.3 26.8 37
(1)通过分析,发现可用线性回归模型拟合总交易额y与年份代码t的关系,请用相关系数加以说明;
(2)利用最小二乘法建立y关于t的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额.
参考数据: , , ;
参考公式:相关系数 ;
回归方程 中,斜率和截距的最小二乘估计公式分别为: ,
.
【答案】(1)答案见解析;(2)回归方程为 ,预测2021年天猫“双十一”的总交易额约
为38百亿.
【解析】(1) , ,
,
所以因为总交易额y与年份代码t的相关系数近似为0.98,
说明总交易额y与年份代码t的线性相关性很强,
从而可用线性回归模型拟合总交易额y与年份代码t的关系.
(2)因为 , ,
所以 ,
,
所以y关于t的回归方程为
又将2021年对应的 代入回归方程得: .
所以预测2021年天猫“双十一”的总交易额约为38百亿.
3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与
某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明
(若 ,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多
少?附:相关系数公式 .
参考数据: , .
回归方程 中斜率和截距的最小二乘估计公式分别为 ,
.
【答案】(1)0.95;答案见解析;(2) ;610千克.
【解析】(1)由已知数据可得 , ,
所以 ,
,
,
所以相关系数 .
因为 ,所以可用线性回归模型拟合y与x的关系.
(2) , ,所以回归方程为 .
当 时, ,
即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.
考点三 非一元线性方程
【例3】(2020·全国高二课时练习)在一次抽样调查中测得 个样本点,得到下表及散点图.
(1)根据散点图判断 与 哪一个适宜作为 关于 的回归方程;(给出判断即可,
不必说明理由)
(2)根据(1)的判断结果试建立 与 的回归方程;(计算结果保留整数)
(3)在(2)的条件下,设 且 ,试求 的最小值.
参考公式:回归方程 中, , .
【答案】(1) ;(2) ;(3) .【解析】(1)由题中散点图可以判断, 适宜作为 关于 的回归方程;
(2)令 ,则 ,原数据变为
由表可知 与 近似具有线性相关关系,计算得 ,
,
,
所以, ,则 .
所以 关于 的回归方程是 .
(3)由(2)得 , ,
任取 、 ,且 ,即 ,
可得
,
因为 ,则 , ,所以, ,
所以,函数 在区间 上单调递增,则 .
【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x(天数)
与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).
表中 .
(1)根据散点图判断 ,与 哪一个更适合作价格y关于时间x的回归方程类型?(不必
说明理由)
(2)根据判断结果和表中数据,建立y关于x的回归方程.
(3)若该产品的日销售量 (件)与时间x的函数关系为 ,求该产品投
放市场第几天的销售额最高?最高为多少元?
附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘法估计分别为 .
【答案】(1) 更适合作价格y关于时间x的回归方程;(2) ;(3)第10天,最
高销售额为2420元;
【解析】(1)根据散点图知 更适合作价格y关于时间x的回归方程类型;
(2)令 ,则 ,
而 ,
,即有 ;
(3)由题意结合(2)知:
日销售额为 ,
∴ ,
若 ,令 ,
∴ 时, ,即 天, 元,
所以该产品投放市场第10天的销售额最高,最高销售额为2420元.
2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”
规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额 (单位:亿元)对年盈利额 (单位:亿元)的影响,研究了“十二五”和“十三五”规
划发展期间近10年年研发资金投入额 和年盈利额 的数据.通过对比分析,建立了两个函数模型:①
,② ,其中 , , , 均为常数, 为自然对数的底数.令 ,
,经计算得如下数据:
26 215 65 2 680 5.36
11250 130 2.6 12
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据(1)的选择及表中数据,建立 关于 的回归方程;(系数精确到0.01)
(ⅱ)若希望2021年盈利额 为250亿元,请预测2021年的研发资金投入额 为多少亿元?(结果精确
到0.01)
附:①相关系数 ,回归直线 中: ,
②参考数据: , .
【答案】(1)模型 的拟合程度更好;(2)(ⅰ) ;(ⅱ)27.56.
【解析】(1)设 和 的相关系数为 , 和 的相关系数为 ,由题意,,
,
则 ,因此从相关系数的角度,模型 的拟合程度更好.
(2)(ⅰ)先建立 关于 的线性回归方程,
由 ,得 ,即 ,
,
,
所以 关于 的线性回归方程为 ,
所以 ,则 .
(ⅱ)2021年盈利额 (亿元),
所以 ,则 ,
因为 ,
所以 .
所以2021年的研发资金投入量约为27.56亿元.