文档内容
8.2 一元线性回归模型及其应用(精练)
【题组一 样本中心解小题】
1.(2021·广西钦州市)据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应
数据的散点图如图所示,由图可知y与x之间有较强的线性相关关系,其线性同归方程是 ,
则a的值是( )
A.2.5 B.3 C.3.5 D.4
2.(2021·湖北武汉市·武汉中学高二期末)设一个回归方程为 ,则变量 增加一个单位时
( ).
A. 平均增加12个单位 B. 平均增加3个单位
C. 平均减少1.2个单位 D. 平均减少3个单位
3.(2021·江西上饶市)在对具有线性相关的两个变量 和 进行统计分析时,得到如下数据:
由表中数据求得 关于 的回归直线方程,则 , , , 这四个样本点中,距
离回归直线最近的点是( )
A. B. C. D.4.(2021·江西上高二中)对具有线性相关关系的变量 , ,测得一组数据如表,利用最小二乘法得它
们的回归直线方程为 ,据此模型来预测当 时, 的估计值为___________
2 4 5 6 8
20 50 60 70 80
5.(2021·湖南省平江县第一中学高二月考)已知某产品的销售额 (万元)与广告费用 (万元)之间
的关系如下表:
(单位:万元)
(单位:万元)
若销售额与广告费用之间的线性回归方程为 ,预计当广告费用为 万元时的销售额约为
_____________(万元).
6.(2021·福建漳州市·高二期末)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元 1 2 3 4
销售额y/万元 2 3 m n
现已知 ,且回归方程 中的 ,据此模型预测广告费用为10万元时,销售额为______
万元.
7.(2021·江西高二期末(理))下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可
知,用水量 与月份 之间有较好的线性相关关系,其线性回归方程是 ,则 _______ .
月份 1 2 3 4
用水量 4.5 4 3 2.5
8.(2021·邱县第一中学高二期末)已知x与y之间的一组数据:x 0 1 2 3
y m 3 5.5 7
已知关于y与x的线性回归方程为 ,则m的值为___________.
9.(2021·贵州贵阳市)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试
验.根据收集到的数据(如下表),由最小二乘法求得回归方程 .
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 75 80 90
现发现表中有一个数据看不清,请你推断该数据的值为___________.
10.(2020·吉林油田第十一中学)已知 与 之间的一组数据:
1 2 3 4
3.2 4.8 7.5
若 关于 的线性回归方程为 ,则 的值为______.
【题组二 一元线性方程】
1.(2021·福建福州市·高二期末)为了研究某班男生身高和体重的关系,从该班男生中随机选取6名,
得到他们的身高和体重的数据如下表所示:
编号 1 2 3 4 5 6
身高 165 171 167 173 179 171
体重 62 m 64 74 74 66
在收集数据时,2号男生的体重数值因字迹模糊看不清,故利用其余5位男生的数话得到身高与体重的线
性回归方程为 .后来得到2号男生的体重精准数值m后再次计算得到线性回归方程为.
(1)求回归方程 ;
(2)若分别按照 和 来预测身高为 的男生的体重,得到的估计值分别为 ,
,且 ,求m的值;
(3) 指数是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准,其中 指数在24到
27.9之间的定义为超重.通过计算可知这6人的 指数分别为:22.8,27.4,22.9,24.7,23.1,
22.6,现从这6人中任选2人,求恰有1人体重为超重的概率.
附:回归直线的斜率和截距的最小二乘估计公式分别为: , .
2.(2021·四川遂宁市)第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全
面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各
地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满
意度 和对应的销售额 (万元)进行了调查得到以下数据:
第二 第三 第四 第五
时间 第一天
天 天 天 天
最满意度 22 34 25 20 19
销售额 (万元) 78 90 86 76 75
(1)求销量额 关于最满意度 的相关系数 ;我们约定:销量额 关于最满意度 的相关系数 的绝对
值在 以上(含 )是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并
给出理由;
(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并
求在剔除“末位淘汰”的那一天后的销量额 关于最满意度 的线性回归方程(系数精确到0.1).
参考数据: , , , , ,
.
附:对于一组数据 .其回归直线方程 的斜率和截距的最小二乘法估
计公式分别为: , ,线性相关系数 .3.(2021·广西钦州市)2020年新型冠状病毒肺炎疫情期间,某医院随着医疗工作的有序开展,从2020
年3月1日算第一天起,该医院每日治愈的新型冠状病毒肺炎人数 (人)的近5天的具体数据如下表:
第 天 1 2 3 4 5
治愈的新型冠状病毒肺炎人数 (人) 2 4 8 18
若在一定时间内,该医院每日治愈的新型冠状病毒肺炎病人数 与天数 具有相关关系,已知线性回归方
程 恒过定点 ,且 , .
(1)求 的值和线性回归方程 ;
(2)预测该医院3月11日能否可以实现“单日治愈人数突破40人”的目标?
参考公式: , , , 为样本平均值.
4.(2020·贵州贵阳市·贵阳一中)统计中用相关系数 来衡量两个变量之间的线性相关的强弱,若相应于变量 的取值 ,变量 的观测值 ,则两个变量的相关关系的计算公式为
.
对于变量 ,若 , 时,那么负相关很强;若 , 时,那么正相关很强;若
, 或 , ,那么相关性一般;若 , ,那么相关性较弱.下表是
一位母亲给儿子作的成长记录:
年龄/周岁 3 4 5 6 7
身高/厘米 91 98 104 111 116
(1)根据公式以及上表数据,判断孩子在3岁到7岁期间年龄与身高线性相关的强弱;
(2)根据上表数据,,求出年龄与身高的线性回归方程 ,并根据求得的回归方程,预估孩子8
岁时的身高.
, .5.(2021·安徽马鞍山市)天气寒冷,加热手套比较畅销,某商家为了解某种加热手套如何定价可以获
得最大利润,现对这种加热手套进行试销售,统计后得到其单价x(单位;元)与销量y(单位:副)的相关数据
如下表:
单价x
80 85 90 95 100
(元)
销量y
140 130 110 90 80
(副)
(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;
(2)若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多
少元时,销售利润最大?(结果保留到整数)
附:对于一组数据(x,y),(x,y),…,(x,y),其回归直线 的斜率和截距的最小二乘估计
1 1 2 2 n n
分别为
参考数据:6.(2021·甘肃省永昌县第一高级中学高二期末(理))据了解,温带大陆性气候,干燥,日照时间长,
昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小(x/℃)与某植物糖积累指数(y/
GI)之间的关系,得到如下数据:
组数 第一组 第二组 第三 第四组 第五组 第六组
组
昼夜温差x/℃ 10 11 13 12 8 6
某植物糖积累指数y/GI 20 24 30 28 18 15
该课题研究组确定的研究方案是先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进
行检验,假设这剩下的2组数据恰好是第一组与第六组数据.
(1)求y关于x的线性回归方程 ;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的
线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?
参考公式:回归直线方程 的斜率和截距的最小二乘估计 .
7.(2021·柳州市第二中学高二期末(理))广西某高三理科班 名学生的物理测评成绩(满分120分)的频率分布直方图如图,已知分数在95—105的学生有27人.
(1)求总人数 和分数在110—120分的人数 ;
(2)求出该频率分布直方图的众数,中位数,平均数;
(3)为了分析某个学生的学习状态,对其下一阶段的学生提供指导性建议,对他前7次考试的数学成绩
(满分150分),物理成绩 进行分析,如表是该生7次考试的成绩.
数学 88 83 117 92 108 100 112
物理 94 91 108 96 104 101 106
已知该生的物理成绩 与数学成绩 是线性相关的,若该生的数学成绩达到130分,请你估计他的物理成
绩大约是多少?其回归方程 , , .
其中
.8.(2020·江西吉安市)从2020年元月份以来,全世界的经济都受到了新冠病毒的严重影响,我国抗疫
战斗取得了重大的胜利,全国上下齐心协力复工复产,抓经济建设;某公司为了提升市场的占有率,准备
对一项产品实施科技改造,经过充分的市场调研与模拟,得到 , 之间的五组数据如下表:
2 3 5 7 8
5 8 12 14 16
其中, (单位:百万元)是科技改造的总投入, (单位:百万元)是改造后的额外收益;设
是对当地生产总值增长的贡献值.
(1)若从五组数据中任取两组,求恰有一组满足 的概率;
(2)记 为 时的任意两组数据对应的贡献值的和,求随机变量 的分布列和数学期望;
(3)利用表中数据,甲、乙两个调研小组给出的拟合直线方程分别为甲组: ,乙组:
,试用最小二乘法判断哪条直线的拟合效果更好?
附:对于一组数据 ,其拟合直线方程 的残差平方和为
, 越小拟合效果越好.【题组三 非一元线性方程】
1.(2020·全国高三专题练习)某地级市共有200 000名中小学生,其中有7%的学生在2017年享受了
“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困
难、特别困难,且人数之比为5∶3∶2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对
这三个等次的困难学生每年每人分别补助1 000元、1 500元、2 000元.经济学家调查发现,当地人均可
支配收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“国家精准扶贫”政策,
很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到
2017年共5年的人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年
份x取13时代表2013年,x与y(万元)近似满足关系式y= ,其中C,C为常数(2013年至2019年
1 2
该市中学生人数大致保持不变).
2.
1.2 3.1 4.6 2 1
3
其中
(1)估计该市2018年人均可支配收入;
(2)求该市2018年的“专项教育基金”的财政预算大约为多少?
附:①对于一组具有线性相关关系的数据(u,v),(u,v),…,(u,v),其回归直线方程
1 1 2 2 n n
的斜率和截距的最小二乘估计分别为2- 2-
20.1 21.7 21.8 21.9
0.7 0.3
0.6 0.8 1.1 3.2 3.5 3.73
2.(2020·全国高二课时练习)某学生为了测试燃气灶烧水如何节省天然气的问题设计了一个试验,并
获得了天然气开关旋钮旋转的弧度数 与烧开一壶水所用时间(以下简称烧水时间) 的一组数据,且进
行了一定的数据处理(如下表),得到了散点图(如下图).
1.47 20.6 0.78 2.35 0.81 16.2
表中 .
(1)根据散点图判断, 与 哪一个更适宜作为烧水时间 关于开关旋钮旋转的弧度数
的回归方程类型;(不必说明理由)
(2)根据判断结果和表中数据,建立 关于 的回归方程;
(3)如果旋转的弧度数 与单位时间内天然气输出量 成正比,那么 为多少时,烧开一壶水最省天然气?
附:对于一组数据 ,其回归直线方程 的斜率和截距的最小二乘估计分别为 .
3.(2020·全国)红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害.每只红铃虫的平均产卵数
和平均温度 有关.现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
平均温度 /℃ 21 23 25 27 29 32 35
平均产卵数
7 11 21 24 66 115 325
/个
27.429 81.286 3.612 40.182 147.714
表中 ,
(1)根据散点图判断, 与 (其中 为自然对数的底数)哪一个更适宜作为
平均产卵数 关于平均温度 的回归方程类型?(给出判断即可不必说明理由)并由判断结果及表中数据,
求出 关于 的回归方程.(计算结果精确到小数点后第三位)
(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情
况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为 .
(ⅰ)记该地今后5年中,恰好需要3次人工防治的概率为 ,求 的最大值,并求出相应的概率 .
(ⅱ)当 取最大值时,记该地今后5年中,需要人工防治的次数为 ,求 的数学期望和方差.
附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘法估计分
别为: , .4.(2020·福建师大附中高二期中)疫苗能够使人体获得对病毒的免疫力,是保护健康人群最有效的手
段.新冠肺炎疫情发生以来,军事医学科学院陈薇院土领衔的团队开展应急科研攻关,研制的重组新型冠
状病毒疫苗(腺病毒载体),于4月12日开始招募志愿者,进入二期临床试验.根据普遍规律,志愿者接
种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志
愿者身上采集血液样本,检测人体中抗体含量水平(单位: ,百万国际单位/毫升).
(1)IgM作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体
中IgM含量水平 与接种天数x(接种后每满24小时为一天, )近似满足函数关系:
,经研究表明,IgM含量水平不低于 时是免疫的有效时段,试估计接种一次
后IgM含量水平有效时段可经历的时间(向下取整).(参考数据: )
(2)IgG虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内
分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为 ,
)某志愿者人体中IgG的含量水平,记作 ,得到相关数
据如下表:
(次) 1 2 3 4 5 6 7
0.09 0.38 0.95 4.85 3.35 7.48 17.25
①请画出散点图,并根据散点图判断线性拟合模型 与指数拟合模型 哪种更适合拟合z与
t的关系(不必说明理由);
②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的 值.
附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中 .
4.9 0.6
205.48 39.87 -2.84 0.44 0.82 1.58
1 0
参考公式:线性回归直线 的分别为: ,
5.(2020·安徽省太和第一中学高二月考(文))某工厂生产不同规格的一种产品,根据检测标准,其
合格产品的质量 与尺寸 之间满足关系式 为大于 的常数),现随机抽取6件合格
产品,测得数据如下:
尺寸(mm) 38 48 58 68 78 88
质量(g) 16.8 18.8 20.7 22.4 24 25.5
对数据作了处理,相关统计量的值如下表:
75.3 24.6 18.3 101.4
(1)根据所给数据,求 关于 的回归方程(提示:由已知 与 呈线性关系);
(2)按照某项指标测定,当产品质量与尺寸的比在区间 内时为优等品,现从抽取的6件合格产品
中再任选3件,求恰好取得两件优等品的概率.
(附:对于一组数据 ,其回归直线 的斜率和截距的最小二乘法估计值分别为 )