文档内容
第27讲 统计案例和回归方程
【知识点总结】
一、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。
对于一组具有线性相关关系的数据(x,y),(x,y),…,(x,y),其回归方程 的求法为
1 1 2 2 n n
其中, , ,( , )称为样本点的中心。
步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,
直线斜率k>0,称两个变量正相关;k<0,称两个变量负相关。
二、独立性
独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。
步骤为列出22列联表(如表13-8所示),求出 ,并判断:
A A 合计
1 2
B a c a+c
1
B b d b+d
2
合计 a+b c+d n=a+b+c+d
若K2>10.828,有99.9%把握称“A取A 或A”对“B取B,B”有关系;
1 2 1 2
若10.828K2>6.635,有99%把握称“A取A 或A”对“B取B,B”有关系;
1 2 1 2
若6.635K2>3.841,有95%把握称“A取A 或A”对“B取B,B”有关系;
1 2 1 2
若K23.841,没有把握称A与B相关。
【典型例题】
例1.(2022·全国·高三专题练习(文))在对两个变量x,y进行回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据( , ),i=1,2,…,n;
xi yi
③求回归方程;④根据所收集的数据绘制散点图.
则下列操作顺序正确的是( )
A.①②④③ B.③②④① C.②③①④ D.②④③①
例2.(2022·全国·高三专题练习)对于数据组 ,如果由线性回归方程得到的对应于
自变量 的估计值是 ,那么将 称为相应于点 的残差.某工厂为研究某种产品产量 (吨)
与所需某种原材料 吨)的相关性,在生产过程中收集4组对应数据 如下表所示:
3 4 5 62.5 3 4
根据表中数据,得出 关于 的线性回归方程为 ,据此计算出样本点处的残差为-0.15,则表
中 的值为( )
A.3.3 B.4.5 C.5 D.5.5
例3.(2022·全国·高三专题练习)据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm
之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局
地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为 .通过模拟实验的方法来
估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数
( ,且 )表示是否下雨:当 时表示该地区下雨,当 时,表示该
地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出k的值,使得该地区每一天下雨的概率均为 ;并根据上述20组随机数估计该地区这3天中
恰好有2天下雨的概率;
(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:
时间 2016年 2017年 2018年 2019年 2020年
年份 1 2 3 4 5
降雨量 28 27 25 23 22
经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量 与年份 具有线性相关关系,求
回归直线方程 .并预测该地区2022年端午节有降雨的话,降雨量约为多少?
参考公式: , .
例4.(2022·全国·高三专题练习(理))某企业新研发了一种产品,产品的成本由原料成本及非原料成本
组成.每件产品的非原料成本 (元)与生产该产品的数量 (千件)有关,经统计得到如下数据:1 2 3 4 5 6 7 8
112 61 35 28 25 24
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型
和指数函数模型 分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程
为 与 的相关系数 .
(1)用反比例函数模型求 关于 的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 ,并用其估计产量为10千件时每件
产品的非原料成本.
参考数据:
360
参考公式:对于一组数据 ,其回归直线 的斜率和截距的最小一乘估计分
别为: , ,相关系数例5.(2022·全国·高三专题练习)如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:
万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择和 两个模型进行拟合,经过数据处理得到两个回归方程分别为
和 ,并得到以下一些统计量的值:
残差平方和
总偏差平方和
(1)请利用相关指数 判断哪个模型的拟合效果更好;
(2)估计该小区2021年6月份的二手房均价.(精确到 万元/平方米)
参考数据: , , , , , , ,
.参考公式:相关指数 .例6.(2022·全国·高三专题练习)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产
业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内
的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:
现根据散点图利用 或 建立y关于x的回归方程,令 , 得到如下数据:
10.15 109.94 3.04 0.16
13.94 -2.1 11.67 0.21 21.22
且( , )与( , )(i=1,2,3,…,13)的相关系数分别为 , ,且 =﹣0.9953.
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立 关于x的回归方程;
(3)已知蕲艾的利润z与x、y的关系为 ,当x为何值时,z的预报值最大.
参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374, =15.7365,对于一组数据( ,
)(i=1,2,3,…,n),其回归直线方程 的斜率和截距的最小二乘法估计分别为
, ,相关系数 .例7.(2022·河北张家口·高三期末)已知某区 、 两所初级中学的初一年级在校学生人数之比为 ,
该区教育局为了解双减政策的落实情况,用分层抽样的方法在 、 两校初一年级在校学生中共抽取了
名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:(1)在抽取的 名学生中, 、 两所学校各抽取的人数是多少?
(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做
作业时长超过 小时的学生比例,请根据频率分布直方图,估计这两个数值;
(3)另据调查,这 人中做作业时间超过 小时的人中的 人来自 中学,根据已知条件填写下面列联
表,并根据列联表判断是否有 的把握认为“做作业时间超过 小时”与“学校”有关?
做作业时间超过 小
做作业时间不超过 小时 合计
时
校
校
合计
附表:
附: .
【技能提升训练】
一、单选题
1.(2022·全国·高三专题练习)某工厂的每月各项开支 与毛利润 (单位:万元)之间有如下关系,
与的线性回归方程 ,则 ( )
2 4 5 6 8
30 40 60 50 70
A.17.5 B.17 C.15 D.15.5
2.(2021·重庆南开中学高三阶段练习)对两个变量y和x进行回归分析,得到一组样本数据: ,
,…, ,则下列说法中不正确的是( )
A.由样本数据得到的回归方程 必过样本中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
3.(2021·黑龙江·漠河市高级中学高三阶段练习(文))某单位为了了解办公楼用电量 (度)与气温
(℃)之间的关系,随机统计了四个工作量与当天平均气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得到线性回归方程 ,当气温为 ℃时,预测用电量均为
A.68度 B.52度 C.12度 D.28度
4.(2022·全国·高三专题练习)关于线性回归的描述,有下列命题:
①回归直线一定经过样本中心点;
②相关系数 的绝对值越大,拟合效果越好;
③相关指数 越接近1拟合效果越好;
④残差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
5.(2022·全国·高三专题练习)下列表述中,正确的个数是( )
①将一组数据中的每一个数据都加上同一个常数后,方差不变;
②设有一个回归方程 ,变量 增加1个单位时, 平均增加5个单位;③设具有相关关系的两个变量 , 的相关系数为 ,那么 越接近于0, , 之间的线性相关程度越高;
④在一个 列联表中,根据表中数据计算得到 的观测值 ,若 的值越大,则认为两个变量间有关的
把握就越大.
A.0 B.1 C.2 D.3
6.(2022·全国·高三专题练习(文))对两个变量y与x进行回归分析,分别选择不同的模型,它们的相
关系数r如下,其中拟合效果最好的模型是( )
A.0.2 B.0.8 C.-0.98 D.-0.7
7.(2022·全国·高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的
是( )
A. B.
C. D.
8.(2022·全国·高三专题练习(理))如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线
上,则下列说法错误的是( )
A.解释变量和预报变量是一次函数关系 B.相关系数
C.相关指数 D.残差平方和为0
9.(2022·全国·高三专题练习(理))对四组数据进行统计,获得如图所示的散点图,关于其相关系数的
比较,正确的是( )A. B.
C. D.
10.(2022·全国·高三专题练习(理))变量x,y的线性相关系数为 ,变量m,n的线性相关系数为 ,
下列说法错误的是( )
A.若 ,则说明变量x,y之间线性相关性强
B.若 ,则说明变量x,y之间的线性相关性比变量m,n之间的线性相关性强
C.若 ,则说明变量x,y之间的相关性为正相关
D.若 ,则说明变量x,y之间线性不相关
11.(2022·全国·高三专题练习(文))已知相关变量 和 的散点图如图所示,若用 与
拟合时的相关系数分别为 则比较 的大小结果为( )
A. B. C. D.不确定
12.(2022·全国·高三专题练习(文))在一组样本数据(x,y),(x,y),…,(x,y)(n≥2,
1 1 2 2 n nx,x,…,x 不全相等)的散点图中,若所有样本点(x,y)(i=1,2,…,n)都在直线y= x+1上,则这组样本数
1 2 n i i
据的样本相关系数为( )
A.-1 B.0 C. D.113.(2022·全国·高三专题练习)如图,5个 数据,去掉 后,下列说法错误的是( )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
14.(2022·全国·高三专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天
数据如下表:
第 天 1 2 3 4 5
使用人数( ) 15 173 457 842 1333
由表中数据可得y关于x的回归方程为 ,则据此回归模型相应于点(2,173)的残差为
( )
A. B. C.3 D.2
15.(2022·全国·高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩
生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线 一线 总计
愿生 45 20 65
不愿生 13 22 35
总计 58 42 100
计算得, .
参照下表,
0.050 0.010 0.001
3.841 6.635 10.828下列结论正确的是( )A.在犯错误的概率不超过 的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过 的前提下,认为“生育意愿与城市级别无关”
C.有 以上的把握认为“生育意愿与城市级别有关”
D.有 以上的把握认为“生育意愿与城市级别无关”
16.(2022·全国·高三专题练习)2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城
市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解
“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:
赞成“自助游” 不赞成“自助游” 合计
男性 30 15 45
女性 45 10 55
合计 75 25 100
参考公式: ,其中 .
0.15 0.10 0.05 0.025 0.010 0.005 0.001
x 2.072 2.706 3.841 5.024 6.635 7.879 10.828
0
参照公式,得到的正确结论是( )
A.有 以上的把握认为“赞成‘自助游’与性别无关”
B.有 以上的把握认为“赞成‘自助游’与性别有关”
C.在犯错误的概率不超过 的前提下,认为“赞成‘自助游’与性别无关”
D.在犯错误的概率不超过 的前提下,认为“赞成‘自助游’与性别有关”
17.(2022·全国·高三专题练习(文))为了了解某高中生对电视台某节目的态度,在某中学随机调查了
110名同学,得到如下列联表:
男 女 总计
喜欢 40 20 60
不喜
20 30 50
欢总计 60 50 110
由 算得 .
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”
C.有99%的把握认为“喜欢该节目与性别有关”
D.有99%的把握认为“喜欢该节目与性别无关”
18.(2022·全国·高三专题练习(文))为了解某高校学生使用手机支付和现金支付的情况,抽取了部分
学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:
根据图中的信息,下列结论中不正确的是( )
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
19.(2021·全国·高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分
男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
二、多选题
20.(2021·山东聊城·三模)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的
样本点数据 ,则下列结论正确的是( )
A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点
B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心
C.若以模型 拟合该组数据,为了求出回归方程,设 ,将其变换后得到线性方程
,则a,b的估计值分别是3和6.
D.用 来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直
线上,则 的值为1
21.(2021·辽宁朝阳·一模)关于变量 、 的 个样本点 、 、 、 及其线性回归方
程: ,下列说法正确的有( )
A.若相关系数 越小,则表示 、 的线性相关程度越弱B.若线性回归方程中的 ,则表示变量 、 正相关
C.若残差平方和越大,则表示线性回归方程拟合效果越好D.若 , ,则点 一定在回归直线 上
22.(2022·江苏·高三专题练习)则下列说法正确的是( )
A.在回归分析中,残差的平方和越小,模型的拟合效果越好;
B.在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
C.若数据 , ,…, 的平均数为1,则 , ,… 的平均数为2;
D.对分类变量 与 的随机变量 的观测值 来说, 越小,判断“ 与 有关系”的把握越大.
23.(2022·全国·高三专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”
作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 ,女生喜欢抖音的人
数占女生人数 ,若有 的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人
附表:
0.050 0.010
3.841 6.635
附:
A.25 B.45 C.60 D.75
三、填空题
24.(2022·全国·高三专题练习)有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数
据:
近视 不近视 总计
少看手机
多看手机
总计
则在犯错误的概率不超过__________的前提下认为近视与多看手机有关系.
附表:参考公式: ,其中 .
四、解答题
25.(2022·全国·高三专题练习(文))近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统
计,我市一家新能源企业近5个月的产值如下表:
月 份 5月 6月 7月 8月 9月
月份代码 1 2 3 4 5
产值 亿元 16 20 27 30 37
(1)根据上表数据,计算 与 的线性相关系数 ,并说明 与 的线性相关性强弱;( ,则认
为 与 线性相关性很强; ,则认为 与 线性相关性不强)
(2)求出 关于 的线性回归方程,并预测10月该企业的产值.
参考公式: ;
参考数据: .
26.(2021·江西·模拟预测(文))某科技公司研发了一项新产品 ,经过市场调研,对公司1月份至6
月份销售量及销售单价进行统计,销售单价 (千元)和销售量 (千件)之间的一组数据如下表所示:
月份 1 2 3 4 5 6
销售单价销售量
(1)试根据1至5月份的数据,建立 关于 的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过 千元,则认为所得到的回归
直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?
参考公式:回归直线方程 ,其中 .
参考数据: , .
27.(2022·河南·温县第一高级中学高三阶段练习(理))身高体重指数(BMI)的大小直接关系到人的健
康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测
量其身高、体重(数据如下表)并进行线性回归分析,得到线性回归方程为 ,因为某些原因,
3号学生的体重数据丢失.
学生编号 1 2 3 4 5
身高 165 170 175 170 170
体重 58 62 65 63
(1)求表格中的 值;
(2)已知公式 可以用来刻画回归的效果,请问学生的体重差异约有百分之多少是由身
高引起的.(注:结果四舍五入取整数)
28.(2022·全国·高三专题练习)2021年6月17日9时22分,我国酒泉卫星发射中心用长征 遥十二运
载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,
发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的
重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
当 时,建立了y与x的两个回归模型:模型①: ,模型②: ;当
时,确定y与x满足的线性回归方程为 .
(1)根据下列表格中的数据,比较当 时模型①,②的相关指数 的大小,并选择拟合精度更高、
更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;
回归模型 模型① 模型②
回归方程
79.13 20.2
(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预
测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收
益+国家补贴)的大小.
附:刻画回归效果的相关指数 ,且当 越大时,回归方程的拟合效果越好. .
用最小二乘法求线性回归方程 的截距: .
29.(2021·河南·一模(文))近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚
种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农
户的数据,进行回归分析,得到两个回归摸型:模型①: ,模型②:
,对以上两个回归方程进行残差分析,得到下表:
种植面积 (亩) 2 3 4 5 7 9每亩种植管理成本
25 24 21 22 16 14
(百元)
估计值
25.27 23.62 21.97 17.02 13.72
模型①
残差 -0.27 0.38 -0.97 -1.02 0.28
26.84 20.17 18.83 17.31 16.46
模型②
-1.84 0.83 3.17 -1.31 -2.46
(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;
(2)视残差 的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据
后,重新求回归方程.
附: , ;
30.(2021·全国·模拟预测)婺源位于江西省东北部,其境内古村落遍布乡野,保存完整,生态优美,物
产丰富,拥有着油菜花之乡的美誉,被誉为一颗镶嵌在赣、浙、皖三省交界处的绿色明珠.为了调查某片
实验田3月份油菜花的生长高度,研究人员在当地随机抽取了13株油菜花进行高度测量,所得数据如下:
, , , , , ,
, , .并通过绘制及观察散点图,选用两种模型进行拟合:模型一: ,其中令 ;
模型二: ,其中令 .
(1)求模型二的回归方程;
(2)试通过计算相关系数的大小,说明对于所给数据,哪一种模型更加合适.
参考数据: , , , .
附:对于一组数据 , ,…, ,其回归方程 的斜率和截距的最小二乘估计分
别为 , ,相关系数 .
31.(2021·陕西·西安中学高三阶段练习(文))我国为全面建设社会主义现代化国家,制定了从2021年
到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,
现该企业为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二
五”和“十三五”规划发展期间近10年年研发资金投入额 和年盈利额 的数据.通过对比分析,建立了
两个函数模型:① ;② ,其中 均为常数,e为自然对数的底数.令 ,
,经计算得如下数据:
26 215 65 2 680 5.3611250 130 2.6 12
(1)请从相关系数的角度,分析哪一个模型拟合程度更好;
(2)根据(1)的选择及表中数据,建立y关于x的回归方程(回归系数精确到0.01).附:相关系数 ,
线性回归直线方程 ,其中附: , .
32.(2021·四川·成都七中一模(文))某投资公司2012年至2021年每年的投资金额 (单位:万元)与
年利润增量 (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润
增量,建立了 关于 的两个回归模型;模型①:由最小二乘公式可求得 与 的线性回归方程:
;模型②:由图中样本点的分布,可以认为样本点集中在由线: 的附近,对投
资金额 做换元,令 ,则 ,且有 ,
(1)根据所给的统计量,求模型②中 关于 的回归方程;
(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);
附:样本 的最小乘估计公式为 ;参考数据:
.33.(2021·云南师大附中高三阶段练习(文))近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.
一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染
的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解
决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施
用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施
用量为 (单位:公斤),粮食亩产量为 (单位:百公斤).
参考数据:
650 91.5 52.5 1478.6 30.5 15 15 46.5
表中 .
(1)根据散点图判断, 与 ,哪一个适宜作为粮食亩产量 关于化肥施用量 的回归方程类
型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立 关于 的回归方程;
(3)根据(2)的回归方程,并预测化肥施用量为27公斤时,粮食亩产量 的值;
附:①对于一组数据 ,其回归直线 的斜率和截距的最小二乘估计分别为
;②取 .
34.(2021·河北·高三阶段练习)《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短
期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发
布的我国 市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以
及商品详情页的人群)性别分析数据. 市对购买家电类新锐品牌人群中随机调查了100位男性顾客和100
位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如下的频数分布表:
消费金额(元)
女性顾客人数 50 30 10 6 4
男性顾客人数 20 40 24 10 6
(1)若以我国 市2021年上半年新锐品牌人群用户性别分析数据作为 市抽取新锐品牌人群中性别概率,
从 市新锐品牌人群中随机抽取四人, 为四人中男性的人数,求 的概率分布列和期望.
(2)根据 市统计购买家电消费金额数据频数分布表,完成下列 列联表,并根据列联表,判断是否有
99%的把握认为购买家电类新锐品牌人群消费金额千元以上与性别有关?
不超千元 千元以上 合计
女性顾客
男性顾客
合计
附: ,
0.050 0.010 0.0013.841 6.635 10.828
35.(2022·全国·高三专题练习)某中学随机抽查了 名同学的每天课外阅读时间,得到如下统计表:
时长(分)
人数
(1)求这 名同学的平均阅读时长(用区间中点值代表每个人的阅读时长);
(2)在阅读时长位于 的 人中任选 人,求甲同学被选中的概率;
(3)进一步调查发现,语文成绩和每天的课外阅读时间有很大关系,每天的课外阅读时间多于半小时称
为“阅读迷”,语文成绩达到 分视为优秀,根据每天的课外阅读时间和语文成绩是否优秀,制成一个
列联表:
阅读迷 非阅读迷 合计
语文成绩优秀
语文成绩不优秀
合计
根据表中数据,判断是否有 的把握认为语文成绩是否优秀与课外阅读时间有关.
参考公式: ,其中 .
参考数据:
36.(2022·全国·高三专题练习)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做
试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和
表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积 [60,65) [65,70) [70,75) [75,80)
频数 30 40 20 10
表2:注射药物B后皮肤疱疹面积的频数分布表
[60,
疱疹面积 [65,70) [70,75) [75,80) [80,85)
65)
频数 10 25 20 30 15
(1)完成下面2×2列联表;
疱疹面积小于70 mm2 疱疹面积不小于70 mm2 总计
注射药物A a= b=
注射药物B c= d=
总计 n=
(2)能否在犯错误概率不超过0.01的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面
积有差异”?
37.(2022·全国·高三专题练习)某淘宝店经过对春节七天假期的消费者进行统计,发现在金额不超过
1000元的消费者中男女比例为 ,该店按此比例抽取了100名消费者进行进一步分析,得到下表女性消
费情况:
消费金额(元)
人数 5 10 15 47 3
男性消费情况:消费金额(元)
人数 2 3 10 3 2
若消费金额不低于600元的网购者为“网购达人”,低于600元的网购者为“非网购达人”
(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?
(2)根据以上统计数据填写如下 列联表,并回答能否在犯错误的概率不超过 的前提下认为“是否
为‘网购达人’与性别有关”.
女性 男性 合计
“网购达人”
“非网购达人”
合计
附: .