文档内容
课时规范练 61 成对数据的统计分析
n n
∑(x -x)(y - y) ∑x y -nx y
参考公式:样本相关系数r=i=1 i i =i=1 i i ,经验回
√ n √ n √ n √ n
∑(x -x)2 ∑(y - y)2 ∑x2-nx2 ∑y2-n y2
i i i i
i=1 i=1 i=1 i=1
归方程^ ^ ^x中斜率与截距的最小二乘估计公式分别为
y=a+b
n n
∑(x -x)(y - y) ∑x y -nx y
b ^ =i=1 i i =i=1 i i ,a ^ = y−b ^ x .
n n
∑(x -x)2 ∑x2-nx2
i i
i=1 i=1
基础巩固练
1.(多选题)(2024·山东菏泽模拟)某公司给一款新产品投放广告,根据统计,投入x(单位:万
元)的广告费与该产品的收益y(单位:万元)的统计数据如下表所示,根据表中的数据可得
到经验回归方程为^ ^x+2.6,则下列结论正确的是( )
y=b
x 5 6 8 9 12
y 16 20 25 28 36
A.y与x的样本相关系数r>0
B.^=2.8
b
C.当投入15万元的广告费时,该产品的收益一定是44.6万元
D.x=12时,残差为0.2
2.(2024·山东菏泽模拟)已知x,y之间的一组数据:
x 1 4 9 16
y 1 2.98 5.01 7.01
若y与 满足回归方程 ^ ^ ^,则此曲线必过点 .
√x y=b√x+a
3.(13分)(2025·八省联考,15)为考察某种药物A对预防疾病B的效果,进行了动物(单位:
只)试验,得到如下列联表:
疾病
药物 合计
未患病 患病
未服用 100 80 s
关注精品公众号【偷着学】或添加微信:tzx985tzx服用 150 70 220
合计 250 t 400
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为p,给出p的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
n(ad-bc)2
附:χ2= .
(a+b)(c+d)(a+c)(b+d)
α 0.050 0.010 0.001
x 3.841 6.635 10.828
α
4.(13分)(2024·安徽合肥模拟)近年来,我国新能源汽车技术水平不断进步、产品性能明
显提升,产销规模连续六年位居世界首位.某汽车城从某天开始连续的营业天数x与新能
源汽车销售总量y(单位:辆)的统计数据如下表所示:
从某天开始连续的营业天数x 10 20 30 40 50
新能源汽车销售总量y/辆 62 68 75 81 89
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的经验回归方程
^
^x+^,并预测该汽车城连续营业130天的汽车销售总量.
y=b a
5 5
参考数据:∑x
i
y
i
=11 920,∑y2=28 575,
√5
≈2.236.
i
i=1 i=1
综合提升练
5.(2024·福建宁德三模)在某活动现场,为了解不同时段的入口游客人流量,从上午10点
开始第一次向指挥中心反馈入口人流量,以后每过一个小时反馈一次.指挥中心统计了前
5次的数据(i,y),其中i=1,2,3,4,5,y 为第i次入口人流量数据(单位:百人),由此得到y关于
i i
i的回归方程 y ^ =b ^log 2 (i+1)+5.已知 y =9,根据回归方程(参考数据:log 2 3≈1.6,log 2 5≈2.3),可
预测下午4点时入口游客的人流量为( )
A.9.6 B.11.0
C.11.3 D.12.0
6.(13分)(2024·广东江门模拟)某电动车公司为了抢占更多的市场份额,计划加大广告投
入.该公司近5年的年广告费x(单位:百万元)和年销售量y(单位:百万辆)关系如图所示:
i i
关注精品公众号【偷着学】或添加微信:tzx985tzx令v=ln x(i=1,2,…,5),数据经过初步处理得:
i i
5 5 5 5 5
5 5 ∑(x- ∑(y- ∑(v- ∑(x-x)· ∑(y-y)·
∑y
i
∑v
i i=1
i
i=1
i
i=1
i
i=1
i
i=1
i
i=1 i=1 x)2 y)2 v)2 (y-y) (v-v)
i i
44 4.8 10 40.3 1.612 19.5 8.06
现有① ^ ^x+^ 和② ^ ^ln x+^ 两种方案作为年销售量y关于年广告费x的回归方程模
y=b a y=n m
型,其中a,b,m,n均为常数.
(1)请从样本相关系数的角度,分析哪一个模型拟合程度更好?(不能整除的保留2位小数)
(2)根据(1)的判断结果及表中数据,求出y关于x的回归方程,并预测年广告费为600万元
时,产品的年销售量是多少?
参考数据:√40.3×1.612=8.06,√403≈20.1,ln 5≈1.6,ln 6≈1.8.
答案:
1.AB 解析 由表格可知,x越大,y越大,所以x与y正相关,所以样本相关系数r>0,故A正确;
x=
5+6+8+9+12
=8,y=
16+20+25+28+36
=25,则经验回归直线经过点(8,25),则25=8^+2.6,
b
5 5
所以^=2.8,故B正确;因为^=2.8x+2.6,当x=15时,^=2.8×15+2.6=44.6,该产品的收益大概是44.6
b y y
万元,C选项错误;因为^=2.8x+2.6,当x=12时,^=2.8×12+2.6=36.2,则残差为y-^=36-36.2=-0.2,
y y y
故D选项错误.故选AB.
1+2+3+4 1+2.98+5.01+7.01
2.(6.25,4) 解析 依题意,
√x
的平均数为 =2.5,y= =4,所以此
4 4
曲线必过点(6.25,4).
3.解 (1)由列联表知s=100+80=180,t=80+70=150.
(2)由列联表知,未服用药物A的动物有s=180只,
未服用药物A且患疾病B的动物有80只,
关注精品公众号【偷着学】或添加微信:tzx985tzx80 4
所以未服用药物A的动物患疾病B的频率为 = ,所以未服用药物A的动物患疾病B的概
180 9
4
率的估计值为p=
.
9
(3)零假设为H :药物A对预防疾病B无效,由列联表得到χ2=
0
400×(100×70-150×80)2 2 000
= ≈6.734>6.635,
180×220×250×150 297
根据小概率值α=0.01的独立性检验,推断H 不成立,即认为药物A对预防疾病B有效,该推断犯
0
错误的概率不超过0.01.
10+20+30+40+50 62+68+75+81+89
4.解 (1)x= =30,y= =75,
5 5
5
5
x y
=5×30×75=11 250,∑x2=102+202+302+402+502=5 500,则样本相关系数r=
i
i=1
5
∑x y -5x y
i i 11 920-11 250 670
i=1 = = ≈ 0.999.
√ 5 √ 5 √5 500-5×302×√28 575-5×752 √1 000×√450
∑x2-5x2 ∑y2-5 y2
i i
i=1 i=1
由此可以认为y与x的相关性很强,
从而可用线性回归模型拟合y与x的关系.
5
∑x y -5x y
(2)由(1)得 b ^ =i=1 i i = 670 =0.67,
5 1 000
∑x2-5x2
i
i=1
^ ^ =75-0.67×30=54.9,所以y关于x的经验回归方程为^=0.67x+54.9.
a= y−bx y
将x=130代入^=0.67x+54.9,得^=0.67×130+54.9=142,所以预测该汽车城连续营业130天的汽
y y
车销售总量为142辆.
5.C 解析 设x=log
2
(i+1),i=1,2,3,4,5,则^ ^x+5,所以
y=b
log 2+log 3+log 4+log 5+log 6 4+2log 3+log 5 4+2×1.6+2.3
x= 2 2 2 2 2 = 2 2 ≈ =1.9,且y
5 5 5
关注精品公众号【偷着学】或添加微信:tzx985tzx=9,则9=
b
^
×
1.9+5,得b ^ = 4 ≈2.1,所以
y
^=2.1log
2
(i+1)+5,下午4点对应的i=7,此时预测游客的
1.9
人流量^=2.1×log 8+5=11.3.
2
y
6.解 (1)设模型①和②的样本相关系数分别为r ,r .
1 2
5
∑(x -x)(y - y)
由题意可得r 1 =i=1
i i
=
19.5
≈
19.5
≈ 0.97,
√ 5 √ 5 √403 20.1
∑(x -x)2 ∑(y - y)2
i i
i=1 i=1
65
(说明:若化简成r 1≈ ,再比较r 1 与r 2 的大小亦可)
67
令v=ln x,则^=nv+m,
y
5
∑(y - y)(v -v)
则r 2 =i=1
i i
=
8.06
=
8.06
=1,
√ 5 √ 5 √40.3×√1.612 8.06
∑(y - y)2 ∑(v -v)2
i i
i=1 i=1
所以|r |<|r |,由样本相关系数的相关性质可得,模型②的拟合程度更好.
1 2
5
∑(y - y)(v -v)
(2)由条件得 n ^ =i=1 i i = 8.06 =5,又由 v= 1 ∑ 5 v i =0.96, y= 1 ∑ 5 y i =8.8,得 m ^ = y -5 v
5 1.612 5 5
∑(v -v)2 i=1 i=1
i
i=1
=8.8-0.96×5=4,所以^=5v+4,即y关于x的回归方程为^=5ln x+4,当x=6时,y=5ln 6+4≈13,因此
y y
当年广告费为600万元时,产品的销售量约为1 300万辆
(3)成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群
552511468也可联系微信fjshuxue加入百度网盘群4000G一线老师必备资料一键转存自动更新
永不过期
(4)
关注精品公众号【偷着学】或添加微信:tzx985tzx