文档内容
金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
计量经济学知识点归纳讲义
-----本资料属www.wuyouqiuzhi.com及旗下天天向上求职工作室&职场精英工作室独家所有,仅限购买者
个人使用,不得分享/转赠/转卖;版权所有,盗版可耻
-----除历年真题外,整套资料还包括了红宝书讲义,完整讲义知识点,在线考试系统(电脑版网址为
www.wuyouqiuzhi.com),移动端刷题软件(名称为:笔试通,苹果商店及安卓各大市场搜索即可下载安装),
在线考试系统和移动端刷题软件购买时会配备账号密码,不会另付费。如缺失以上任何一项,说明资料不
是正版,请从正版处购买
使
-----唯一公众账号为 金融业招聘资讯(yinhangqiuzhi),用于更新每月时政,招聘资讯等。绝对没有通过其
天
他任何公众账号出售资料,任何公众账号出售本资料的均为无良盗版,小请从正版处购买
小
使
蓝
-----正版购买地址:官网www.wuyouqiuzhi.com及旗下淘宝店
蔚
:天天向上求职工作室天(唯一客服:galerjim)
小
或职场精英工作室(唯一客服:蔚蓝小小天使),或者下载:移动端刷题软件(名称为:笔试通)亦可购买
小
服 使
蓝
客 天
第一章 满足经旺典假定下的参数估蔚计
小
:
旺 小
一、基本概念——变量、数据与模型 服
宝 蓝
客
淘 蔚
(一)、经济变量 具有特定的经济含义影响经济系统的因旺素,它是构成方程式的最基本要素,变量的基
一 :
旺
唯 服
本特征是要求具有可观测和可计量。 宝
, 客
淘
品 旺
1、变量的类型 一
出 旺
唯
室 宝
●被解释变量(应变量、作因变量) ●解,释变量 (自变
淘
量)
品
工 一
被解释变量与解释英变量之间的关系强调出的是单向因果关
唯
系,即解释变量影响被解释变量,反之不行。
室
精 ,
作
注:被解释变场量为服从正态分布的连续随机变量
品
(这是“经典”的核心)。
工
职 出
英
● 内生变量(强调其随机性和不可控制性)室
精
作
场
● 外生变量(强调其确定性和可控制性工)
职
英
● 内生变量与外生变量的关系:外精生变量控制影响内生变量,而内生变量不能控制影响外生变量
场
●滞后内生变量(动态变量、职能否控制信息)
●前定变量=外生变量+滞后内生变量
(二)数据
1、时间数列数据;2、截面数据;3、面板数据4、虚拟变量数据(离散数据)
(三)模型设定
1、模型和方程:方程是模型的基本单位;
决定方程的两要素是变量的个数和方程的函数形式。
2、在模型设定过程中应注意的问题
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
基于经济理论的认识;模型的数学形式;变量的取舍。
3、计量经济模型对数据质量的基本要求
●真实性 ●可靠性 ●完整性 ●一致性 ●可比性
二、在总体回归函数中引入随机扰动项的原因:初级计量P26-27.
使
天
小
小
使
蓝
天
蔚
小
:
小
服 使
蓝
客 天
蔚
旺 小
:
旺 小
服
宝 蓝
客
淘 蔚
旺
三、经典假定的内容 一 :
旺
唯 服
宝
, 客
淘
(一)经典假定 品 旺
一
出 旺
唯
室 宝
1、零均值假定。2、同作方差假定。3、无自,相关假定。4、解
淘
释变量与随机误差项不相关。5、无多重共线
品
工 一
出
性假定。6、正态性假定英。
唯
室
精 ,
作
场 品
还有:回归模型关于参数线性工;在重复抽样中X值是固定的(或X是非随机的);X的值要有变异;模型
职 出
英
室
设定是正确的。 精
作
场
工
(二)多元线性回归职模型的基本假定(用矩阵表示)。
英
精
1、零均值假定
场
职
U = (u ,u ,,u )'
1 2 n
∴E(U)= E(u ,u ,,u )' =(Eu ,,Eu )' = 0
1 2 n 1 n
(E(u )= 0;i =1,2,,n)
i
2、同方差和无自相关假定
Var(u | X )=σ2,i = j
Cov−Var(U)=σ2I i i (条件方差不变、条件自相关等于0)
Cov(u ,u | X ,X )=0,i ≠ j
i j i j
3、随机扰动项与解释变量不相关假定 E(X′U)=0
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
4、无多重共线性假定。 Rank(X′X)=k
5、正态性假定 u 独立同分布,且u ~N(0, σ2 )
i i
(三)经典假定的再认识
1、零均值
(1)对固定的 X值,随机扰动项u 的条件均值为零。由E(u| X )=0可以得到两个基本含义:一是
i i
E(u)=0;二是u 的均值不依赖于X,这意味着u 与X,包括X的任何函数都不相关,如X2,ln(X),eX 等形
i i
式。 使
天
小
(2)在固定X值下,对于Y的变动总是围绕其均值上下波动,离开均值上下方的距离就是u 。正的u 与
小 i i
使
蓝
天
蔚
负的u 相互抵消,它们对Y的平均影响应该为零。
小
i :
小
服 使
蓝
(3)假定E(u| X )=0,也就意味着,只能E(Y客| X )=β+βX 成立。 天
i i 1 2 蔚i
旺 小
:
旺 小
(4)Y值的变动无异常(即无极端值表现)。 服
宝 蓝
客
淘 蔚
(5)如果E(u| X )=0成立,则X具一有强外生性。此时 旺 ,X为非随机的。 :
i 旺
唯 服
宝
(6)模型的函数关系无错误设定 , ;没有缺失重要淘解释变量。 客
品 旺
一
2、X与u不相关 出 唯 旺
室 宝
,
作 淘
该假定保证了获得参工数的可靠估计。
出
否品则,我们就不能
一
估计出在其它条件不变下的影响程度β
2
。
英 唯
室
精 ,
(1)该假定意味着,在模型Y 作=β+βX +u 中,X和u对Y有各自的影响。
场 i 1 2 i i品
工
职 出
英
(2)如果X与u是相关的,就不能评估它们室各自对Y的影响。
精
作
场
(3)对于cov(X ,u职)= E(X u ),如果工X是非随机的,这时有E(X u )= X E(u )=0 (E(u )=0);
i i i i 英 i i i i i
精
但如果X是随机的,由于不一定有E场(X u )= E(X )E(u ),所以这时提出该假定就有意义了。
i i i i
职
(4)在模型Y =β+βX +u 中, 如果u中的(其它)因素保持不变,就意味着u的变化为零,即∆u =0,
i 1 2 i i
那么X对Y的线性影响为:∆Y =β∆X ,Y的变化量是β 和X的变化量的简单乘积。如果没有该假定,上述
2 2
解释就不成立。
(5)在正态性下,该假定意味着u 与X 之间随机独立。
i
(6)在X 为强外生的情况下,有:
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
Cov(X ,u )= E[(X −E(X ))(u −E(u ))]
i i i i i i
= E[(X −E(X ))u ]
i i i
= E[X u −u E(X )]
i i i i
= E(X u )−E(u )E(X ) (E(u )=0)
i i i i i
= X E(u )=0
i i
如果X与u相互独立,则X具有强外生性。通常该假定 只意味着X是外生的。
3、同方差
(1)在固定X值的条件下,随机扰动项u 的方差为一固定常数。
i
(2)在这假定下,消费支出方差在所有的收入水平上都保持不变。即表 明对应于X值的全部Y值都有同
使
天
样的重要性。
小
小
(3)同方差性意味着,Var(Y | X )=σ2。 蓝 使
i 天
蔚
小
:
4、无自相关(无序列相关) 小
服 使
蓝
客 天
(1)给定X,任意两个Y值对其E(Y | X
i
)的离旺差都不会表现为
:
相蔚关关系。
小
旺 小
服
(2)在该假定下,只考虑X对Y的系统性宝影响和是否有影响,而不去担心由于蓝u之间的可能相关造成的
客
淘 蔚
旺
其它作用于Y的影响。 一 :
旺
唯 服
宝
5、正态性 , 淘 客
品 旺
一
出 旺
(1)因为有了正态性假定室,就有u ~ N(0
,
,σ唯2),也就有Y ~
宝
N(β
1
+β
2
X,σ2),进一步可推导出参数估
作 淘
品
计的分布。 工 一
出
英 唯
室
(2)根据中心精极限定理,在大样本下,可得到u渐,进服从正态分布。
作
场 品
工
6、除了以 职 上假定外,还要注意: 出
英
室
精
(1)X在重复抽样中取场固定值 作
工
职
(2)X的值要有变异性 英
精
场
(3)样本观测次数要大于参数个数
职
(4)正确设定了模型
四、最小二乘估计OLS
(一)OLS估计式的离差形式:
βˆ =Y −βˆ X
1 2
∑(X −X)(Y −Y) ∑x y
βˆ = i i = i i
2 ∑(X −X)2 ∑x2
i i
x = X −X, y =Y −Y
i i i i
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(二)OLS回归线的性质
1、βˆ、βˆ 分别是样本(X ,Y)的线性组合,由于Y的随机性使得βˆ、βˆ 是随机变量,并且是β、β 的
1 2 i i 1 2 1 2
点估计。
2、回归线通过样本均值点(X,Y); 3、Y ˆ =Y ; 4、∑e =0
i
5、Cov(Y ˆ ,e)=0; 6、Cov(X ,e)=0
i i i i
(三)过原点回归
定义:设一元线性回归模型为 Y =β+βX +u ; 当β =0时,Y使=β X +u ,则称此式为“过原点
i 1 2 i i 1 i 2 i i
天
回归”。 小
小
使
蓝
天
特点:由最小二乘法,对表达式: ∑e2 =∑(Y −βˆ X 蔚 )2 (2) 小
i i :2 i
小
服 使
蓝
客 天
求βˆ 使式(2)有最小值。即对式(2)求导数旺得 蔚
小
2 :
旺 小
服
宝 蓝
客
d∑e2 淘 蔚
i =2∑ 一(Y −βˆ X )(−X ) 旺 (3) :
dβˆ
2 唯
i 2 i
宝
旺i
服
, 客
淘
品 旺
出 ∑X Y 一 旺
令其等于零,并化简得: βˆ = i i 唯 (4)
2 室 ∑X2 , 宝
作 i 淘
品
工 一
出
英 唯
将 Y =βX +u 代 精 入 上 式 得作: 室 βˆ =β + ∑ , X i u i ( 5 )
i 2 i 场i
工
2 2 品∑X2
职 出 i
英
室
显然,满足E(βˆ )=β ,并且 精 , 作
2 2 场
工
职
英
精 ∑X u σ2
Var(βˆ )= E(βˆ 场−β)2 = E( i i)2 =
2
职
2 2 ∑X2 ∑X2
i i
在令式(3)等于零时,即有∑X e =0;对于有截距项的模型,除了这个性质外,还有∑e =0。但对于
i i i
无截距项的模型,∑e =0 就不一定成立。事实上,如果∑e =0 成立,则对于样本回归模型有:
i i
∑Y =βˆ ∑X +∑e
i 2 i i
由假定 ∑e =0成立,则:∑Y =βˆ ∑X
i i 2 i
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
∑Y
解出βˆ 有:βˆ = i (6)
2 2 ∑X
i
式(6)与式(4)估计的结果矛盾,所以,当模型无截距项时,∑e =0就不一定成立。进一步还可得到Y =Y ˆ
i
不一定成立。
对于无截距项的模型式(1),拟合优度有可能出现负值。事实上,由拟合优度定义可知:
RSS
∑e2
R2 =1− =1− i (y =Y −Y)
TSS ∑y2 i i
i
使
天
当有截距项时,RSS =∑e2 =∑y2 −βˆ2∑x2 ≤∑y2 (y =Y −小Y,x = X −X)
i i 2 i i i i i i
小
使
蓝
天
并且,TSS−RSS =∑y2 −(∑y2 −βˆ2∑x2)=βˆ2∑x2 >0 蔚
小
i i 2 i 2 i :
小
服 使
蓝
客 天
表明RSS ≤TSS,所以,拟合βˆ
2
2∑x
i
2 优度R2不可旺能为负值。但
:
对蔚于无截距项的模
小
型,则为如下结果:
旺 小
服
RSS =∑e2 =∑Y2 −βˆ2∑X2 宝 客 蓝
i i 2 i 淘 蔚
旺
一 :
旺
唯 服
并且,TSS−RSS =∑Y2 −nY2 −(∑,Y2 −βˆ2∑X2) 宝 =βˆ2∑X2 −nY客 2
i i 2 i淘 2 i
品 旺
一
出 旺
唯
当出现βˆ2∑X2 t (n−k),则拒绝H,同时接受H。表明第j个解释变量X对被解释变量Y存
βˆ α 0 1 j
j
2
在显著性影响;否则,表明第j个解释变量X对被解释变量Y不存在显著性影响。
j
2、F检验与t检验的联系与区别
(1)联系。在一元回归模型中,有t2=F,即一元回归模型条件下,t检验与F 检验是一致的。但在多元
回归模型中,则没有这一关系,甚至有的时候它们之间存在完全相反的检验结果。
(2)区别:t检验是针对个别参数的显著性,而F检验是针对模型整体的 显著性。
使
天
3、F检验与可决系数R2的关系
小
小
使
蓝
天
F(k −1) 蔚
R 2 = 小
:
n−k +(k −1)F 小
服 使
蓝
根据这一关系式(或初级计量;P87),可知当样本 客 容量较大时,拟合优度可低一些,天但当样本容量较小
蔚
旺 小
:
时,则拟合优度要求就高。否则显著性检验难以通 旺 过。 服 小
宝 蓝
客
通过可决系数与F检验的特点,实际上F 淘 检验可以看是对旺R2的显著性检验。蔚
一 :
旺
唯 服
宝
, 客
淘
品 旺
一
出 旺
唯
室 宝
,
作 淘
品
工 一
出
英 唯
室
精 ,
作
场 品
工
职 出
英
室
精
作
场
工
职
英
精
场
职
七、一般线性框架下的假设检验
(一)“有约束”与“无约束”检验。
对未知参数有约束限制的模型进行回归后的结果,与对没有约束限制的模型回归后的参数检验的结果是
否一致?答案:一致的。(中级计量;P -P )
21 22
(二)三大检验的理解和认识
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
由于三大检验均来自F检验的一般形式(即另一种形式),所以,从理论上讲,如果把F检验放在一起的
话,并且,t检验看成是F检验的一个特殊情况,对模型检验(包括系数和函数)的方法应该有四种,即F检
验、LR似然比检验、Wald检验和LM拉格朗日乘数检验。
1、F检验
(E' E −E'E) q
F = ∗ ∗ ~ F(q,n−k)
E'E (n−k)
其中,q为参数中非零的个数,k为无约束的参数个数。F检验的思想是当有约束与无约束很接近的时候,F
的值应该比较小(小于给定显著性水平下的临界值),这个时候不拒绝约束条件。反过来,当F的值大于给定
显著性水平下的临界值,则拒绝约束条件,认为有约束与无约束存在显著性差异。F检验的不足是只能检验线
使
性约束条件 天
小
2、似然比检验(LR) 小
使
蓝
天
蔚
LR检验只适用于对线性约束的检验。该检验的基本思路
:
:如果约束条件成小立,则相应的约束条件的对数
小
服 使
似然函数的最大值与无约束条件的对数似然函数的最大客值应该是近似相等蓝的,这个时候构
天
造的LR似然比应该
蔚
旺 小
L(B ,σ2) 旺 : 小 a
比较接近1,即λ=
L(B ˆ ,σˆ2)
≈1。由此得到
淘
统宝计量 LR=−2
客
lnλ服=2
lnL(B ˆ
蔚
,σˆ
蓝
2)−lnL(B ,σ2)
~χ2(q)
旺
一 :
旺
唯 服
计算LR统计量需要分别拟合无约
,
束模型和有约束模宝型。在大样本下
客
,统计量LR服从自由度为假设中约
淘
品 旺
束条件个数的卡方分布。 一
出 旺
唯
室 宝
,
作 淘
事实上,前面讲的各种检验,如t检验、品F检验等都可以根据似然比原理推导出来。这说明似然比检验是
工 一
出
英 唯
统计检验的理论基础。 室
精 ,
作
场 品
工
3、沃尔德检 职 验(Wald)
英
出
室
精
作
场
W 检验适用于线 性或非线性约束条件的工检验,其优点是只需要估计出无约束模型,当约束模型的估计很
职
英
困难时,该方法尤其适用。 W 检验的精原理是通过测量无约束估计量与约束估计量之间的距离来实现对约束条
场
件的检验。 职
当约束条件成立时,有约束的估计量的结果与约束条件应该一致。但无约束的估计量是否也是一样?则
须构造无约束估计量的统计分布,以此判断约束假设的真伪。
4、拉格朗日乘数检验(LM )
LM 检验只需估计有约束模型,当施加约束条件后的模型形式变得简单时,通常使用该检验。
LM 检验的具体步骤如下:
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
1、用OLS估计约束模型,计算残差序列e 。
i
2、建立LM 辅助回归式: e =α +αX +αX ++αX +v
i 1 2 2i 3 3i k ki i
其中,v为随机误差项,
3、用OLS估计上式并计算可决系数R2。
4、得到LM 统计量: LM =nR2 ~χ2(q)
使
5、给定显著性水平α,查卡方分布表,得临界值χ2 (q),若LM天>χ2 (q),
(α) 小 (α)
小
使
蓝
则拒绝原假设,说明无约束模型成立。
天
蔚
小
:
小
5、LR、Wald和LM 的比较 服 使
蓝
客 天
蔚
旺 小
(一)三种检验方法一致之处 旺 : 小
服
宝 蓝
客
淘 蔚
1、三种检验方法都由极大似然估计而来。 旺
一 :
旺
唯 服
宝
2、三种检验方法都用到了对数似 , 然的函数。 淘 客
品 旺
一
出 旺
唯
3、三种检验方法都是针对室模型约束条件进行检验。 宝
,
作 淘
品
工 一
出
(二)三种检验方英法不一致之处
唯
室
精 ,
作
场 品
1、LR检验只适用于线性约工束的检验,LR检验需要计算带约束和无约束的对数似然函数值。
职 出
英
室
精
2、Wald检验和LM场检验既适用于线性作约束也适用于非线性约束的检验。
工
职
英
3、Wald检验只需要估 计无约束精的模型,而LM 检验只需要估计约束模型,所以,当施加约束条件后模
场
型形式变得简单时,使用LM 检职验更方便。
(三)三种检验方法的关系
对于LR、Wald 和LM 三个检验方法的选择应以实际计算难易程度二定,一般来说,Wald 和LM 检
验优于LR检验,因为Wald和LM 检验只需估计一个模型即可,而LR检验需要估计有约束和无约束两种模
型。并且,在小样本条件有
W ≥ LR≥ LM
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
说明只有当LM 检验的结果为拒绝原假设(约束条件不成立),或者Wald检验的结果为接受原假设(约束条
件成立)时,三种检验结果才是一致的。所以,三种检验方法有可能得出相互不一致的结论。
总之,当LM 检验拒绝原假设时,其他检验也一样。当Wald 检验没有拒绝原假设时,其他检验也不会
拒绝原假设。尽管在小样本时三个值可能有所不同,但在大样本情形,这三个检验近似相等。就计算而言,LR
检验最麻烦,其他两种还算简单。另外,在小样本情况下,并且约束条件为线性时,用F 检验比用这三个检
验更可靠。
三大检验方法的比较:
使
以 一 元 线 性 天回 归 为 例 的 计 算 及 直 观 意 义
小
方法 适用范围 计算方式
(H :β=β小)
使
0 蓝0
天
蔚
小
:
只适用线 计算带约束和无 LR服=2lnL(βˆ )−2ln 小 L(β)=−nln(1
使
−R2)
蓝 0
客 天
R 性约束的 约束的对数似然 蔚
旺 小
:
旺 βˆ与β 之间的垂直距离 小
检验 值 服
宝 0 蓝
客
淘 蔚
旺
一 :
线性约束 唯 宝W 旺 =(βˆ−β)2I(βˆ服 )= (βˆ−β 0 )2 =nR2
只,需估计无约束 0 客 σ2c 1−R2
Wald 和非线性 品 淘 旺 ii
一
出的模型 旺
唯
约束检验室 , (F 检验) 宝 度量βˆ与β 之间的水平距离
作 淘 0
品
工 一
出
英 唯
室
精 ,LM =s2(β)I(β)−1 =nR2
场
只作需估计约束模
品
0 0
LM 职 同上 工 出
英型
精 室 考察对数似然函数在β 处的斜率
作 0
场
工
职
英
精
场 第二章 违背经典假定下的参数估计
职
第一节 多重共线性
一、多重共线性的定义
1、完全多重共线性的定义。
对于变量X ,X ,,X ,如果存在不全为零的数λ,λ,,λ,使得
2 3 k 2 3 k
λX +λX ++λX =0
2 2 2 2 k k
成立,则称变量X ,X ,,X 之间存在完全的多重共线性。
2 3 k
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
2、不完全多重共线性的定义。
解释变量之间的共线性非精确表示,是一种近似的关系,所以在上述表达式中引入随机误差项,即对
于变量X ,X ,,X ,如果存在不全为零的数λ,λ,,λ,使得λX +λX ++λX +µ=0成立,其
2 3 k 2 3 k 2 2 2 2 k k
中µ为随机误差项,或者是线性相关的一种近似关系 λX +λX ++λX ≈0则称变量X ,X ,,X
2 2 2 2 k k 2 3 k
之间存在不完全的多重共线性,或者说是近似的多重共线性。
二、多重共线性产生的后果
(一)完全多重共线性下的后果
如果解释变量之间存在完全的多重共线性,则从结论上看有: 使
天
1、参数估计值不确定。 2、参数估计值的方差会无限大。 小
小
使
蓝
(二)不完全多重共线性下的后果
天
蔚
小
:
1、有可能求出参数的估计值,但估计值很不稳定。 小
服 使
蓝
2、参数估计值的方差会随多重共线性(近似)程度 客 的提高而增大。蔚 天
旺 小
:
旺 小
3、对总体参数的区间估计将会降低精确度(置信区间变宽)。 服
宝 蓝
客
淘 蔚
评价区间估计的两个标准: (1)估计的可靠度。(2)估计旺的精确度 .
一 :
旺
唯 服
4、对总体参数的显著性检验(t检验)在统计上将会宝不显著。
, 客
淘
三、多重共线性的检验 品 一 旺
出 旺
唯
(一)简单相关系数矩阵法室 宝
,
作 淘
品
(二)t检验与F检验工的综合判断 一
出
英 唯
室
该方法的思想是,精利用对参数的t检验与对模型整体,的F检验的不一致,判断模型中解释变量之间存在不
作
场 品
工
职 出
完全多重共线性。如果当计算出英的R2或R2很大,F值显著性地超过给定显著性水平α下所对应地临界值,但
室
精
作
场
变量所对应地偏回归 系数的t统计量值不显工著,则说明该模型中的解释变量存在多重共线性。
职
英
(三)辅助回归法 精
场
在k个解释变量X ,X ,,X 职中,求每一个X 对剩余变量X ,,X ,X ,,X 的回归,即
2 3 k j 2 j−1 j+1 k
X = f(X ,,X ,X ,,X )+µ
j 2 j−1 j+1 k
式中µ为随机误差项,并计算出相应的R2,记为R2;同时观察对应的 F 统计量值的大小。如果R2很大,F
j
统计量值超过给定的临界值水平,则说明模型中解释变量存在不完全多重共线性。
(四)方差扩大(膨胀)因子法
(五)特征值与病态指数法
四、多重共线性的补救措施
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(一)增加样本容量。
(二)利用先验信息。思路:利用先验信息,实现对变量的降维(即减少解释变量的个数),最终达到修
正多重共线性目的。
(三)变换模型的形式:对变量进行差分,还可将变量转换为增量形式
(四)逐步回归法
(五)岭回归
1、岭回归是 一种改进最小二乘估计的方法,也叫岭估计。
当解释变量之间存在多重共线性时, X′X ≈0,则E[(B ˆ −B)(B ˆ −B)′]=σ2(X′X)−1会增大,原因在于
使
天
X′X 接近奇异。如果将X′X 加上一个正常数对角矩阵 kI (k>0,I 为单位矩阵),即X′X+kI,使得
小
小
X′X+kI ≈0的可能性比 X′X ≈0的可能性小,那么X′X+kI接蓝近奇异的程度就会 使 比X′X小得多。
天
蔚
小
:
由此,建立B的如下估计为 小
服 使
蓝
客 天
B ( k )=( X′X+kI )−1 X′Y 旺 蔚(1) 小
:
旺 小
服
称B ( k )为B的岭回归估计量,k为岭回归参数 宝 。当解释变量之客间存在多重共线性时 蓝 ,以B ( k )作为B的估计
淘 蔚
旺
一 :
旺
应比普通最小二乘估计稳定。可以证明,唯当k较小时,回归系数很不稳定,服而当k逐渐增大时,回归系数将呈
宝
, 客
淘
现稳定状态。因此,选择合适的k值品,岭回归参数才会优于普通最小二旺乘估计参数。当k=0 时,岭回归估计
一
出 旺
唯
B ( k )= B ˆ ,实际就是普通最 室 小二乘估计。 , 宝
OLS 作 淘
品
工 一
出
2、岭回归估计的英性质
唯
室
精 ,
作
性质1:岭回场归的参数估计是回归参数的有偏估品计。
工
职 出
英
E精 ( B ( k )) = E ( X′X+室 kI )−1 X′Y
作
场
职 =( X′工 X+kI )−1 X′E ( Y ) (2)
英
= 精( X′X+kI )−1 X′XB
场
职
显然,只有当k=0 时,才有E ( B ( 0 )) = B,当k≠0 时,B ( k )是B的有偏估计。有偏性是岭回归估计的一
个重要性质。
性质 2:在岭回归参数k与Y无关的情形下,B ( k )是最小二乘估计的一个线性变换,也是理论值Y的
线性函数。
性质3:岭估计量B ( k )方差比普通最小二乘估计B ˆ2的方差要小。
3、岭回归参数k的选择
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
原 则 上 是 要 选 择 使 均 方 误 差 MSE[B ˆ (k)] 达 到 最 小 的 k , MSE[B ˆ (k)] 的 表 达 式 为
MSE(B ˆ (k))=E(B ˆ (k)−B)'(B ˆ (k)−B)=Var(B ˆ (k))+E(B ˆ (k))−B'E(B ˆ (k))−B
而最优k值依赖于未知参数B和σ2,因而在实际应用中必须通过样本来确定。 根据经验,岭回归参数k的
选择范围在(0,1)范围内为宜。
第二节 异方差与自相关
一、异方差与自相关的定义
1、异方差定义
使
设模型为Y =β+βX +βX ++βX +u i =1,2天,,n,如果对于模型中随机误差项
i 1 2 2i 3 3i k ki i 小
小
u ,有Var(u | X )= E(u2 | X )=σ2, i =1,2,3,,n. E(u蓝)=0 使
i i i i i i i 天
蔚
小
:
则称 u i 具有异方差性。进一步,把异方差看成 服 是由于某个解释小变量的变化 使 而引起的,则
蓝
客 天
蔚
Var(u | X )=σ2 =σ2f(X )。 旺 : 小
i i i i 旺 小
服
宝 蓝
客
2、自相关定义 淘 蔚
旺
一 :
旺
(1)如果模型中的随机误差项u ,唯满足以下关系式Cov(u ,u )≠0,t ≠服s则随机误差项u 之间存在自相
宝
i, t s
客
i
淘
品 旺
关性。 一
出 旺
唯
室 宝
,
(2)一阶线性自相关。作在Cov(u ,u )≠ 0,t ≠ s中,如果淘s =t−1,则
t s 品
工 一
出
英 唯
精 作 室 Cov(u t ,u , t−1 )≠0,
场 品
工
职 出
并且u 与u 之间为线性关系,英即u = ρu +ε,其中ε 满足古典假定,即
t t−1 t t−1 室t t
精
作
场
E(ε)=0,E(ε2)=σ2,职E(εε)=0,t ≠ s,工ρ<1。将u 与u 的这种线性关系称为一阶线性自相关(或一阶
t t ε t s 英 t t−1
精
线性自回归)。
场
职
二、异方差与自相关对模型的影响
在异方差与自相关存在的情况下,OLS估计量具有以下统计性质:
1、OLS估计量是无偏的、一致的。
2、OLS估计量是非有效的(参数估计的方差不再最小)。
3、传统的OLS估计量的标准差不正确,以这些标准差为依据建立起来的统计检验无效(t统计量不存在、
F和R2检验不可靠)。
三、对异方差与自相关的检验
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(一)异方差的检验方法
图形法、Goldfeld-Quandt方法、Glejser方法、White方法、ARCH方法、Park检验、Spearman等级相关
检验、Breusch-Pagan-Godfrey检验、Koenker-Bassett检验等,只需了解前5种检验方法。
1、Goldfeld-Quandt方法
(1)前提条件
●样本容量要充分大。
●随机误差项u ~正态分布,除异方差以外,其它基本假定成立。
i
(2)检验的基本步骤 使
天
●将解释变量的取值按从小到大排序(也可从大到小,但F统计量小的分子于分母需要交换,为什么?)。
小
使
蓝
●将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分(根据F检验的原理,保证
天
蔚
小
:
构造F统计量的分子和分母的相互独立性),每部分观察值的个数为(n-c)/2小(根据 Goldfields 和 Quandt 的
服 使
蓝
证实,一元线性模型里当样本容量大于60时,c可取1 客 6,而当n=30时蔚,取c为4)。 天
旺 小
:
旺 小
●提出假设。即H :σ2 =σ2,i =1,2,,n宝; H :σ2 ≤σ2服≤≤σ2
蓝
0 i 1 1 客2 n
淘 蔚
旺
●构造 F统计量。分别对上述两个部 一 分的观察值求回归模型,由此得:到的两个部分的残差平方和为
旺
唯 服
宝
∑e2和∑e2 ,它们的自由度均为[( , n-c)/2]-k,其中淘k为参数的个数。 客 (这里如果假定u服从正态分布,并
1i 2i 品 旺
一
出 旺
唯
室
, n−c
σˆ2宝
n−c
且同方差性假定时真实的,作则可证明下式成立,即( −k) 淘~χ2( −k))于是在原假设成立的前提
品
工 2 一σ2 2
出
英 唯
室
下,有 精 ,
作
场 品
工
职 n−c 出
∑e2 /[英 −k]
F * =
2i精2
~ F作(
n室−c
−k,
n−c
−k)
∑ 职 场 e2 /[ n−c −k] 工 2 2
1i 2 英
精
●判断。给定显著性水平α,查F分布表,得临界值F (α),如果
场
(
n−c
−k,
n−c
−k)
职 2 2
F*>F (α)
n−c n−c
( −k, −k)
2 2
则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。
2、Glejser方法
Glejser检验的检验条件:变量的观测值为大样本。基本思想:由OLS法得到残差e ,取e 的绝对值 e ,
i i i
然后将 e 对某个解释变量X 回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。该检验的特
i i
点是不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
Glejser检验的具体步骤:
(1)根据样本数据建立回归模型,并求残差序列e =Y −Y ˆ。
i i i
(2)用残差绝对值 e 对X 的进行回归,由于 e 与X 的真实函数形式并不知道,只能用样本数据对各
i i i
种函数形式进行试验,从中选择最佳形式。Glejser曾提出如下一些假设的函数形式:
e =α+βX +v
i i i
e =α+β X +v
i i i
1 使
e =α+β +v
i X i 天
i 小
小
1 蓝 使
e =α+β +v 天
i 蔚i
X 小
:i
小
服 使
式中v为随机误差项。 客 蓝 天
蔚
旺 小
:
(3)通常可用e2作为 e 的替代变量,对所选旺函数形式回归。用回归所得到的R小2、t、F等信息判断,
i i 宝 服 蓝
客
淘 蔚
若表明参数β显著不为零,即认为存在异方一差性。 旺
:
旺
唯 服
宝
4、White检验方法 , 淘 客
品 旺
一
(1) 检验条件, 出 要求在大样本下唯。 旺
室 宝
,
作 淘
(2) White检验的基本步骤品,以一个二元线性回归模型为例。
工 一
出
英 唯
设模型为Y =β精+βX +βX +室 u ,并设异方差
,
与X ,X 的一般关系为
t 1 2 2t 3 3作t t 2t 3t
场 品
工
职 出
σ2 =α +αX +αX +αX英2 +αX2 +αX X +v ,其中v 为随机误差项。具体操作如下:
t 1 2 2t 3 3t 4 2t 5 3t 6室2t 3t t t
精
作
场
●求样本回归模 型。 工
职
英
●计算残差e ,并求e 2。 精
t t 场
职
●用残差平方e2 作为异方差σ2 的估计,并建立e2 对 X ,X ,X2,X2,X X 的辅助回归,即
t t t 2t 3t 2t 3t 2t 3t
eˆ2 =αˆ +αˆ X +αˆ X +αˆ X2 +αˆ X2 +αˆ X X 。其中,最后一项表示解释变量两两交叉相乘,如果是
t 1 2 2t 3 3t 4 2t 5 3t 6 2t 3t
三个解释变量,则交叉相乘有三项。
●由此计算统计量nR2,其中n为样本容量,R2为辅助回归函数的可决系数。
●提出假设
H :α ==α =0, H :α 中至少有一个不为零, j =2,3,,6
0 2 6 1 j
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
nR2渐进服从自由度为5(在本例中除了截距项以外,斜率系数有5项)的χ2分布,给定显著性水平α,查χ2
分布表得临界值χ2(5)。
α
●判断,计算nR2值,如果nR2>χ2(5),则拒绝原假设,表明模型中随机误差存在异方差。
α
●注意:该检验的功效易受自由度的影响,一般地,当有 k-1 个解释变量时,χ2分布的自由度为
(k−1)k/2−1。
4、ARCH检验方法
(1) 检验的步骤 使
天
小
●建立ARCH过程:σ2 =α +ασ2 ++ασ2 +v ,式中v 为随机误差。
t 0 1 t−1 p t−p t t 小
使
蓝
天
●提出假设 蔚
小
:
小
H :α =α ==α =0; H :α 中至少 服 有一个不为零 j蓝 =1,2,, p 使
0 1 2 p 1 j 客 天
蔚
旺 小
:
●对原模型进行回归,求残差e,并计算残差旺平方序列e2,e2 ,,e2 。 小
宝 t t−服1 t−p 蓝
客
淘 蔚
●求辅助回归: eˆ2 =αˆ +αˆ e2 +一+αˆ e2 旺
:
t 0 1 t−1 p t−p 旺
唯 服
宝
, 客
●计算辅助回归得可决系数R品 2,并且在H
0
成立下淘,基于大样本,
旺
有(n− p)R2渐进服从χ2(p)。
一
出 旺
唯
●给定显著性水平α,查 室 卡方分布表得临,界值χ 2(p),如果 宝 (n− p)R2>χ 2(p),则拒绝原假设,表
作 α 淘 α
品
工 一
出
明模型中得随机误差存英在异方差。
唯
室
精 ,
作
(2) 场ARCH检验的EViews操作及对结品果的解释。
工
职 出
英
White检验与ARCH检验的共同特点是能比较室方便地对异方差进行诊断,但ARCH检验不能确定是哪一个解
精
作
场
释变量以什么形式引 起的异方差现象。 工
职
英
四、自相关性的检验方 法 精
场
职
●图示法
●D-W检验法 该方法是基于残差序列e 与e 之间的相关系数ρˆ 提出检验ρ的D-W统计量。
t t−1
1、D-W检验的适用条件
(1) 解释变量X非随机;
(2)随机误差项为一阶自回归,即u =ρu +ε,且ε满足基本假定;
t t−1 t t
(3)线性回归模型的解释变量中不包含滞后的被解释变量;
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
如:不存在如下形式Y =β+βX +βY +u
t 1 2 t 3 t−1 t
(4)截距项不为零,即只适用于有常数项的回归模型;
(5)数据序列无缺失项;
2、D-W统计量的构成
(1)提出假设:H :ρ=0;H :ρ≠0
0 1
∑ee
(2)构造D-W检验统计量,记为d,即d ≈2(1−ρˆ),其中ρˆ = t t−1 。
∑e2
t−1
3、运用D-W检验判断一阶自相关的区域。 使
天
小
(1)当ρˆ =0时,d=2,则u 无一阶自相关。
t 小
使
蓝
天
蔚
(2)当ρˆ =1时,d=0,则u 有完全一阶正自相关。
小
t :
小
服 使
蓝
(3)当ρˆ =−1时,d=4,则u 有完全一阶负自相关。客 天
t 蔚
旺 小
:
旺 小
(4)通常情况下,当ρˆ <1时,有0<d<宝4。当d落在0到4服范围内时,有如
蓝
下判断区域:(d
L
和d
U
分别
客
淘 蔚
旺
为下限和上限临界值) 一 :
旺
唯 服
宝
当0<d<d L 时,存在一阶正自相 品 关 , ; 淘 旺 客
一
当d L <d<d U 时,不能判定 室 存 出 在自相关; 唯 宝 旺
,
作 淘
当d<d<4-d 时,不存在一阶自相关;品
U U 工 一
出
英 唯
当4-d<d<4-d 时,不能判定存在室自相关;
U 精L ,
作
场 品
当4-d<d<4时,存在一阶负工自相关。
L 职 出
英
室
4、运用D-W检 验应注意精的问题(或局限性)
作
场
工
( 在d=2的附近,有职一个较大的无自相关区域,所以通常当d在2的左右时,可以判断出随机误差不存
英
精
在自相关。)
场
职
(1)D-W检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(通常可用D-W检验的修
正方法)。
(2)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。
(3)D-W检验不能适用对高阶自相关现象进行检验。
(4)D-W检验有适用条件,只有符合这些条件才是有效的。
5、补充检验方法——Breusch-Godfrey(简称BG检验)。
五、对异方差与自相关的修正
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
1、广义最小二乘估计法(GLS),可对异方差进行修正。
2、异方差与加权最小二乘法
加权最小二乘法的基本含义:在异方差性的情况下,由于不同的X使得u偏离均值的离散程度不一样,
i i
但是,在人们对总体异方差并无信息的情况下,要直接对异方差进行修正是很困难的。基于样本的信息,则
存在当Var(u )的值较小时,残差e所提供的信息较少,这时需要给予重视,则对信息较少的e2给予较大的
i i i
权数;而当Var(u )的值较大时,残差 e所提供的信息较大,这时需要给予折扣,则对信息较大的e2给予较
i i i
小的权数。从而,使得∑ e2 更好地反映Var(u )对残差平方和的影响程度。
i i
使
对模型变换的方法与加权最小二乘法是等价的。 天
小
3、自相关与广义差分 小
使
蓝
天
蔚
(1)广义差分法 小
:
小
服 使
蓝
设模型为Y =β+βX +u ,u ~u =ρu +ε,其中客ε满足基本假定。差分过程如下 天
t 1 2 t t t t t−1 t t 蔚
旺 小
:
Y =β+βX +u 旺 服 小
t−1 1 2 t−1 宝t−1 蓝
客
ρY =ρβ+ρβ淘X +ρu 蔚
t−1 1
一
2 t−1 t−1 旺
:
Y −ρY =β(1−ρ)+β(X 旺−ρX )+(u −ρu )
t t−1 唯1 2 t t−1 t 服t−1
宝
∆Y =β` , +β∆X +ε 淘 客
t 品1 2 t t 旺
一
出 旺
由于ε满足基本假定,所以对差分后的模型可施唯用最小二乘法进行参数的估计。
t 室 , 宝
作 淘
品
(2)科克兰内-奥克特工法 (又称迭代估计法) 一
出
英 唯
室
精 ,
该方法是经过反复计算后,以寻作找出一个更接近真实ρ的估计值ρˆ ,直到达到修正自相关为止。
场 品
工
职 出
英
(3)德宾两步估计法(Durbin) 室
精
作
场
第一步是寻找估计值职ρˆ 。 工
英
精
第二步建立差分模型。
场
职
该方法的特点是不仅能有效地修正一阶自相关,而且对高阶自相关也适用。
第三节 测量误差的检验
1、外生性检验 (内生性检验) (中计,P )
39
如果某个解释变量不满足外生性条件,则该变量是内生的。检验变量满足外生性等价于检验变量是否是
内生的,通常将此称为内生性检验(Testing for Endogeneity),常用的检验是武-豪斯曼检验(Wu-Hausman)。
2、测量误差存在与否的豪斯曼(Hausman)检验(初级,P249)
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
第三章 虚拟变量
1、定义
设变量D表示某种属性,该属性有两种类型,即当属性存在时D取值为1;当属性不存在时D取值为0。
记为
1 具有某种属性类型
D =
0 不具有该属性类型
2、虚拟变量引入的规则
(1)在模型里有截距项的条件下,如果一个属性存在m个相互排斥类型(非此即彼),则在模型里引入
使
m-1 个虚拟变量。否则会出现完全的多重共线性(即虚拟变量陷阱)。在天模型无截距项的情况下,如果一个属
小
性存在m个类型,即便引入m个变量,不会出现多重共线性问题。(小为什么?)
使
蓝
天
(2)虚拟变量取值为0,意味着所对应的类型是基础类型蔚。而虚拟变量取值为1,代表与基础类型相比
小
:
小
较的类型,称为比较类型。例如“有学历”D为1,“无学服历”D为0,则“无学历”就是基础使类型,“有学历”
蓝
客 天
蔚
为比较类型。 旺 小
:
旺 小
服
第一宝节 虚拟解释变量 蓝
客
淘 蔚
旺
一、加法引入规则 一 :
旺
唯 服
宝
1、加法引入规则,虚拟解释变量 , 与别的解释变量淘以相加的关系出现客在模型里。加法引入虚拟变量对模型
品 旺
一
产生的结果是只改变截距项。 出 唯 旺
室 宝
,
作 淘
设模型为Y
i
=β
1
+β工
2
X
i
+β
3
D
i
+u
i
,
出
式品中D
i
为虚拟变
一
量,它与其它解释变量是相加的关系,则称虚拟
英 唯
室
变量按加法类型引入精。 ,
作
场 品
工
2、加法引 职 入虚拟变量的应用 (初级,P213)出
英
室
精
二、乘法引入规则 场 作
工
职
1、以乘法形式引入虚拟变量,是在英所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解
精
场
释变量。乘法引入虚拟解释变 量将改变模型中的斜率系数。
职
设模型为Y =α +αX +β(X D )+u 或者Y =α +αX +β(D D )+u ,其中X 为定量解释变量,
t 1 2 t t t t t 1 2 t 1t 2t t t
D,D ,D 均为虚拟变量。按上述形式即为乘法引入。
t 1t 2t
2、乘法引入虚拟解释变量的应用 (初级,P216)
第二节 虚拟被解释变量
一、线性概率模型(了解)
二、 Logit模型(考大题)
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
1、Logit模型的含义
1 1
(1)设 p = F(z )= = (5-2)
i i 1+e−z
i
1+e−(β
1
+β
2
X
i
)
式中,Z =β+βX 。并且在该表达式中,有如下变动规律,
i 1 2 i
1
当Z →+∞时, p →1; 当Z →−∞时, p →0; 当Z =0时, p = 。
i i i i i i 2
称(5-2)式为Logistic分布函数,它具有明显的S型分布特征。
1 1 1
p = , ∴1− p =1− =
i 1+e−Z
i
i 1+e−Z
i
1+eZ
i
(2)Logit模型: ∴ p i = 1+eZ i =eZ i 使
1− p 1+e−Z i 天
i 小
p 小
∴ln( i )=Z =β+βX (5−3) 使
1− p i 1 2 i 蓝 天
i 蔚
小
:
p 小
其中 i 为机会概率比(简称机会比),即事件发生与不服发生所对应的概率之比。称(5-3)使式为 Logit 模
蓝
1− p 客 天
i 旺 蔚 小
:
旺 小
型。 服
宝 蓝
客
淘 蔚
2、Logit模型的特点 旺
一 :
旺
唯 服
宝
p, 客
(1)随着P从0变到1,ln( )从−∞变到∞淘(亦即Z 从−∞变到∞)。可以看出,在LPM中概率必
1 品 − p 一 i 旺
出 旺
唯
室 宝
须在0与1之间,但对Logi作t模型并不受此约,束。
淘
品
工 一
出
p 英 唯
(2)ln(
1− p
)精对X
i
为线性函数
作
。室
,
场 品
工
职 出
英
p 室 p
(3)当ln( )为正的
精
时候,意味着随
作
着X 的增加,选择1的可能性也增大了。当ln( )为负的时
1− p 场 i 1− p
工
职
英
精 p
候,随着X 的增加,选择1的可能场性将减小。换言之,当机会比由1变到0时,ln( )会变负并且在幅度
i 职 1− p
p
上越来越大;当机会比由1变到无穷时,ln( )为正,并且也会越来越大。
1− p
3、Logit模型的估计
(1)根据数据类型选用OLS方法
(2)最大似然估计方法:最大似然估计法是估计Logit模型最常用的方法。
(3)Logit回归最大似然估计的统计性质
(1)参数估计具有一致性,即当样本观测增大时,模型的参数估计值将比较接近参数的真值。
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(2)参数估计为渐近有效,即当样本观测增大时,参数估计的标准误相应减小。
(3)参数估计满足渐近正态性,即随着样本观测的增大,估计的分布近似于正态分布。这意味着,可以
利用这一性质对未知参数进行假设检验和区间估计了。
4、Logit 回归模型的评价和参数的统计检验(重点)
1、模型的拟合优度检验
(1)McFadden R2
LIF
McFadden R2 ,简记为R2 。其计算公式为 R2 =1− ur
McF McF LIF
r
使
式中,LIF 为模型中包含所有解释变量的无约束对数似然函数值,LIF天为模型中仅含有截距项的有约束的
ur 小r
小
对数似然函数值。从概念上讲,LIF 和LIF 分别等价于普通线性蓝回归模型中的RSS 使 和TSS。R2 与R2一样,
ur r 天 McF
蔚
小
:
也在0到1之间变动。 小
服 使
蓝
(2)期望-预测表检验 客 蔚 天
旺 小
:
旺 小
2、参数的显著性检验 服
宝 蓝
客
淘 蔚
(1)Z检验 旺
一 :
旺
唯 服
以一元Logit回归模型为例,设模型为 宝
, 客
淘
品 旺
一
出 1 1 旺
P(Y =1| X )= 唯=
室i 1+e−(β 1 +β 2 X ,i ) 1+exp(−β−β宝 X )
作 1淘2 i
品
工 一
出
对该模型中的参数β 的英显著性检验的原假设为H :β =唯0,即解释变量X 对事件Y =1发生的概率没有显著
精2 室 0 2
,
i
作
场 品
性影响。根据参职数的最大似然估计 工 性质可知,在大出样本条件下,βˆ 渐近服从正态分布,于是,在H :β =0
英 2 0 2
室
精
成立的前提下,检验 统计职量
场
为Z =
βˆ
2 工,渐
作
近服从标准正态分布。式中,se(βˆ )为最大似然估计βˆ 的标
se(βˆ英) 2 2
2
精
场
准误差。因此,可按常规查标 准正态分布表,对原假设进行判断,从而检验模型中参数的显著性。
职
(2)Wald检验
βˆ
其检验统计量为: W =( 2 )2
se(βˆ
)
2
在H :β =0下,W 渐近服从自由度为1的χ2分布。因此,可根据χ2分布表,在给定的显著性水平α
0 2
下,得到相应的临界值,从而判断参数的显著性。
(3)似然比检验
在大样本情况下,两个模型之间如果具有嵌套关系,则两个模型之间的对数似然值乘以-2 的结果之差
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
近似服从χ2分布。这一统计量就是似然比统计量。
LR=(−2ln(L ˆ ))−(−2ln(L ˆ ))
model2 model1
ˆ
L )
=−2ln( model2 )
ˆ
L
model1
其中,ln(L ˆ )为所设定的原模型(即包含了所有解释变量)的最大似然函数的对数值, ln(L ˆ )为
model1 model2
省略模型(即省略了解释变量X )的最大似然函数的对数值,两者之间的差乘以-2 近似地服从χ2分布,其
j
自由度为省略了的解释变量的个数。接下来,可根据χ2分布表,在给定的显著性水平α下,得到临界值,从
使
而判断参数的显著性。 天
小
3、Logit模型回归系数的解释(重点;中级计量,P )
81 小
使
蓝
(1)按发生比率来解释Logit模型的系数
天
蔚
小
:
(2)用概率来解释Logit模型的系数 小
服 使
蓝
(3)预测概率 客 蔚 天
旺 小
:
第五旺章 动态模型 小
服
宝 蓝
第一节 分布滞后模型与自回归客模型(了解)
淘 蔚
旺
一、滞后变量模型的类型 一 :
旺
唯 服
宝
1、分布滞后模型。 , 淘 客
品 旺
一
出 旺
Y t =α+β 0 X t +β 1 X t−1 + 室 β 2 X t−2 ++β s, X唯 t−s +u t 宝
作 淘
品
⑴乘数(又称倍数)工的解释。所谓乘数是指,在一个模一型体系里,外生变量变化一个单位,对内生变量
出
英 唯
室
产生的影响程度。据精此进行的经济分析称为乘数分析或,乘数效应分析。
作
场 品
工
职 出
⑵短期乘数β 英
0 室
精
作
场
⑶延迟乘数或动态乘职数β(i =1,2,,s工)
i 英
精
s 场
⑷长期乘数β=∑β
i 职
i=0
2、自回归模型。如果模型中无滞后解释变量,即
Y =α+βX +γY ++γY +u
t 0 t 1 t−1 q t−q t
则此模型为自回归模型。如果模型无解释变量X ,则模型就是一个纯粹的关于被解释变量的自回归模型(统
计模型),即
Y =α+γY ++γY +u
t 1 t−1 q t−q t
三、有限分布滞后模型的修正估计方法
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
有限分布滞后模型的估计方法有两种,即经验加权法和阿尔蒙法。
三、自回归模型中随机误差项的自相关检验——德宾h-检验法
1、 h统计量的定义
d n
h=(1− )
2 1−nvar(βˆ*)
1
式中,d为DW统计量,n为样本容量,Var(βˆ*)为滞后被解释变量Y 的系数的估计方差。
1 t−1
2、 Durbin证实了h统计量渐进服从标准正态分布
3、 统计量对自回归模型中随机误差项自相关性的检验
使
天
第二节 平稳性
小
小
一、时间序列的平稳性 使
蓝
天
蔚
1、时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而小发生变化。 (平稳性是指时
:
小
服 使
间序列的统计特征不随时间的推移而变化。) 客 蓝 天
蔚
旺 小
2、经济时间序列进行回归分析,可能出现“伪旺回归” ,造成“伪:回归”的根本原
小
因在于时序序列变量的
服
宝 蓝
客
非平稳性。 淘 蔚
旺
一 :
旺
3、类型 唯 服
宝
, 客
淘
(1)严平稳序列。 品 旺
一
出 旺
唯
如果对任意正整数n(n< 室 ∞)和时间序数,t 1,则Y 是强非平稳过程,这时它会随着时间t的增加,其方差将快速增大。并且,对Y
t t
一次差分后
∆Y =(ρ−1)Y +u
t t−1 t
式中,∆Y 是由非平稳的Y 和平稳的u 相加的结果,所以∆Y 仍是非平稳的。
t t−1 t t
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
表1 时间序列模型的统计特征(了解)
自相关函数 偏自相关
模型 平稳条件 可逆条件
ρ 函数φ
k kk
特征方程的根 无可逆条件
AR(p)
拖尾 截尾
全在单位圆外
(k = p)
无平稳条件 特征方程的
MA(q)
截 尾 拖尾
根全在单位
圆外 (k =q)
特征方程的根 特征方程的 使
拖尾 拖尾
ARMA(p,q)
天
全在单位圆外 根全在单位
小
圆外 小
使
蓝
天
四、平稳性检验 蔚
小
:
小
(一)单位根检验方法 服 使
蓝
客 天
蔚
1、ADF检验 旺 : 小
旺 小
服
宝 蓝
基本原理为,在DF检验中,假定随机扰动
淘
项u
t
不存在自相
旺
关客,并且只适用于
蔚
一阶自回归过程(即AR(1))。
一 :
旺
唯 服
但大多数经济时间序列不满足这个假定,当u 存在自相关宝时,直接使用DF检验会出现偏误。因此,在DF检
, t 客
淘
品 旺
一
验的基础上扩展为ADF检验,称出为增广的迪基——富勒检验。过程如旺下
唯
室 宝
,
在DF检验中, 设检验作模型为 淘
品
工 一
出
英 Y =ρY +u 唯
精 室 t t−1 , t
场 工 作 Y t =α+ρ 品 Y t−1 +u t
职 英 Y =α+出βt+ρY +u
t 室 t−1 t
精
作
场
为了克服上述模型中 u 的自相关问题,这时 工 在模型中引入了多阶自回归过程(即AR(p))。
t 职
英
精 p
场Y =ρY +∑α∆Y +u
t t−1 i t−i t
职 i=1
p
Y =α+ρY +∑α∆Y +u
t t−1 i t−i t
i=1
p
Y =α+βt+ρY +∑α∆Y +u
t t−1 i t−i t
i=1
检验过程与DF检验过程一致,只是需要考虑滞后变量∆Y 的滞后阶数i的选取。
t−i
ADF检验应注意的问题:
(1)当样本容量充分大, ADF检验的极限分布同DF检验的极限分布相同,可以使用DF检验的临界值代
替ADF检验的临界值。但在小样本条件下ADF分布与DF分布不一样, 两者不能代替。
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(2)DF检验适用于一阶自回归AR(1) 过程的单位根检验。当时间序列为高阶自回归AR(p) 形式,或者
由DF检验得到的残差序列存在自相关时,DF检验无效,应选择ADF检验。
(3)如果时间序列Y 在均值上下波动,则应该选择不包含常数和时间趋势的检验方程,即(1)式;如
t
果序列具有非0均值,但没有时间趋势,可选择(2)式作为检验方程;若序列随时间变化有上升或下降趋势,
采用(3)式。
(4)实际检验时可以从模型 3 开始,然后模型 2,最后模型 1。何时检验拒绝零假设,即原序列不存在
单位根,为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型 1 为止。当三个模型的检验结
果都不能拒绝零假设时,则认为时序列是非平稳的。
使
天
(5)选择模型适当的形式。在ADF回归式中DW的值较低,说明仍然存在自相关,则应在每个模型中增
小
小
加滞后差分项,即选取适当的滞后差分项,以使模型的残差项是一个白噪声(不存在使自相关)。
蓝
天
蔚
小
(6)选择滞后差分项∆Y 个数 p的原则是:一方面,:p要尽量小,从而节省自由度;另一方面, p要
t−j 小
服 使
蓝
尽量大,从而消除误差项中存在的自相关。因此, p的 客 选择具有两难。蔚另外,在确定 p的天过程中,还可参考
旺 小
:
旺 小
AIC准则和SC准则。从经验的角度,年度数据的序列可考虑至少应服取1阶滞后;季度数据的序列可考虑至少
宝 蓝
客
淘 蔚
应取4阶滞后;月度数据的序列至少应考虑取12阶滞后 旺
一 :
旺
唯 服
第三节 协整与误宝差修正模型
, 客
淘
品 旺
一、协整的定义: 一
出 旺
唯
室 宝
,
设X 表示N×1阶时间作序列向量(X ,X ,,X )'。如果淘
t 工 1t 品2t Nt 一
出
英 唯
第一, X 所含精有的全部变量都室是 I(d) 阶的;
,
第二,若存在一个 N×1阶向量 B(B≠0) ,使得
t 作
场 品
工
职 出
B'X ~ I(d −b),则称X 的各英分量存在(d,b)阶协整关系,记为 CI(d,b)。B为协整向量,B的元素称
t t 室
精
作
场
为协整参数,b为小于 d的正数,即0 < b工 < d。
职
英
★如果有相同单整阶数 的变量之间精具有协整关系,则一定会使得该协整关系的组合的单整阶数降低。
场
两个变量协整与多变量协整的职区别:
★对于两个变量,如果存在协整关系,则这种协整关系是惟一的。
★两个变量若存在均衡关系,那么这两个变量一定具有相同的单整阶数。
★当X 含有N ≥2个分量时,有可能存在多个协整向量。
t
★对于多个变量存在协整关系,情况要复杂一些,可以有不同单整阶数的变量组成协整关系。在这种条
件下,较高阶的单整变量之间必定存在协整关系,其相应非协整误差序列的阶数应与较低单整序列的阶数相
同。例如三个变量的情况,设有
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
Y =βX +βX +u
t 2 2t 3 3t t
其中Y,X ,X 的单整阶数可以不一样,但u 是平稳的。如Y ~ I(0),X ,X ~ I(1),并且X 与X 存在协
t 2t 3t t t 2t 3t 2t 3t
整关系,即它们的线性组合βX +βX ~ I(0),这样,一定有u ~ I(0)。
2 2t 3 3t t
协整的经济意义是:两个变量,虽然它们具有各自的长期波动规律,但是如果它们是协整的,则它们之
间存在着一个长期稳定的比例关系。
协整的特点:
(1)具有协整关系的高阶单整变量组合后可降低单整阶数。
使
(2)当且仅当若干非平稳变量有协整时,由这些变量建立的回归模天型才有意义,所以,协整检验也是区
小
别真实回归与虚假回归的有效方法。 小
使
蓝
天
(3)具有协整关系的非平稳变量才可以建立误差修正模型蔚。
小
:
小
常用的协整检验有两种方法,一种是 E-G两步法,主服要用于单一方程的协整检验,特别使是两个变量的协
蓝
客 天
蔚
整检验;另一种是Johansen方法,主要用于多变量、旺联立方程组模型。 小
:
旺 小
服
(1)两个变量的E-G两步法(EG或AEG检宝验。) 蓝
客
淘 蔚
旺
一 :
设变量为X 与Y 均是一阶单整变量,即X 、Y 分别旺服从I(1)。
t t 唯 t t 服
宝
, 客
淘
第一步,用OLS方法估计如下 品 模型的样本回归
一
模型:Y =β +β旺X +u
出 t 1 旺2 t t
唯
室 宝
,
得到:Y ˆ =βˆ +βˆ X ,其残作差序列为 e =Y −Y ˆ =Y −βˆ −β淘 ˆ X
t 1 2 t 工 t 品t t t 1 一 2 t
出
英 唯
第二步,检验精序列e 的平稳性。如室果e 序列是平稳
,
的,则X 与Y 之间存在协整关系;否则,X 与Y 之
t 作 t t t t t
场 品
工
间不存在协整关 职 系。 出
英
室
精
协整检验与序列的单场位根检验是不一样作的,原因是通常的DF或ADF检验只针对一个序列,而这里的序
工
职
英
列e 是一个线性组合,并含有两个序列X 与Y 。因此,不能直接用 DF 或 ADF 检验,而应根据麦金农协整检
t 精t t
场
验临界值代入下列计算公式:C 职=φ +φT−1+φT−2,(记住公式!!) 其中,p是检验的显著性水平,φ ,φ,φ
p ∞ 1 2 ∞ 1 2
的值从麦金农协整检验临界值表查出(初级,第370页的表6)。
3、误差修正模型
在上述检验协整过程中,两个变量存在协整关系(长期稳定关系),这时可把上述所得到的残差项看作为
协整误差,并利用这个误差项把Y 的短期行为和它的长期值联系起来。将此联系起来的“关系”就是误差修
t
正模型(ECM)。
误差修正模型是一种具有特殊形式的计量经济模型。下面以一个 ADL(1,1)为例,说明怎样从一个一般的
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
自回归-分布滞后模型来建立误差修正模型。设ADL(1,1)为
Y =α +αY +βX +βX +u
t 0 1 t−1 0 t 1 t−1 t
Y −Y =α +αY −Y +βX −βX +βX +βX +u
t t−1 0 1 t−1 t−1 0 t 0 t−1 0 t−1 1 t−1 t
∆Y =α +(α −1)Y +β(X −X )+(β +β)X +u
t 0 1 t−1 0 t t−1 0 1 t−1 t
∆Y =α +(α −1)Y +(α −1)X −(α −1)X +β(X −X )+(β +β)X +u
t 0 1 t−1 1 t−1 1 t−1 0 t t−1 0 1 t−1 t
∆Y =α +β∆X +(α −1)(Y −X )+(α +β +β−1)X +u
t 0 0 t 1 t−1 t−1 1 0 1 t−1 t
β +β
或 ∆Y =α +β∆X +(α −1)(Y −kX )+u 其中,k = 0 1
t 0 0 t 1 t−1 t−1 t 1−α
1
称∆Y =α +β∆X +(α −1)(Y −kX )+u 为误差修正模型,记为ECM。式中(α −1)(Y −kX )为误差
t 0 0 t 1 t−1 t−1 t 1 t−1 t−1
使
修正项,(Y −kX )表示t-1期非均衡误差。(α −1)为修正系数,表示误差修正项对∆Y 的修正速度。
t−1 t−1 1 天 t
小
由此,可以得到一般的情况,设有如下模型 小
使
蓝
天
蔚
∆Y =α +α∆X +αe +u
小
t 0 1 t :2 t−1 t
小
服 使
蓝
其中,e 为上述样本回归函数残差的一阶滞后值,它是客均衡误差项的估计,u 为通常意义天下的随机误差。该
t−1 蔚 t
旺 小
:
旺 小
回归式把Y
t
的变化和X
t
的变化以及前期的均衡宝误差联系起来,
客
∆服 X
t
意味着X
t
中的
蓝
短期干扰,而误差修正项
淘 蔚
旺
一 :
e 代表了向长期均衡的调整。如果α 是统计上显著的,并旺且α 一定是小于0的,则它就说明了Y 在一个时
t−1 2唯 2 服 t
宝
, 客
淘
期里的失衡有多大的一个比例部分 品 能够在下一时期得到纠正,α 为负旺,说明调整的方向永远是与背离均值的
一
出 2 旺
唯
室 宝
方向相反。这一过程就是误作差修正的含义。 ,
淘
品
工 一
出
英 第四节 设定 唯 误差
室
精 ,
作
一、设定误差场的含义 品
工
职 出
英
1、设定误差 室
精
作
场
人们在建立理论 模型时,要考虑模型中工解释变量的构成、模型的函数形式和随机误差项的若干假定问题,
职
英
如果关于上述内容的设定与 客观实际不精一致,利用计量经济模型来分析经济变量关系时,就会产生误差,则
场
称这种误差为设定误差。 职
二、相关解释变量的遗漏
1、相关解释变量遗漏(又称“欠拟和”)
2、相关解释变量遗漏对模型的影响。
(1)当变量X 与X 相关时,参数估计是有偏的且参数估计非一致。
2i 3i
(2)当变量X 与X 不相关时,αˆ 具有无偏性和一致性。
2i 3i 2
(3)参数估计的方差也是有偏的,见下式
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
σ2
Var(αˆ )=
2 ∑x2
2i
σ2
Var(βˆ )=
2 ∑x x
∑x2 (1− 2i 3i)
2i ∑x2
2i
三、无关解释变量的误选
1、无关解释变量误选(又称“过拟合”)
2、无关解释变量误选对模型的影响
(1)参数的最小二乘估计是无偏的,并且是一致的;
使
(2)参数的最小二乘估计的方差增大,失去参数估计的有效性。 天
小
四、遗漏相关变量和误选无关变量的比较 小
使
蓝
天
1、如果是遗漏相关变量,将导致参数估计量有偏且不一致蔚。
小
:
小
2、如果是误选无关变量,虽然参数估计量具有无偏性服、一致性,但会损失参数估计量的使有效性。
蓝
客 天
蔚
3、若建模时注重检验的无偏性、一致性,宁愿误旺选无关变量也不愿遗漏相关变量。小
:
旺 小
服
4、若建模时注重估计量的有效性,有时可宝能宁愿删除相关变量。 蓝
客
淘 蔚
旺
相比之下,遗漏相关变量的后果要比误 一 选无关变量严重。 :
旺
唯 服
宝
, 第五节 设定淘误差的检验方法 客
品 旺
一
一、设定误差的过拟合—— 出 t检验与F检验唯 旺
室 宝
,
作 淘
如果出现设定误差中过拟合的情况,在品有明确的经济理论下,基于无关变量系数的期望为零,则可用 t
工 一
出
英 唯
检验与F检验结合的精办法对无关变量系室数的显著性进行
,
检验。设模型为:Y =β+βX +βX +βX +u
作 i 1 2 2i 3 3i 4 4i i
场 品
工
职 英 出 βˆ
若检验X
3
是否为无 关变量,
精
可构造t统计量
作
:室t =
seˆ(β
3
ˆ )
场 3
工
职
英
用以检验原假设H :β =0是否显著。
0 3 精
场
职
若检验X 和X 是否为无关变量,可利用F检验对原假设H :β =β =0进行显著性检验。
3 4 0 3 4
设有m个线性约束条件,则所用的检验统计量为
(SSE −SSE )/m
F = r u
SSE /(n−k)
u
式中,SSE 表示施加约束条件后估计模型的残差平方和,SSE 表示未施加约束条件后估计模型的残差平方
r u
和,m表示约束条件的个数,n表示样本容量,k表示未施加约束的描写中被估计参数的个数。可以证明,在
原假设“约束条件为真”的条件下,F ~ F ;在给定α下,查 F分布表,得临界值F (α),若
(m,n−k) (m,n−k)
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
F > F (α),则拒绝原假设,说明约束条件为真的假设不能接受。
(m,n−k)
二、设定误差的欠拟合——DW检验
如果出现设定误差中的欠拟合,则可用DW检验方法判断是否有遗漏变量的情况发生。DW检验的思想是,
遗漏有关变量会出现在随机误差项里,经回归得到的残差序列很可能有自相关性,因此需要用检验序列自相
关的方法判断,这就要用DW检验法。
第六章 面板数据模型
1、面板数据的含义
(1)面板数据:相同截面上的个体在不同时点的重复观测数据;
使
平衡面板数据:数据是完整的,每一个时期的观测个体相等。 天
小
小 T
非平衡面板数据:每一个时期的观测个体不再相等,有些个蓝体缺失,没有数据观 使 测,即∑n < NT 。
天 t
蔚 t=1
小
:
小
面板数据用双下标变量表示。例如:Y ,i =1,2,,N 服 ;t =1,2,,T,蓝i对应面板数据中使不同个体,N表
it 客 天
蔚
旺 小
示面板数据中含有N个个体。t对应面板数据中不同时点,T表示时间:序列的最大长度。若固定t不变,Y , ( i
旺 小 i .
服
= 1, 2, …, N)是横截面上的N个随机变量;若宝固定i不变,Y
. t
, (t = 1, 2… T
蓝
)是纵剖面上的一个时间序
客
列(个体)。 淘 蔚
旺
一 :
旺
面板数据主要分有两种特征:一是个唯体数少,时间长。另一种是个体数服多,时间短。鉴于大多数的数据
宝
, 客
淘
状况,通常使用的是后一种类型。品 。 旺
一
出 旺
唯
二、面板数据的优点 室 宝
,
作 淘
品
1、面板数据是关于不工同时间的个体、公司、地区和国家一等单位的数据,在这些单位中肯定存在异质,而
出
英 唯
室
单独的时间序列和横精截面不能有效反映这种差异。 ,
作
场 品
工
2、面板数 职 据大幅地增加了样本容量。 出
英
室
精
3、面板数据更适合于场研究动态调节。 作
工
职
4、面板数据使得我们能够研究更复英杂的行为模型。
精
场
5、通过使用可获得的几千 单位的个体,面板数据可以把若干个体合并成一个整体时所产生的偏差最小化。
职
总之,相对于单独的截面数据或时间序列数据,面板数据使得本不能进行的分析成为可能。因此,面板
数据丰富了实证分析。当然,面板数据模型在估计和推断上还是有挑战的,比如:截面数据易出现的异方差
和时间序列数据常有的自相关问题都得考虑,同一时点不同截面之间的空间相关也得考虑,这些问题对估计
都会有比较大的影响。
三、面板数据回归模型
1、固定效应回归模型(Fixed Effects Regression Model)。
固定效应回归模型分为 3 种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
效应回归模型。
(1)个体固定效应回归模型(Entity Fixed Effects Regression Model)
如果一个面板数据模型定义为:
Y = α +X 'β +ε, i = 1, 2, …, N; t = 1, 2, …, T (3)
it i it it
其中,α是随机变量,表示对于N个个体有N个不同的截距项,且其变化与X 有关系;Y 为被解释变量(标
i it it
量),ε 为误差项(标量),X 为k ×1阶回归变量列向量(包括k个回归量),β为k ×1阶回归系数列向量,
it it
对于不同个体回归系数相同,则称此模型为个体固定效应回归模型。
α作为随机变量描述不同个体建立的模型间的差异。因为α是不可观测的 ,且与可观测的解释变量X 的
i i 使 it
天
变化相联系,所以称(3)式为个体固定效应回归模型。 小
小
使
个体固定效应回归模型也可以表示为 蓝
天
蔚
小
y it = α 1 + α 2 D 2 + … +α N D N + X it 'β +ε it :, t = 1, 2, … 小 , T (4)
服 使
蓝
客 天
其中 蔚
旺 小
:
1, 如果属 旺 于第i个个体,i =服2, ..., N, 小
D
i
= 宝
客
蓝
0, 其淘他, 蔚
旺
一 :
旺
2、随机效应模型 唯 宝 服
, 客
淘
品 旺
对于面板数据模型: y=α+X'β+ε, i = 1一, 2, …, N; t = 1, 2, …, T
it出i it it
旺
唯
室 宝
如果α为随机变量,其分布与X 无关;y 为被,解释变量(标量),ε 为误差项(标量),X 为k ×1 阶回归变
i 作it it 淘 it it
品
工 一
量列向量(包括k个回归量),β为k ×1阶出回归系数列向量,对于不同个体回归系数相同,这种模型称为个体
英 唯
室
精 ,
随机效应回归模型 场 。其假定条件是:作α i ∼ iid(α, σ α 2 品 ), ε it ∼ iid(0, σ ε 2),都被假定为独立同分布,但并未
工
职 出
限定何种分布。 英
室
精
作
同理也有:时点 随机效场应回归模型和个体时点随机效应回归模型
工
职
英
个体随机效应模型又称 为等相关模 精 型。对于个体随机效应回归模型:y it = α i + X it 'β +ε it , 可以把α i 并
场
入误差项ε
it
。模型改写为:y
it
= 职X
it
'β + (α
i
+ε
it
) = X
it
'β + u
it
其中,u = (α +ε)。如果有α∼(α, σ2),ε ∼(0, σ2)成立,那么
it i it i α it ε
σ 2 , t ≠ s
Cov(u it ,u is ) = Cov[(α i +ε it )( α i +ε is )] = α ,因为,对于t ≠ s,有
σ α 2 +σ ε 2 , t = s
Cov(u ,u ) σ 2
r(u it ,u is ) = it is = α
Var(u ) Var(u ) σ 2 +σ 2
it is α ε
相关系数 r(u,u)与 (t – s) 即相隔期数长短无关。所以个体随机效应模型也称作等相关模型,或者称可
it is
交换误差模型。
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
对于个体随机效应模型,E(α X) =α,则有,E(y X) =α + X'β,对y 可以识别。所以随机效应
i it it it it it
模型参数的混合OLS估计量具有一致性,但不具有有效性。
注意:固定效应模型其实应该称之为“相关效应模型”,即α与解释变量X 相关;而随机效应模型应该称
i it
之为“非相关效应模型”,即α与解释变量X 不相关。而固定效应模型和随机效应模型中的α都是随机变量。
i it i
3、面板数据模型估计原理。
面板数据模型中β 的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效
应模型是否正确而变化。
(1)混合模型——混合最小二乘(Pooled OLS)估计
使
混合OLS估计方法是在时间上和截面上把NT个观测值混合在一起,天然后用OLS法估计模型参数。给定混
小
合模型 小
使
蓝
天
y = α +X 'β +ε, i = 1, 2, …, N; t = 1, 2, …,蔚 T
it it it 小
:
小
如果模型是正确设定的,且解释变量与误差项不相关服,即Cov(X,ε) = 0。那么无论是N→使∞,还是T→∞,
it it蓝
客 天
蔚
模型参数的混合最小二乘估计量都具有一致性。 旺 小
:
旺 小
服
如果模型存在个体固定效应,即α与X 相宝关,那么对模型应用混合OLS估计方蓝法,估计量不再具有一致
i it 客
淘 蔚
旺
性。 一 :
旺
唯 服
宝
(2)平均(Between)OLS估计 , 淘 客
品 旺
一
平均OLS估计法的步骤是首 出 先对面板数据中的唯每个个体求平均数旺,共得到N个平均数(估计值)。然后利
室 宝
,
作 淘
用 y 和 X 的 N组观测值估计参数。以个体品固定效应回归模型:y = α +X 'β +ε 为例,首先对面板中的
it it 工 一 it i it it
出
英 唯
每个个体求(变量关精于时点的)平均 作 数 室 ,从而建立模型 , :y i = α i +X i 'β +ε i , i = 1, 2, …, N
场 品
工
职 出
T 英T T
其中y
i
=T−1∑y
i t
,X
i
=T −
精
1∑X
it
,ε
i
=T−1室∑ε
it
,i = 1, 2, …, N。变换上式得
作
t=1 场t=1 t=1
工
职
英
y = α +X 'β +(α - α +ε ), i = 1, 2, …, N
i i i i 精
场
上式称作平均模型。对上式应职用OLS估计,则参数估计量称作平均OLS估计量。此条件下的样本容量为N,
(T=1)。
如果X 与(α - α +ε )相互独立,α和β的平均OLS估计量是一致估计量。平均OLS估计法适用于短期
i i i
面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于α和 X 相关,也即α和X 相关,
i it i i
所以,回归参数的平均OLS估计量是非一致估计量。
(3)个体固定效应回归模型——离差(Within)OLS估计
对于短期面板数据,离差 OLS 估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
差观测值,然后利用离差数据估计模型参数。具体步骤是,对于个体固定效应回归模型
y = α +X'β +ε
it i it it
中的每个个体计算平均数,可得到模型:y = α +X 'β +ε
i i i i
上两式相减,消去了α,得:y -y = (X -X )'β + (ε -ε )
i it i it i it i
此模型称作离差数据模型。对上式应用 OLS 估计,所得β 的估计量称作离差 OLS 估计量。对于个体固定效应
回归模型,β 的离差OLS估计量是一致估计量。如果ε 还满足独立同分布条件,β 的离差OLS估计量不但具
it
有一致性而且还具有有效性。在短期面板条件下,即便α的分布、以及α和X 的关系都已知道,α的估计量
i i it i
仍不具有一致性。 使
天
离差OLS估计法的主要缺点是不能估计非时变回归变量构成的面板小数据模型。比如X = X(非时变变量),
it i
小
使
蓝
那么有X
i
= X
i
,计算离差时有X
i
-X
i
= 0。
蔚
天
小
:
小
(4)一阶差分(First Difference)OLS估计 服 使
蓝
客 天
蔚
在短期面板条件下,一阶差分 OLS 估计就是对个旺体固定效应模型中的回归量与被回小归量的差分变量构成
:
旺 小
服
的模型的参数进行OLS估计。具体步骤是,对个宝体固定效应回归模型:y = α +X蓝 'β +ε
客 it i it it,
淘 蔚
旺
取其滞后一期关系式:y it-1 = α i + X it- 一 1 'β +ε it-1 旺 :
唯 服
宝
上两式相减,得一阶差分模型 品 (α , i 被消去) 淘 旺 客
一
y
it
-y
it-1
= (X
it
- X
it室 -1
) 出 'β + (ε
it
-ε
it-1
)唯 , i = 1, 2,
宝
…旺, N; t = 1, 2, …, T
,
作 淘
对上式应用 OLS 估计得到的β 的估计量称作品一阶差分 OLS 估计量。尽管α不能被估计,β 的估计量是一致估
工 一 i
出
英 唯
计量。在T>2时,ε 独立同分布条件下室得到的β的一阶差分OLS估计量不如离差OLS估计量有效。
i精t ,
作
场 品
(5)随机效应估计法(可行工GLS估计法,Feasible GLS)
职 出
英
室
设个体固定效 应模型为: 精 y = α +X 'β作 +ε α,ε 服从独立同分布。对其作如下变换: y -λˆ y =
场it i it I , i it it i
工
职
英
(1-λˆ)µ + (X -λˆ X )'β + v (29)
it i it 精
场
其中,v = (1-λˆ)α + (ε -λˆ 职 ε )渐近服从独立同分布,λ = 1- σ ε ,应用OLS估计,则所得估
it i it i
σ 2 +Tσ 2
ε α
计量称为随机效应估计量或可行 GLS 估计量。当λˆ= 0 时,(29)式等同于混合 OLS 估计;当λˆ=1 时,(29)
式等同于离差OLS估计。
对于随机效应模型,可行GLS估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,
可行GLS估计量不是一致估计量。
5、面板数据模型设定检验方法(重在运用,中计,P209)
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
(1)F检验
(2)Hausman检验
Hausman检验用途很广。可用来做模型丢失变量的(设定误差)检验、变量内生性检验、模型形式设定
检验、模型嵌套检验、建模顺序检验等。
面板数据中利用H统计量进行面板数据模型形式设定的检验:
假定面板模型的误差项满足通常的假定条件,如果真实的模型是随机效应回归模型,那么β 的离差
~
(Within)OLS估计量βˆ 和随机GLS法估计量β 都具有一致性。如果真实的模型是个体固定效应回归模型,
W RE
则参数β 的离差OLS法估计量βˆ 是一致估计量,但随机GLS估计量β
~
是使非 一致估计量。可归纳如下:
W RE
天
离差变换最小二乘估计量与可行最小二乘估小计量性质对比
小
使
蓝
离差变换最小二乘 可行最小二乘估计 估 计 量 之 差
天
蔚
小
:
估计 小βˆ −βˆ
服 w RE 使
蓝
客 天
蔚
个体随机效应 估计量βˆ 具有一致 旺 估计量βˆ 具有一:致性 小 小
W 旺 RE 小
服
模型 宝 大 蓝
客
性 淘 估计量β旺 ˆ 不具有一致 蔚
个体固定效应 一 RE :
旺
估计量βˆ 唯具有一致
性 宝
服
模型 ,W 淘 客
品 旺
性 一
出 旺
唯
室 宝
作
,
淘
品
工 一
~ 出
因此,可以通过H英统计量检验(β -βˆ )的非零显著唯性,检验面板数据模型中是否存在个体固定效应。
精 R室E W ,
作
场 品
利用个体固定效应的特征,提出原工假设与备择假设为
职 出
英
室
H: 个体 效应与回归精变量无关(个体随机效应回归模型)
0 作
场
工
H: 个体效应与职回归变量相关(个体固定效应回归模型)
1 英
精
例如,
场
职
βˆ =0.7747,s(βˆ ) = 0.00868(计算结果对应图18);
W W
~ ~
β =0.7246,s(β ) = 0.0106(计算结果取自EViwes个体随机效应估计结果)
RE RE
~
H =
(βˆ
W
−β
RE
)2
=
(0.7747−0.7246)2
= 68.4
~
s(β )2 −s(βˆ )2 0.01062 −0.00872
RE W
因为 H =68.4 > χ2 = 3.8,则拒绝原假设,表明模型存在个体固定效应。应该建立个体固定效应回
0.05 (1)
归模型。
附:1、个体随机效应回归模型、个体固定效应回归模型和和面板数据模型设定检验方法
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
2、回归结果与模型估计的结果的解读和分析
3、Logit 模型 (中计,P )
75
4、非平稳时间序列:单位根检验(ADF检验)(中计,P )
128
使
天
小
小
使
蓝
天
蔚
小
:
小
服 使
蓝
客 天
蔚
旺 小
:
旺 小
服
宝 蓝
客
淘 蔚
旺
一
旺
:
唯 服
宝
, 客
淘
品 旺
一
出 旺
唯
室 宝
,
作 淘
品
工 一
出
英 唯
室
精 ,
作
场 品
工
职 出
英
室
精
作
场
工
职
英
精
场
职
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。金融/四大/国企/名企求职笔试面试教育-职场精英工作室,店址:https://huntjob.taobao.com/ 唯一旺旺客服:蔚蓝小小天使
使
天
小
小
使
蓝
天
蔚
小
:
小
服 使
蓝
客 天
蔚
旺 小
:
旺 小
服
宝 蓝
客
淘 蔚
旺
一 :
旺
唯 服
宝
, 客
淘
品 旺
一
出 旺
唯
室 宝
,
作 淘
品
工 一
出
英 唯
室
精 ,
作
场 品
工
职 出
英
室
精
作
场
工
职
英
精
场
职
本资料仅限购买者一个人使用,不得分享/转赠/转卖;祝各位获得心仪offer。版权所有,违者必究。