第三篇高级专题
第13章跨时横截面的混合:简单面板数据方法
13.1复习笔记
git使用详解考点一:跨时独立横截面的混合★★★★★
1.独立混合横截面数据的定义
独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。这种数据的重要特征在于:都是由独立抽取的观测所构成的。在保持其他条件不变时,该数据排除了不同观测误差项的相关性。区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)
表13-1使用独立混合横截面的理由
3.对跨时结构性变化的邹至庄检验
(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别
(2)对多个时期计算邹至庄检验统计量的办法
①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k个约束。而无约束模型中有T+Tk个待
估计参数。所以,F检验的df为(T-1)k和n-T-Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析
(1)自然实验与真实实验
当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准
实验)。一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。自然实验中,政策发生后才能确定处理组和对照组。在真实实验中,处理组和对照组是随机而明确地抽取的。
为了控制对照组和处理组之间的系统差异,可以按照使用目的将样本分为:变化前的对照组、变化后的对照组、变化前的处理组和变化后的处理组。对照组称为C,处理组称为T,并设置虚拟变量dT,如果样本属于处理组,则dT=1,否则等于0。令d2为第2个时期的虚拟变量,模型方程为y=β0+δ0d2+β1dT+δ1d2·dT+其他因素。其中,y是结果变量;δ1度量政策效应。当回归中没有其他因素时,∧δ1是倍差估计量,满足:∧δ1=(_y2,T-_y2,C)-(_y1,T-_y1,C)。
(2)政策的平均处理效应及其估计方法
平均处理效应度量的是对y的平均结果的“处理”或政策效应。估计值为:∧δ1=(_y2,
-_y1,T)-(_y2,C-_y1,C),该值不会依赖于进行差分的方式。估计方法主要有:
T
①在每个时期都计算处理组与控制组的平均值之差,再对不同时期的上述差值做差分。
②分别计算处理组和控制组不同时期的平均值变化,然后再将这些变化做差分。
考点二:两时期面板数据分析★★★★
1.面板数据的定义
面板数据具有横截面和时间序列的特征,区别于独立混合横截面。面板数据是指在不同时间跟踪的相同个体的数据,即每个样本个体在不同时间都有观测值。如果对于n个个体,每个变量的时间跨度都一致,则称为平衡面板,否则称为非平衡面板。
2.固定效应模型
令i表示横截面单位,t表示时期,可将含有单个可观测解释变量的模型写成:y it=β0+δ0d2t+β1x it+a
i+u it,t=1,2。其中,变量d2t是一个在t=1时取值为零而在t=2时取值为1的虚拟变量,它不随i而变化;变量a i包含影响y it但又不随时间而变化的所有无法观测的因素,一般都被称为非观测效应或固定效应;误差u it通常被称为特异误差或时变误差。因此,上述模型被称为非观测效应模型或固定效应模型,a i被称为非观测异质性。
3.估计β1的方法
给定两年的面板数据,估计参数β1的方法是:直接把两年的数据混合起来用OLS估计。为了得到一致的估计量,必须假定非观测效应a i与x it无关。
将模型写成:y it=β0+δ0d2t+β1x it+v it,t=1,2。其中,v it=a i+u it常被称为复合误差。即使假定特异误差u it与x it无关,如果a i与x it相关,混合OLS估计就是偏误且不一致的。由此造成的偏误有时被称为异质性偏误,这是由于遗漏了一个不随时间而变化的变量所导致的。
4.一阶差分方程
在大多应用中,收集面板数据主要是为了考虑非观测效应a i与解释变量相关。因为a i 是不随着时间而变化的常数,所以可以取两个年份的数据之差。
对横截面的第i个观测值,把两年的方程分别写为:y i2=(β0+δ0)+β1x i2+a i+u i2(t=2),y i1
=β0+β1x i1+a i+u i1(t=1)。两个方程相减可得:y i2-y i1=δ0+β1(x i2-x i1)+(u i2-u i1),简化为:∆y i=δ0+β1∆x i+∆u i。该式称为一阶差分方程,它是由单个横截