2.3 GMM估计的问题
2.3.1 工具变量的外生性
方程(2—3)的模型可能遗漏了一些通货膨胀的解释变量。进行估计时这些被遗漏的变量会进入误差项。如果这些被遗漏的变量和工具变量是相关的,那么工具变量的外生性就不成立了,GMM估计将给出错误的结果。Gali和Gertler(1999)的工具变量集中包含的利率、工资变化率和商品价格变化率都可能对通货膨胀有直接影响。在这种情况下,把它们的滞后变量作为工具变量将导致错误的估计。Rudd和Whelan(2005a)指出当真实模型是一个纯后视性预期模型而且包含利率、工资变化率和商品价格变化率时,用Gali和Gertler(1999)的工具变量集估计方程(2—3)将高估γf。
Zhang等(2009)指出通货膨胀的滞后变量也可能不是外生的。因为利用方程(2—3)估计的误差项是序列相关的,在这种情况下通货膨胀的滞后变量和误差项是相关的,所以Zhang等(2009)主张在方程(2—3)中增加通货膨胀的高阶滞后来消除误差项中的序列自相关。
2.3.2 工具变量和内生变量的弱相关问题
Stock等(2002)指出,在存在弱识别和弱工具变量问题的时候,GMM的估计是有偏的,而且残差是非正态的,这将导致错误的统计推断。Ma(2002)、Dufour等(2006)、Nason和Smith(2008)以及Kleibergen和Mavroeidis(2009)指出混合型新凯恩斯主义菲利普斯曲线是弱识别的,因此,基于GMM的统计推断是不可靠的。
方程(2—3)可以写成闭式解形式:
模型的识别要求πt+1的工具变量必须对方程(2—5)右边的变量具有解释力,否则工具变量和πt+1不相关,模型将无法识别。因为方程(2—3)中πt是被解释变量,所以它不能作为πt+1的工具变量。因此,πt+1的工具变量必须是能够解释未来劳动报酬份额(即logSt+j, j≥1)的变量。方程(2—5)表明通货膨胀和劳动报酬份额的滞后变量能作为πt+1的工具变量(仅当它们可以解释未来劳动报酬份额的变化时)。换言之,logSt必须是一个高阶自回归过程AR(p)(p≥2)或者三阶以上的通货膨胀滞后变量可以显著地影响logSt。然而,Rudd和Whelan(2005b)以及Kurmann(2005)的向量自回归模型显示,通货膨胀的滞后变量对logSt几乎没有解释力。Kurmann(2005)的表1还显示logSt的二阶以上滞后对logSt的解释力是不显著的。因为通货膨胀和劳动报酬份额的滞后变量不是完全和劳动报酬份额的未来值无关的,所以它们是和πt+1相关的,方程(2—3)的参数可以用滞后内生变量作为工具变量估计出来。但是,因为相关度非常低,通货膨胀和劳动报酬份额的滞后变量是πt+1的弱工具变量,而方程(2—4)是弱识别的,所以用这些滞后变量作为工具变量的GMM估计是有偏的,而且残差是非正态分布的,标准的统计推断将给出错误的结论。Rudd和Whelan(2007)试图用滞后内生变量作为工具变量,通过GMM估计方程(2—5)的滞后一阶形式来证明前瞻性预期行为是不重要的。事实上,这种做法并不能有效地区分前瞻性预期行为和后视性预期行为的相对重要性。因为与Gali和Gertler(1999)一样,他们的估计结果同样受到弱工具变量问题的影响,因此是不可靠的。
与此类似,Rudd和Whelan(2005b,2007)以通货膨胀的滞后变量对未来劳动报酬份额没有预测能力(换言之,通货膨胀不是劳动报酬份额的格兰杰原因)为由,判断前瞻性预期行为是不重要的。这也是不正确的。根据我们这里的分析,格兰杰因果关系的真正意义在于,通货膨胀作为劳动报酬份额的格兰杰原因是通货膨胀滞后变量作为πt+1的有效工具的必要条件,否则模型是弱识别的。也就是说如果通货膨胀不是劳动报酬份额的格兰杰原因,那么以通货膨胀滞后变量作为工具变量的GMM估计无法得出有关前瞻性预期行为的相对重要性的准确判断。Kiley(2007)的蒙特卡洛模拟结果显示,即使混合型菲利普斯曲线方程(2—3)是真模型,格兰杰因果检验也可能得出通货膨胀不是劳动报酬份额的格兰杰原因的结论。这表明我们并不能根据格兰杰因果检验判断前瞻性预期行为是否对通货膨胀动态有影响。
2.3.3 基于其他工具变量的GMM估计
前面的分析显示,GMM估计的问题主要来自采用内生变量的滞后变量作为工具变量。当劳动报酬份额不服从高阶自回归过程且不受高阶通货膨胀滞后变量影响时,劳动报酬份额和通货膨胀的滞后变量不能作为有效的工具变量。一些学者试图通过寻找替代的工具变量来解决这个问题。Shapiro(2007)注意到在科布—道格拉斯生产函数下,实际边际成本不仅是和劳动报酬占总收入的份额成正比的,而且还是和中间投入成本占总收入的份额成正比的。这意味着方程(2—3)的另一种形式是
其中ISt是中间投入成本占总收入的份额。单纯置换实际边际成本的代理变量并不足以解决GMM估计的弱工具变量和弱识别问题。Shapiro(2007)的文章的要点在于提出了比通货膨胀滞后变量更有效的工具变量。将方程(2—6)写成类似于方程(2—5)的闭式解形式:
和前面讨论的情况类似,除非通货膨胀和中间投入成本份额的滞后变量能够解释中间投入成本份额的未来变量,否则它们是不能作为通货膨胀未来变量的有效工具变量的。Shapiro指出我们可以用上游企业的中间投入成本份额作为最终产品通货膨胀的工具变量。具体而言,根据方程(2—7),如果 ISt是一个AR(1),那么我们不能用ISt的滞后变量作为πt+1的工具变量。如果ISt和三阶以上通货膨胀滞后无关,那么我们也不能用通货膨胀的滞后变量作为πt+1的工具变量。但是因为上游产业的中间投入成本和下游产业的中间投入成本是相关的,所以只要下游产业的中间投入成本ISt是一个AR(1),上游产业的中间投入成本份额就对ISt的未来值有解释力并且可以被用做πt+1的工具变量。以上游产业的中间产品投入成本及其滞后变量作为工具变量,Shapiro(2007)用GMM估计方程(2—6),得到了γf>γb的结论。因此,Shapiro(2007)的经验结论与Gali和Gertler(1999)是类似的,所不同的是因为采用了更加可靠的工具变量,所以他的统计推断要更加稳健。
与Shapiro(2007)类似,Dees等(2009)置换了方程(2—3)中实际边际成本的代理变量并且通过采用额外的工具变量改进了GMM的估计效果。具体而言,他们估计:
与Gali和Gertler(1999)相同,Dees等也认为用通常的统计方法(例如HP滤波法)估计的产出缺口不是真实产出缺口的准确估计。所不同的是,Gali和Gertler(1999)用劳动报酬份额代替产出缺口作为的代理变量,而Dees等沿用产出缺口作为的代理变量,只是改变了产出缺口估计的方法。Dees等认为用通常的统计方法估计的产出缺口是不准确的,因为它完全基于国内变量的变化,而忽视了产出和通货膨胀等宏观经济变量的变化都是受全球性因素影响的。因此,他们采用两步法估计了国内的产出缺口。首先,他们估计了一个包含主要国家主要宏观经济指标的全球向量自回归模型(GVAR model)。然后,他们对这个估计后的模型应用Beveridge-Nelson分解并从中得到各国主要宏观经济变量的趋势和周期性部分。其中本国产出的周期性部分就是该国产出缺口的估计。这种基于全球模型的产出缺口的估计因为利用了本国以外的经济信息而更有效率。和方程(2—6)一样,方程(2—8)对代理变量的置换本身并不能解决通常GMM估计的弱工具变量和弱识别问题。如果是一个AR(1),并且不受通货膨胀三阶以上滞后的影响,那么通货膨胀和产出缺口的滞后变量不能作为πt+1的工具变量。但是因为一国的产出缺口和世界的产出缺口与通货膨胀是高度相关的,所以世界的产出缺口和通货膨胀可以作为本国通货膨胀未来变量πt+1的额外工具变量。当然,以世界产出缺口和通货膨胀作为工具变量要求它们对一国国内的内生变量是外生的,也就是说一国无法决定全世界的产出和通货膨胀水平。Dees等的检验表明这个假设即使对美国这样的超级大国也是成立的。与Shapiro(2007)类似,Dees等用新工具变量集进行估计的结果也显示γf>γb,但是其估计精度比Gali和Gertler(1999)的要高。
Wright(2009)沿用劳动报酬份额作为的代理变量,用GMM估计了方程(2—3)。在工具变量的选取上,Wright强调了两点:第一,因为存在对数据的修正,所以美国企业对通货膨胀做出预期时的实时通货膨胀数据和经济学家进行统计推断时所用的通货膨胀数据是不一样的。为了准确把握企业的预期行为,选取工具变量集的时候应该用预期行为发生时的实时通货膨胀数据(即未修正过的数据)进行估计。第二,因为美国企业和公众根据美国联邦储备委员会(美联储)的通货膨胀预测调整自己的通货膨胀预期,所以美联储绿皮书的通货膨胀预测可以作为额外的πt+1的工具变量。他发现用实时通货膨胀数据修正滞后通货膨胀率构成的工具变量集,并加上美联储绿皮书的通货膨胀预测作为额外的工具变量,参数估计的置信集要比用传统工具变量进行参数估计的置信集小很多,也就是模型的估计更加精确了。Wright(2009)的图1显示,采用这种方法估计的γf是落在0.5到1之间的,因此,通过采用额外的工具变量,Wright(2009)再次验证了Gali和Gertler(1999)的结论:前瞻性预期行为主导了美国的通货膨胀动态。