第一节 粮价数据的选取及统计方法
本书采用的粮食价格数据来自于中国社会科学院经济研究所图书馆所收藏的《清代道光至宣统间粮价表》。在清代粮价奏报体系中,山西粮价奏报出现较早,在康熙年间开始出现,完善于乾隆年间,最早时只有粟米价格,之后增加了麦子、高粱、荞麦以及豌豆的价格。当时上报的粮价单为每月一次,其中包括每个月每种粮食的价格平贵程度、最高价和最低价以及与上月相比粮价的增减变化。
古代的度量衡并未完全统一。清朝实行银铜平行本位制,官方交易的基础是银。在粮食奏报体系中,货币计量单位也大多是银,即使有一些粮食价格数据用铜钱计算,但在奏呈皇帝时也必须换算为银。粮食的容量单位多种多样,各地曾经使用石、斗、地方石、仓石、京石等,尚不统一。乾隆帝在批示陕西巡抚崔纪于乾隆二年九月奏报米麦豆价时要求:“以后米价当以石计,此应是对容量单位的统一规范之举。”至此之后,粮价单上的计量单位为两/石。多数粮价计价称量小数位精确到“分”,也有部分精确到“厘”。本书中使用的数据为精确到分的数据。
粮价奏报以省、府为单位逐级呈报。按行政区域划分,清代山西分为四个道,由北到南依次是归绥道、雁平道、冀宁道和河东道,每个道内又分为多个府州。
一 数据的选取(奏报制度和相关说明)
中国古代是农业大国,各朝各代都很重视粮食问题,特别是在清代,粮价奏报制度的形成体现了统治者对粮食价格的重视。粮食价格会直接影响消费者的消费,进而会影响粮食的销售,也会间接影响其他商品的生产和价格。在封建社会,粮食价格的剧烈波动还会对统治者的统治产生影响。因此统治者对粮食价格的重视和调控对社会稳定、人民生活质量的提高都有着重要的意义。
粮价奏报制度起源于清代,各地方官员每月将其所管辖地区主要粮食的价格进行统计核对,然后逐级上报,最终由各地的总督或巡抚向中央奏报。这种粮食价格奏报制度在康熙年间初见端倪,在乾隆年间正式形成,一直延续到清朝灭亡,共延续了170多年。在康熙年间,一些有权向皇帝直接呈递奏折的官员,便会在奏折中上报当地的粮价、雨雪及收成情况,但是当时的奏报制度并没有统一的计量单位以及统一的时间和地区等,因此康熙年间的粮价奏报制度是比较混乱的,处于萌芽阶段。
在乾隆年间,乾隆帝开始着手统一粮价奏报的时间、地区及计量单位等,在乾隆初年逐渐形成粮价由各地区督抚按月上报,并且要将本月的粮价与上月粮价做比较,自此粮价奏报制度在乾隆初年基本确立。此后,乾隆帝逐渐确立将粮价奏报按州、府分别奏报,由最基层的县官采集粮食价格,于本省内逐级上报与核对,最后由本省总督或巡抚统一向皇帝奏报,并且通过调整上报的粮食品种,改变了当时粮食品种过于单一的情况。同时,当时的政府还通过其他渠道进行粮食价格的统计。但是在道光之后,除了巡抚以及总督,其他的官员很少再向中央汇报粮食价格。道光之后粮价数据的可信度开始下降。
粮价奏报制度的确立,进一步巩固了中央对地方政治及经济的调控,加强了中央对地方的统治。粮价奏报制度的实行,使得政府可以根据所奏报的粮价及其他相关情况对粮食进行地区间的调控,方便了政府稳定粮食价格,并且通过粮食奏报制度了解当时各个地区的经济情况。
学界现存的比较完善的数据库主要有两个,一个是汤象龙先生整理的《清代道光至宣统间粮价表》(简称《粮价表》),另一个是王业键先生整理的清代粮价资料库。《粮价表》是由汤象龙先生等学者根据故宫档案馆中道光至宣统年间的粮价清单抄录的,共约2.5万件。这份档案的价值不仅体现在其反映了清代道光至宣统年间粮食价格的情况,还体现在其将古代数据进行了重新的排列、校对、勘误及统计,使得整理而得到的数据更准确,更便于研究者使用。王砚峰等人曾抽取了《粮价表》中光绪三十四年(1908)元月到四月各省的全部数字与故宫博物院现存的宫中粮价原始史料进行校验,校验结果的准确率达到极高的水平。《粮价表》绝大部分地区的粮价从道光元年开始截止到宣统三年(1911)六月,个别地区的数据截止到宣统三年十月,共有1124个月份的全国粮价数据,统计数据按照20世纪30年代抄录的原粮价档案统计数据抄录。在存疑处按照中国第一历史档案馆所藏原始粮价单,逐一核对计算,对原表中的错误进行了校正和补录。除少部分地区由于灾害、战争等原因当时的数据没有上报,以及部分地区的划分变动及原始档案数据缺失造成《粮价表》缺乏少量数据外,其余大部分地区的数据都是完整和连续的。
《粮价表》抄本以省分册,共21个省,约450个府。我们所选取的是其中道光年间山西省的粮价数据。山西省《粮价表》的粮食品种为:小米、麦子、荞麦、高粱、豌豆,基本涵盖了当时山西省的主要粮食。粮价单是以每省每月一单的形式上报,粮价表的格式为三年一页,每年十二个月(闰年十三个月),每个月为一行,每种粮食为一列,每种粮食又分为最低、最高、较上月三列,最前列为价格平贵。《粮价表》的粮食单位为石、价格单位为两,例如道光十二年(1832)正月小米最高2.5,表示的是每石小米为2.5两白银。《粮价表》中价格平贵有贱、平、中、贵、昂、增、减等,这表示的是粮食价格的涨跌及波动水平。其中最低价一般是由政府控制,一般情况下变化幅度特别小。与上月相比的价格有正有负,0代表这个月与上个月相比没有变化,负数代表本月价格与上月相比下跌了,正数代表本月价格较上月上涨了。需要特别说明的是,一些数据仅有当月数据,而没有最高价、最低价,如宁武府的高粱价格。我们在数据选取的时候一般认为最高价是由市场决定的,而最低价是政府给予补贴或者赈济之后的价格。所以如果没有特别说明的话,本书的数据一般以最高价格为基础。
《粮价表》中的5、6两册为山西地区的粮食价格。这两册中的数据并不是完整的,为了降低之后数据处理以及分析的误差,这里将所有的缺失数据予以列举,山西省全部府州道光二十八年(1848)十一月、道光二十九年(1849)十二月五种粮食的数据缺失;保德州道光元年(1821)四月的豌豆数据、道光二年(1822)四月至八月、道光九年(1829)五月至七月、道光十年(1830)九月至道光十一年(1831)五月的小米最低价数据,道光九年(1829)十月的麦子最低价数据缺失;大同府道光八年(1828)九月、十月的小米最低价数据缺失;辽州道光十二年(1832)十一月、十二月的高粱最低价数据缺失。所有缺失的数据使用缺失前后的数据均值填补。
二 统计方法
由于粮价资料数据庞大,我们在分析的过程中首要的步骤就是对数据进行相关处理,主要用到的方法有直观分析、推估分析、计量分析以及门限检验等。下文我们将会对每个部分进行详细的论述。
(一)直观分析
本书运用了大量的折线图来说明相关问题。由于折线图是以折线的上升或下降来表示统计数量增减变化的统计图,所以不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化情况。其特点是能够显示数据的变化趋势,反映事物的变化情况,从图中可以较为清楚地看出各种粮食的价格走势以及在不同时间段的变化。通过将数据进行可视化的展现,我们将对不同时间段、不同品种的粮食的价格波动有一个直观的认知。这样的分析有利于我们进一步地分析并揭示粮食价格变动的规律。如本书在本章的粮价年内分析和年度分析中,就通过绘制折线图来观察各种粮食在不同时间段的变化情况以及特点。
(二)推估分析
在分析的过程中我们有时会采用平均数的处理方法。平均数是分析社会经济现象一般水平和典型特征的最基本指标,是把全部观测值相加之后,再除以样本数量。其优点是能够反映所有样本值,缺点是如果样本中出现极大值或极小值,则平均数比较容易受极值的影响,导致最终偏离样本观测值的中心。本书在研究粮食地区差价时就用到了该方法,以人们日常食用最多的小米的价格均值代表该地区的价格水平,通过比较得出太原府所在的冀宁道为高价区,解州所在的河东道为中高价区,归绥道为中低价区,大同府所在的雁平道为低价区。
(三)计量分析
由于《粮价表》中的数据是时间序列数据,为了更加准确地反映各个地区之间的关系,我们在进行计量处理之前都先对数据进行了X12平检,通过X12平检消除了时间序列数据的季节性因素。
相关系数
相关系数(r)是指可以用来表示现象之间相关关系密切程度的数量关系。相关关系的数值有个范围,在+1和-1之间,即-1≤r≤+1。计算结果带有负号表示负相关,带有正号表示正相关。相关系数r的数值越接近于1(+1或-1),表示相关关系越强;越接近于0,表示相关关系越弱。计算公式为:
当相关系数介于0-0.2之间或者-0.2-0之间称为不足取相关,或称零相关;
当相关系数介于0.2-0.4之间或者-0.4- -0.2之间称为低度相关;
当相关系数介于0.4-0.8之间或者-0.8- -0.4之间称为中度相关;
当相关系数介于0.8-1之间或者-1- -0.8之间称为高度相关。
格兰杰因果检验
格兰杰因果关系检验假设有关y和x每一变量的预测的信息全部包含在这些变量的时间序列之中。检验要求估计以下的回归:
其中μ1t和μ2t假定为不相关的。
公式(3-2)假定当前y与y自身以及x的过去值有关,而公式(3-3)对x也假定了类似的行为。
对公式(3-2)而言,其零假设H0: α1=α2=…=αq=0。
对公式(3-3)而言,其零假设H0: δ1=δ2=…=δs=0。
以下分四种情形讨论:
x是引起y变化的原因,即存在由x到y的单向因果关系。若公式(3-2)中滞后的x的系数估计值在统计上整体的显著不为零,同时公式(3-3)中滞后的y的系数估计值在统计上整体的显著为零,则称x是引起y变化的原因。
y是引起x变化的原因,即存在由y到x的单向因果关系。若公式(3-3)中滞后的y的系数估计值在统计上整体的显著不为零,同时公式(3-2)中滞后的x的系数估计值在统计上整体的显著为零,则称y是引起x变化的原因。
x和y互为因果关系,即存在由x到y的单向因果关系,同时也存在由y到x的单向因果关系。若公式(3-2)中滞后的x的系数估计值在统计上整体的显著不为零,同时公式(3-3)中滞后的y的系数估计值在统计上整体的显著不为零,则称x和y间存在反馈关系,或者双向因果关系。
x和y是独立的,或x与y间不存在因果关系。若公式(3-2)中滞后的x的系数估计值在统计上整体的显著为零,同时公式(3-3)中滞后的y的系数估计值在统计上整体的显著为零,则称x和y间不存在因果关系。