一 数据
数据(Data)是统计分析的原材料,是根据特定的研究目的而收集以供统计分析之用的事实及数字。这些事实及数字的集合,称为数据集(Data Set)。为了研究游客在聊城的旅游体验满意度,笔者曾对来聊城旅游的258名游客进行了一项问卷调查,所收集到的所有数据就构成了该项研究的数据集。表1—1显示的即是此数据集的一部分。
在数据收集过程中所依赖的单个实体,称为个体(Element)。不同的研究目的和研究对象,决定着个体的差异。在上述游客旅游体验满意度研究中,个体是每一位到聊城旅游的游客。假如从事一项关于某地区酒店业人力资源情况的研究,那么个体便是该地区的每一个具体的酒店。
表1—1 聊城市游客旅游体验满意度数据集(部分)
(一)定性数据与定量数据
从表1—1可以看出,有些数据如“山东”“男”是以文字形式呈现的,有些数据如36、3000是以数字形式呈现的,这表明数据是有不同类型之分的。依据数据的自身性质,可将数据划分为两类:定性数据(Qualitative Data)与定量数据(Quantitative Data)。
定性数据是用来标记个体性质或规定个体类别的数据。此类数据常以文字(或字符串)形式呈现,不可进行数学运算。例如,表1—1中的“山东”为定性数据,它标明了这位游客的地区特征。再如,“男”也为定性数据,它是这位游客的性别标识。
定量数据是用来描述个体数量特征的数据。此类数据以数字形式表现,能够进行数学运算。例如,表1—1中的36为定量数据,它说明这位游客的年龄是36岁。再如,3000也为定量数据,它说明这位游客的月收入是3000元。
定量数据在描述个体数量特征时,有两种情形需要区分。一种情形是说明个体的数量特征(如年龄、月收入、旅游天数等)是多少(如岁、元、天等);另一种情形是表明个体有多少个。假如在上述游客旅游体验满意度研究中,我们仅关注游客的性别构成,可将258名游客按性别分成两组,其表现形式如表1—2所示。表格中的190、68的意义与年龄、月收入的意义有着根本不同,它们表达的是男性游客、女性游客分别是190名和68名。
表1—2 游客性别分组
一般来说,我们可以通过数据的表现形式对数据的类型进行准确的判断。但是,数据的形式与性质并不是完全一一对应的。以文字形式呈现的数据一定是定性数据,然而以数字形式呈现的数据并非一定是定量数据。如果一个数字没有度量单位,不能进行数学运算,那么它仅仅是标记个体特征的字符,属于定性数据。如果一个数字有度量单位,可以进行数学运算,此时它被称为数值(Numberial Value),属于定量数据。例如,表1—1中的编号一栏,“1—7”这7个数据在形式上可以被视为数字(当然也可以被视为字符串),但在性质上却是定性数据。它们没有度量单位,不可进行数学运算,其功能是对这7名游客编号以方便识别,而不是说明游客的数量特征。
另外,将定性数据输入统计软件(如本书所讲述的SPSS)时,经常先对其进行重新编码,再进行录入。编码的过程常常会改变定性数据的表现形式,但并不会改变定性数据的性质。比如,录入游客性别数据时,可先将字符串“男”“女”分别编码为数字1、2(需要注意的是,在进行编码时,1和2也可被定义为字符串),然后将其输入统计软件。这两个数字表达的不是“1个”或“2个”的意义,仍为“男”或“女”的意义。
(二)一手数据与二手数据
数据,就其本身的来源来讲,均来自观察、调查或实验。然而,从研究人员的角度来看,数据的来源有两个:自己或他人。
研究人员通过亲身观察、调查或实验等方法所获得的直接数据,称为一手数据(又称为原始数据)。如在上述旅游体验满意度研究中,笔者亲自进行问卷调查所得到的数据即为一手数据。一手数据为具体的研究专门量身定制,具有极强的相关性和时效性,但可能会花费大量的人力、物力和时间成本。
研究人员通过文献(如《中国旅游统计年鉴》)、网站(如国家旅游局官网)等间接渠道收集到的已有统计数据,称为二手数据。相较于一手数据而言,二手数据极大地解决了数据获取的成本问题,而且数据容量往往较大,可为研究提供很大便利。但是,可能会存在与研究主题相关性不足、时效性不强的问题。在具体的研究中,研究人员应从自身的研究需要和研究条件出发,合理地选择数据来源。
(三)截面数据与时间序列数据
根据数据收集时间的不同,又可将数据分为两类:在或大约在同一时间(时点或时期)截面上所收集到的关于不同个体的数据,称为截面数据(Cross-section Data),此类数据在统计分析中最为常用;在几个时间段内收集的关于同一个体的数据,称为时间序列数据(Time-series Data),此类数据反映了客观事物或现象等随时间的变化状况。上述游客旅游体验满意度调查数据为截面数据,它们描述的是在同一时间截面上关于258名游客的旅游体验满意程度。表1—3中的数据为时间序列数据,它们反映的是中国2005—2014年入境旅游人数和旅游外汇收入的发展情况。
表1—3 中国2005—2014年入境旅游统计数据