上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.4.1 数据的预处理
由于计算机不能直接处理现实世界中的具体事物,因此必须先把具体事物转换成计算机能够处理的信息,即研究者需要对数据进行初步的加工、转换(即数据的预处理),以便适合采用相应的统计方法。那么,在SPSS中涉及预处理的内容有哪些呢?
●当研究者收集了大量的原始数据后,第一步需要将数据录入SPSS中,SPSS可以直接打开多种格式的数据,也可以通过数据库查询导入SPSS中。那么该如何录入呢?详见本书:3.1节“数据的录入与保存”、3.2节“其他格式数据的导入”。
●在海量的数据中,需要对数据进行核查。详见本书:3.5节“标识重复个案”、3.15节“缺失值的处理”。
●需要对各个变量进行数据转换,主要集中在【转换】菜单下。详见本书:“3.10节新变量的生成”、3.11节“个案中值的计数”、3.12节“对变量重新赋值”、“”3.13节可视化分段。
●需要对各个变量进行数据管理,主要集中在【数据】菜单下。详见本书:3.3节“数据的重构”、“”“”3.14节个案排秩、3.16节数据的排序。
●需要对整个数据文件进行管理,主要集中在【数据】菜单下。详见本书:3.4节“数据的合并”、3.6节“数据的拆分”、3.7节“数据的筛选”、3.8节“数据的加权”、3.9节“数据的汇总”。
通过以上预处理,原始数据就被转换成合乎统计分析的数据,提高了数据挖掘的质量。下一步,我们就根据统计分析的目的及变量的特征来选择正确的统计分析方法。