前言
计算机科学与技术与其他学科最大的不同就是突破了学科范式的限制,渗透到各个学科,形成了一套有效的思维模式——计算思维,促使学科的研究范式走向多元化。学习者的计算思维能力水平对他们未来从事科研的能力、适应社会的能力具有重要影响。在大数据时代,数据处理与分析的方法和策略是计算思维的重要组成部分,对学习者科研能力的提升具有重要意义。
随着大数据时代的来临,基于社会调查和项目评价的定量研究日益增加,在教育学领域、经济学领域、社会学领域、中文信息处理领域都有着非常重要的地位。然而,不可否认的是:在众多研究项目中,经常存在着误用或者滥用数据分析方法的问题。笔者作为评委评价北京师范大学的学生科研项目时,每年都会发现多份基于定量分析的科研项目误用了不恰当的数据分析方法。研究方法的错误,直接导致研究结论的可信度不高,严重影响了研究的质量。分析学生和研究者在数据定量分析中出现的这些问题,编者认为导致这一现象的原因主要包括以下3个方面:首先,部分研究者并没有完全掌握每个数据分析方法的约束条件,不知道各分析方法对原始数据有哪些要求,数据分析的输入数据应该满足哪些规范;其次,部分研究者并不了解各数据分析方法的基本原理,没有掌握该分析方法是以什么样的算法来评价数据的;第三,部分研究者对各个分析方法的输出结果并不了解,只是简单地知道“检验概率”值以0.05为界,对输出表格中的其他信息知之甚少。正是因为存在这些问题,所以在教学类的定量研究中,就出现了对实验班和对照班的数据采用“配对样本T检验”的错误,也出现了对低测度的定序数据实施“Pearson相关”分析的错误;在关于社会调查的数据分析中,更是出现了把无效的线性回归模型作为最终研究成果的研究报告。
根据编者接触到的学生和研究者在数据分析过程中存在的各种问题,编者认为:由于当前已经有很多现成的数据分析软件,所以对于非统计学专业的学生来讲,了解每个数据分析方法中算法的准确数学公式并不重要,更重要的是要求他们把精力聚焦于各个分析方法的输入与输出,即要求学习者准确地掌握每个数据分析方法对原始数据的要求,并能够正确地解读数据分析结果表格。在此过程中,不仅要求他们掌握结果表格中的关键数据,还应掌握结果表格中各个数据项之间的关系,从而更加全面地掌握分析工具的使用。基于这一思路,我们决定组织教师撰写《数据分析方法及应用——基于SPSS和EXCEL环境》教材,通过此教材把数据分析处理的基本方法介绍给希望从事定量研究的学生和研究者,以促使他们在数据分析过程中少犯研究方法方面的错误,同时也把我们的教学理念渗透到新教材之中。
全书共分6章,第1章数据统计分析的概念由邬彤副教授负责;第2章数据梳理与统计描述由姚自明老师负责;第3章数据的差异显著性检验、第4章数据的相关性与回归分析、第5章数据的降维和聚类分析、第6章信度与效度的检验由马秀麟副教授负责。另外,湖北文理学院的王敏老师负责了全书的文字校对、案例验证。最后,全书由马秀麟负责统稿和审定。
本书主要面向需要借助数据分析手段开展定量研究的本科生和硕士研究生,通过对本书6章的学习和训练,读者不仅能够准确地掌握数据分析的常见方法,而且能够规范读者的定量研究流程和定量研究方法,提升其定量研究水平。本书的参考学时为48~64学时,建议采用理论与实践相结合的教学模式,以讲授课时与学生上机实践课时等额分配的方式组织教学活动,并在期末预留时间组织学生开展综合性定量研究项目的交流与分析。各模块的学时可参考下面的学时分配表。
学时分配表
本书的出版得益于多方面的帮助。首先,从事北京师范大学计算机基础课教学的全体同事的长期积累和经验是本书的坚实基础。其次,教育学、经济学、哲学、社会学和法学等专业的本科生和硕士生在开展实证性研究项目过程中对数据分析方法的热切需求,是我们撰写本书的重要动力。另外,在本书成书的过程中,得到了北京师范大学教育技术学院衷克定教授和计算机基础课教学指导委员会的大力支持,并听取了他们许多中肯的建议和批评。同时,人民邮电出版社的编辑对本书的出版给予了自始至终的关心和指导,并给出了很多中肯的意见,保证了图书的质量。在此,对他们表示衷心的感谢!
对于本书,虽然编者尽了很大的努力,尽量避免出现问题,然而由于诸多因素的制约,书中难免有疏漏错误之处,诚恳地请各位老师和同学批评指正。编者的E-mail:maxl@bnu.edu.cn。
马秀麟
于北师大科技楼
2015年2月