1 科研关系研究现状
1.1 科研关系网络构建研究现状
对于科研关系的分析与挖掘,国内外有大量的科技文献从科研主体的科研合作关系、文献的共词关系、引证关系、科研主体/科研内容的关联关系、科研主体与科研内容之间的关联关系展开研究,以下分别就这几方面的国内外研究现状进行归纳总结。
(1)科研合作分析研究现状。
在科研合作研究方面,美国学者Beaver D deB于1978年9月在《科学计量学》发表了《科学合作研究》的论文[1],首次对科学合作进行了全面的理论研究,通过科学论文合作的文献计量学方法论证了科学合作研究的客观存在。自从该文发表以来,国内外许多学者分别从国际科技合作与科研生产率的关系、科技合作的主体和收益、科技合作的社会关系和社会网络关系、政治和经济的变化对国际科技合作的影响、多国国际科技合作比较研究等方面对科技合作进行了研究[2]。国外学者如Glänzel W[3]、Newman M[4]、Miquel J F[5]等采用文献计量学及社会网络分析方法,以科学家个体合作、机构合作及国家合作为研究对象,分析了科研合作网络的结构及属性。国内学者如陈悦[6]、姜春林[7]等对管理科学领域作者合作率、合作作者年龄、合作地域分布等进行了计量研究;李亮[8]、刘则渊[9]介绍目前国际复杂网络分析方法及其在合作研究中的应用;赵焕芳[10]、侯海燕[11]、刘盛博[12]等采用信息可视化方法对科研合作网络进行可视化研究,从微观角度对科研个体及合作网络进行计量分析。
(2)共词分析研究现状。
共词分析也是文献计量学中常用的研究方法[13]。所谓共词,是指两个或更多的关键词在一篇文档中同时出现。其方法基础来源于观点——关键词的同现描述了文件中文档的内容,它通过描述文档集中词与词之间的关联与结合,更好地反映了概念之间的关系,从而可以揭示某一科技领域研究内容的内在相关性和学科领域的微观结构,通过网络分析还可以展示科技发展动态和趋势[14]。共词分析试图直接从文本内容中抽取科学技术主题和发现这些主题间的关系,而不是依赖于先前定义的科学技术研究主题。
共词分析最早被详细描述是在20世纪70年代中后期,在其发展过程中法国文献计量学家Callon M、Law J和Rip A等对该方法的研究起了关键性的作用[15]。目前,共词分析方法的主要研究内容集中在指标分析、聚类分析和数据可视化上。如Bauin S提出的包容性指标、临近性指标,Callon M提出的包容图、临近图[16],以及Law J提出的战略坐标图[17]。国内关于共词分析的研究发展迅速,相关文献较多,一方面从该方法的理论、过程、进展展开探讨[18][19][20][21],另一方面已经将该方法在生物、医药、教育、信息、情报领域进行广泛的应用[15][22][23][24][25][26]。
(3)引证分析研究现状。
在引证分析研究方面,苑彬成阐述了引证分析是利用各种数学统计学以及逻辑方法对科技期刊、论文、著作等各种分析对象的引用或被引用现象进行分析研究,以便揭示其数量特征和内在规律,达到评价预测科学发展趋势的目的[27]。引文索引和引证分析在20世纪以来得到越来越多的关注,其关注研究对象或热点集中在引证网络、自引与自引率、共引分析、影响因子等方面。国外学者如Davenport E将引证看作代表信赖的原型[28]。他们认为在虚拟环境中,引证实际上代表了引用者对被引用者的一种信赖,因此引证网络系统可以被看成信赖系统,引文索引则可以被看成一个推荐系统,推荐被引次数多的文章。Fang Y等将引证关系看成网格,这些网格对应的文献耦合与共引文献就是网格系统的基本结构[29]。Meister C等认为研究专利引证网络,可以分析出其中知识流动和技术扩散的路径[30][31][32]。Nerur S等人在期刊引证网络中分析了个别期刊在局部的相对影响力[33][34]。除此之外,还有学者专门研究引证网络的结构,有的侧重于挖掘其中的核心文章,有的侧重于进行网络结构的解析,还有的侧重于研究拓扑结构的动态变化及进化。国内学者如柳泉波引入了Google的PageRank算法研究引证网格[35],熊春茹、武夷山对自引的原则、不当自引的控制等问题进行了探讨[36][37][38]。王建芳、耿海英等概括地介绍了共引分析的起源、分类、发展及国外的应用等诸多方面[23][24]。
(4)关联分析研究现状。
关联分析包括技术关联分析、作者关联分析、机构关联分析、地区关联分析等,它通过对反映文献主题内容的词进行关联性或相异性定量分析,来研究文献内在联系和科学结构的一种方法,其基本出发点是[40]:①科学研究的热点是由一系列在内容上密切相关的研究课题和概念组成的,这些热点是众多科学研究人员注意和跟踪的对象。②热衷或从事于某一科学热点研究的科学家,无论其社会和知识背景如何,在很大程度上对于同一研究课题和概念所使用的词汇是基本一样的。在关联分析研究方面,以美国乔治亚理工学院和我国北京理工大学朱东华教授的研究为代表[40],该种分析方法已经在国外的文献分析软件Vantage-Point[41]和Thomson Data Analyzer[42]中广泛使用,但在国内的文献分析工具中并不常见。
另一种关联关系的研究方法——多元统计分析中的对应分析法,将样本信息与变量信息统一起来进行样本与变量的关联性分析,可以看作关联分析的一种特例。将该方法在文献计量学中的应用最早为Dore J C的文章[43],以及科学计量学中Bhattacharya S和Christophe J C的两篇文章[44][45]。作者在2008年将对应分析与文本挖掘结合起来开展了科研主体与技术关键词之间的对应关系研究,之后便鲜有该方法用于科技文献分析的研究。