广州公共管理评论(第5辑)
上QQ阅读APP看书,第一时间看更新

理论前沿

透过推特看骚乱:大数据分析的方法论创新原文为Procter, Rob, Farida Vis, and Alex Voss. 2013. “Reading the Riots on Twitter:Methodological Innovation for the Analysis of Big Data.”International Journal of Social Research Methodology 16(3):197-214。

〔英〕罗伯·普罗克特 法丽达·维斯 亚历克斯·沃特罗伯·普罗克特,英国曼彻斯特市曼彻斯特大学曼彻斯特网络研究中心;法丽达·维斯,英国谢菲尔德市谢菲尔德大学信息学院;亚历克斯·沃特,英国圣安德鲁斯市圣安德鲁斯大学计算机学院。 沈本秋/译 彭铭刚/校


摘要:社交媒体的广泛应用,对社会学家来说可谓机遇与挑战并存。反映人们日常习惯、意见观点和行为特征的数据正以规模空前的形式向我们走来。这也意味着,我们在研究中不可能再依赖传统的分析方法和分析工具。本文是针对2011年8月英国发生骚乱期间出现的大量推文语料应用计算机辅助方法进行分析的一次实验。

关键词:大数据 社交媒介 计算社会科学 推特 危机传播

引言

网络在过去十年间的广泛应用,以及近年来的博客(如推特)等社交媒体和社交网站(如脸书)的爆炸式发展,对于社会研究人员而言,既是机遇,也是挑战。过去十年间,人们为开发更强大的研究方法、数字基础设施和研究工具进行了大量的投资,旨在解决新出现的、更为复杂的跨学科研究难题(Atkinson et al., 2009; Halfpenny and Procter, 2010; Halfpenny et al., 2009)。本文针对2011年8月英国骚乱期间出现的大量推文语料,应用大数据方法和工具进行研究分析的一次实验。

我们首先将综述近年来社交媒体在危情中发挥的作用。然后介绍我们自己开发出来的用于分析推文语料的方法和工具,同时通过我们的一些发现来阐述这些方法和工具的应用潜力。最后,我们将落脚于讨论本研究的局限性,并对我们处理这些局限性问题的措施进行一个概述,包括我们正在开发的,甚至可用来分析更大社交媒体语料库的基础设施。

危机传播与社交媒体

现在,不同的传播平台在危机情境中所扮演的不同角色已经是一个重要的研究领域,该研究领域的成长也反映了十年来传播技术形式的发展状况(Allan, 2006; Barsky, Trainor and Torres, 2006; Bruns, 2006; Bruns et al., 2012; Mendoza, Poblete and Castillo, 2010; Vis, 2009)。特尔沃尔(Thelwall)和斯图亚特(Stuart)(2007)通过对比2005年的三次危机事件,包括飓风卡特里娜等,考察了不同传播技术的反应——新兴的传播技术被认为在事件发展初期在分享信息和调查真相方面殊为重要,但是初期过后,主流媒体对于后续结局的报道则更胜一筹。

2011年8月暴发的英国骚乱肇始于8月6日发生在伦敦托特纳姆地区的一起孤立事件,然后迅速席卷伦敦,进而漫延至英国其他城市,演变成英国30多年来最为严重的打、砸、抢暴力事件。整个骚乱持续了五天。该事件被认为与多种因素有关(Lewis et al., 2011; Morrell et al., 2011),但是最令人惊讶的结果,确正如一些政客所声称的——社交媒体如推特起到了关键作用。

推特是2006年建立的一个微博网站,可以允许用户发表140个字符以内的信息(即“推文”)。最近有人估计,英国的推特用户达1000万。与社交媒体平台(如脸书)不同的是,推特的交友模式是单向、非相互式的。用户可以关注任何对象,但对方可以不必关注他们。当一个用户关注另一个用户时,后者的推文将出现于前者的“推文时间轴”。但是,并非只有互粉才能看到推文:推特默认其为一个开放平台,推文是公开的,可以通过推特的搜索工具找到。直接消息(DM)则例外,属于私聊内容,仅对接收该信息的关注者(粉丝)开放。用户可以通过在用户名前加“@”的形式在推文中提及其他用户。被提及的用户就可以在他们的“推文时间轴”上看到该条推文。通过点击“转推”键,或者复制原始推文并在文字前键入“RT”,用户就可以将该条推文转发给自己的粉丝。这样,推文便可以通过用户的粉丝网络进行传播。推特的一个重要举措是标签的使用,标签设置方法是在一串文字前键入“#”号。标签为用户提供了一个为推文添加主题标签的途径,这样他们就能在“推文时间轴”中共同创建一个动态结构,有利于信息的发现:任何人都可以通过搜索该标签看到其他人对该话题的意见表达。

表1 “骚乱清除”子语料库筛选的信息流

在后面的章节中,我们将详述我们已经开发出来的用于分析骚乱事件语料库的方法和分析工具。然后我们将通过案例研究,展示这些方法和工具相结合是如何使我们能做详细描述的,以及推特在骚乱发生时又是如何被使用的。最后我们将概括展望未来的一些工作领域。

方法

本推特语料库乃是由《卫报》及其合作伙伴遵循与推特签署的协议所提供的。取样范围为2011年8月6日13: 00至8月17日20: 00发出的公开推文。收作语料的推文的界定标准,是必须与报道骚乱事件的《卫报》记者团队拟定的54个话题标签相匹配。最终的语料库由260万条推文和70万个不同用户账号组成。该语料库中所有账号的用户信息同样系由推特提供。

我们在做语料库分析时出现了一些具有挑战性的问题。最为突出的问题是,其数量之大使得我们无法使用传统的媒体研究方法和工具进行分析。为了解决这一难题,我们首先尝试使用自然语言处理(NLP)技术;然而,通过实验,我们的结论是:这些方法尚不能达到人工解读推文内容的功能水准(Black et al., 2012)。

因此,我们采取的方法则是采用不那么复杂的计算机工具来揭示语料的底层结构,这使我们能够发现具有潜在重要性的片段。然后,利用既有的定性方法对这些片段进行分析。这个方法是以经典的两级流动传播模型为基础,突出显示信息如何从“意见领袖”向外流布(Katz and Lazarsfeld, 1955; Wu et al., 2011)。为了将该模型套用于语料库,我们建立了一个计算机工具,将原始推文及转发推文组成“信息流”(Lotan et al., 2011)。将信息流按大小(即转发数量)进行排列,这是确定其相对重要度的一个简单方法,对于决定后续的内容分析非常重要。

我们由语料库建立数据库,运用检索工具确定和提取信息流,以保证信息流的内容符合我们的既定标准,这与我们要分析的话题具有相关性。通过对不同组合的检索项的结果检查(标签有用,但是光标签还不够),我们能够确定假正例(不相关流),减少假负例(漏报,但为相关流)。此外还根据作者发表的推文数量、作者被提及次数及其粉丝数对作者进行排名。

为了解推特的使用情况,我们为推文内容(见附录)开发了一个代码框架(Krippendorff, 2004)对信息流进行分类(例如事件报道、报道评论、信息请求等),利用最后的分组情况来了解人们在特定话题背景下如何使用推特。对于了解推特用户面对谣言时的反应,信息流的来源是尤为有意思的部分。为此,我们开发了一个发文者类型代码框架(见附录),并以此对@500次以上的账号进行分类。

计算机工具及基础设施

要处理260万条推文及其相关的元数据,利用传统的电脑桌面工具是很难做到的。因此我们将数据集导入关联式资料库管理系统,使我们能快速查询。为了使研究人员易于获取数据集,我们利用持续集成工具Jenkins开发了一个虚拟研究环境(VRE)(Voss and Procter, 2009)以提供基于网络的用户界面和分析工作所需的运行能力,并管理其配置及输出文件。因此VRE对做过的所有分析提供了一个完整的起源记录。VRE用户界面见图1。

图1 VRE用户界面

每个类型的分析都会被翻译成一个脚本,该脚本从数据库向确切数据输出必要的SQL语句,并将其转化为人类可读的适当格式或者转化为只需利用简单的桌面工具就能进一步加工的格式。

VRE的主要功能是信息流分析,它能将转发的推文与源推文相匹配。这便要将每条转发内容与被确定为是源推文发送者的用户在此前所发出的每一条推文进行比较。比较的结果是一个相似性测度。为此我们采用了Levenshtein距离(俗称“编辑距离”——译注),它可以显示转发信息与候选的源推文的相似度。我们凭经验确定编辑距离为30是一个较好的取舍点,也就是说我们最多允许在原始信息与转发信息之间存在30个个体字符差异。这样做的目的,是要允许用户在转发一条推文时变动其内容,因为有时他们会加上自己的评论,但最后的转发内容连同属性仍然不超过140个字符。对于深入分析过的信息流,其匹配质量已经超过人工检查。

与在一个合理时间框架下由单一服务器执行的分析脚本相比,转发分析的计算成本是昂贵的,因为它涉及大量成对推文之间编辑距离的计算。为此我们在圣安德鲁斯大学STACC云端使用了16个实例(虚拟服务器)并提供运算资源。在这个资源水平上,该任务得以在一天之内完成。

代码框架

我们从制作表单开始,着手推文代码类型框架的开发,包括经信息流分析为显要话题的推文实例表列。代码框架开发人员先独立工作,然后互相对比结果。这样就使所有云都达成一致的类别。然后,这些初始代码框架通过一个进一步合并和细化的过程,便产生了最终的代码框架,其顶级分类有四项。

媒体报道。该类推文要么是由主流媒体账号发出,要么由从业于主流媒体机构的记者发出,是对新闻事件的报道。我们收入了其他指向主流媒体报道和提供新闻链接的账号发出的推文。新闻链接之所以重要是因为我们认为它可以衡量该推文的“可信度”。故我们将仅仅声称“我在独立电视新闻中看到”而未提供新闻链接的推文排除在外。

图片。它表现的是许多推特用户使用诸如twitpic之类的服务在他们的推文中上传和链接图片。我们认为这代表着一类信息,譬如,有别于媒体报道的信息,故应自成一类。

谣言。其编码是针对推文中对事件除提及确凿证据(支持性或挑战性证据)外还做出“宣称”或“驳斥”,但并未提供任何检视该信息的途径。有证据支持和没有证据支持的推文是有明显区别的。在该类别中,我们集中收入那些突出强调其属于“听说”的但是又未能提供链接的那类推文。同样,当他人“宣称”时可能会引发争议,但这种“驳斥”,如果没有提供链接,在此也将其视为“谣言”。最后,我们增加了一个编码给那些看似在呼吁更多信息的推文或一个看似对谣言做出反应的推文。

既有媒体报道类也有谣言类,我们就能够追踪最初作为“谣言”流传并受到主流媒体关注的新闻。这样一来,我们对此类信息的周期也能说出个子丑寅卯。由于推文既有账号信息又有时间标记,我们便可以更充分地了解谣言的生命周期。

反应。它是为用户对一般骚乱及对特定的骚乱相关的事件所做回应的编码。根据我们所见的子语料库,该类别包含不同的子类。而其他类别则为大多数子类共享,例如对抢劫的愤怒或要求查证信息。

开发一个整体性的推文类型代码框架有很多好处。首先,它不但能方便地适用于其他子语料库,还能更方便地应用于整个语料库。其次,这意味着绝大部分来自较小子语料库的资料有同样的可比性,因为我们编码了相同的三个顶级代码,主要关注媒体如何报道骚乱及主流媒体和非主流媒体在推特上的行事作风,以及普通推特用户如何讨论和散布这一新闻。

重要的是,编码框架已经过严格测试,可以操作,故而不仅适用于特定的推文子语料库,而且对于分析整个语料库也是有用的。为此,我们编码了不同子语料库的几个小节。在不同阶段测试个别编码框架时,很重要的一点是已确证编码员之间的信度是很高的。

为了测试编码框架,我们将其应用于两个子语料库,即伯明翰子语料库(所有推文匹配“伯明翰”一词,大小:50325)和BBM子语料库(所有推文匹配“配料库”一词,大小:13139)。由不同的编码员通读子语料库,确定大于25条推文的信息流,对其进行归纳性话题编码。然后我们利用这些结果开发和完善编码框架。

所有语料编码工作皆由两位编码员完成,若存异议,则交由第三位编码员研判。对于谣言语料库,编码员间吻合水平界于89%~96%。

发文者类型编码框架是专门用来确定语料库中不同发文者类型的。它是在罗坦等人(Lotan et al., 2011)开发的发文者类型编码基础上完善起来的。罗坦等人在突尼斯和埃及骚乱中注意到与推特使用有关的不同发文者类型。我们在本研究中采用了该编码框架,厘清了其中部分编码,并对其深入开拓,增加了我们认为重要的另外八个发文者类型。

推特的应用原理

考察人们如何借助社交媒体作为缓解危机压力的方式,这是近年网络研究的突出特点。在骚乱语料库中,这样的例子有数百个。为了检测得更详细,我们选择了一个最有说服力的例子,即用推特调动支持力量、组织“骚乱残骸清理”。表1是就该话题筛选的信息流。这些发文者中许多拥有数千粉丝(表1中显示的总数超过700万),他们的推文总计被转发31000多次。

虽然表1显示一些发文者没有完全严肃地对待“清除行动”,但该信息流反映出呼吁援助有关活动的信息(碰头地点、碰头时间等)、赞扬普通市民积极响应处理善后工作等。

我们为“骚乱残骸清除”语料库中靠前的200个账号归纳了类型,结果如图2所示。请注意该子语料库中发文者类型的分布与骚乱语料库中的分布的不同(Vis, 2012)。在后者中,以(按顺序)媒体组织、记者和骚乱账号为主;而在前者中,则主要是名人、英国推特达人、非(新闻)媒体雇员和骚乱账号。

图2 “骚乱残骸清除”子语料库中发文者类型

图3是以“骚乱残骸清除”为标签的推文时间轴。我们可以看到发文者和大量粉丝的介入对该主题的推文数量产生的影响:

图3 “骚乱残骸清除”子语料库时间轴。Y轴代表每隔1分钟的推文数量

(1)该子语料库的首条推文公开提出利用社交媒体组织“骚乱残骸清除”的想法。

(2)这个想法得到一个积极的文艺团体的响应。他们随后在自己的推特账号资料中以自己的名义提出组织骚乱残骸清除行动。

(3)一个专门开设用于协调“骚乱残骸清除”的账号发出首条推文,由此推文的数量开始增加。

(4)第一批有大量粉丝的发文者参与进来,推文数量达到显著水平。如表1所示,尽管按百分比来看,名人占比并不是非常突出(5%),然而他们的影响却是显而易见的。

推特谣言

谣言是与任何危机事件相伴而行的一个可以预见的特征,因此我们有兴趣分析其在社交媒体(如推特)上的出现和传播方式。其他一些研究是采用传染模型或模拟模型来分析谣言在社交媒体上的传播(例如:Kaigo, 2012; Leskovec, Backstrom and Kleinberg, 2009; Paranyushkin, 2012)。我们特别对不同发文者在谣言话语中所起的作用种类感兴趣,包括谣言展开后他们的“会话步骤”的种类。为此,我们利用推文类别编码框架为发文者会话步骤(即,宣称、驳斥等)的不同类型进行归类,及通过内容分析帮助决定话题。我们选择了七个与骚乱有关的谣言进行深入研究。

为阐述我们的发现,我们将以有关骚乱者攻击伯明翰儿童医院的谣言(见图4及表2)作为分析的例证。

图4 有关骚乱者攻击伯明翰儿童医院谣言的时间轴

注:Y轴代表每隔10分钟的推文数量。“-”代表支持谣言的推文,“-”代表质疑谣言的推文(“-”定义原文如此——译注)。

表2 从伯明翰儿童医院子语料库筛选的信息流

图4为始于8月8日的谣言时间轴,图中突出显示了一些重要的推文(1-7),我们将列在表2,并在下文进行详细的分析。

图4推文1-3以不同形式重复了最初的谣言,并由此产生了相当多的一批转发推文,尤其是推文3,这是该子语料库中最大的信息流来源。推文4-7是不同版本的辟谣,有的是参考目击者报道(4),有的为警察出现在医院附近时的报道(5),及其他报道(7)。

总的来看,在骚乱语料库中,该子语料库内很多推文是带有链接指向其他媒体的,例如手机图片(见图5a)、博客,还有一小部分其他媒体,如报纸网站。

图5 推文中提供的图片举例

我们通过将谣言子语料库信息流编码为“宣称”“驳斥”等制作数据集,利用这些数据集,《卫报》互动组为每个谣言的时间发展轨迹创建了动漫可视效果(见图6),展示“宣称” “驳斥”在谣言生命周期中的重心变化。

图6 儿童医院谣言时间轴动漫示意

注:图6(a)和(b)是从伯明翰儿童医院谣言时间轴的可视化动漫图截取而来,显示了支持谣言和质疑谣言的信息流。每个小圆圈代表一条推文,其大小反映了发文者的影响力(即粉丝数)。推文按其所属信息流分组。我们在本例中可以看到最初支持谣言的推文是呈怎样的一边倒形势(a),但是两小时后,质疑的推文就占据了多数。可视化图请见http://www.guardian.co.uk/uk/interactive/2011/dec/07/londonriots-twitter

讨论

在骚乱发生的随后一段时间内,一些政治人物和媒体评论员很快就对社交媒体包括推特等纷纷发声,批评其规模之大和散布之广。在社交媒体是否有被用来煽动非法活动这个问题上,答案必然是肯定的:这一罪责已被未审先判。然而,根据我们语料库中的现有证据,推特几乎是一边倒地被用在积极的方面,特别是在组织骚乱残骸清除这件事上。除此之外,我们还注意到警方在这种危机之中是拒绝关闭社交媒体网站这一提议的,理由是社交媒体是收集信息、公众告知和提供建议的宝贵工具。不过我们的研究确实能证实前人的研究结论(例如Crump, 2011):就是警察尚未掌握有效使用推特等社交媒体平台的窍门。

通过表2研究谣言在推特上的传播方式,我们可以用自己的发现来阐述这一点。伯明翰儿童医院的案例研究显示出我们所研究的七条谣言的共同规律或发展轨迹。

(1)一个谣言总是始于发表推文者声称发生了某事件。

(2)谣言被转发 [见图6(a)]。某种形式的证据,譬如目击报道,参考主流新闻源,图片链接(见图5),或网上的主流新闻源,等等,被添加在原始推文一起再转发出去,该谣言遂摇身一变成为各种版本纷纷登场。

(3)他人开始质疑其可信性(即开始“驳斥”),这种质疑或许是基于逻辑辩论(例如,“这是不可能的,因为……”),或是抛出新的信息来质疑谣言证据的可靠性。

(4)开始达成共识 [见图6(b)]。如果一致认为谣言为假,它有可能仍然会出现在语料库中,因为一些后来者仍会收到原始推文并加入转发者行列。

这些谣言的一个共同特征是主流媒体出现的时间落后于社交媒体上的大众资源报道(即所谓的“民间新闻”)。例如,在伯明翰儿童医院案例研究中(见表2), “驳斥”似乎一开始就受两方面的驱动:(a)源于貌似真实的目击者报道(……女友刚打完电话……),(b)对最初的“宣称”呼吁另一种符合逻辑的解释(……)。最后是主流媒体报道(6:伯明翰骚乱brmb电台和首席医疗官已经确认……)。这表明,由大量“制作人”共同努力可能比主流媒体更有竞争力,有时甚至更出色。同样,我们也注意到警方和其他应急服务机构在谣言早期阶段的缺位。例如,在伯明翰儿童医院的案例研究中,首条谣言传出24小时后才见到主流媒体在推特上发布来自当地警方的报告。

链接到其他媒体,如手机图片(见图5)、博客和在线报纸网址等作为佐证是所有七条谣言案例研究中的共同特征。然而,案例研究也表明不能轻信这种证据。例如,图5(b)中伦敦眼着火图片的真实性随后就受到质疑(见表3),有人宣称图片系伪造(被“PS”过),使人误认为是火光。

表3 宣称伦敦眼起火的图片为虚假的推文

如此看来,推特既是一个滋生谣言的温床,也提供了强大的自我修正机制(Mendoza et al., 2010; Sutton, Palen and Shklovski, 2008)。在审视这些案例研究中支持和否定谣言的信息流比例时,我们的发现与门多萨等人(Mendoza et al., 2010)的研究发现大体上是一致的。门多萨等人的研究指出,用户处理“真实”和“错误”谣言的方式是不同的:前者90%以上的时间都是受肯定的,而后者半数时间是被质疑的(即被诘问或否定)。虽然我们的发现不支持推特本质上有易受谣言影响的说法(Burns and Eltham, 2009),不过有一个案例研究的正是如何强化自我修正机制以达到更快辨识错误谣言的目的。

在这里我们不但能分析出哪些信息流具有显著意义及它们是如何传播的,也能清楚地知道原始推文是谁发出来的,这样就能够将分析水平提高到显示出某一些发文者,而忽略其他发文者的高度。然而,要分析推文内容、更好地了解部分发文者如何参与进去及如何与其他发文者搅和在一起,却还有更多的工作要做。虽然发文者被@的次数本身可以说明一些问题,但是要更好地解读这一数据,我们还需注意推文产生的背景以及这些发文者被@的方式。由于“@”本质上包括多种可能(来自原始推文,以加@的方式回复别人提及自己),因此对此做更详细的调查十分重要。例如,某些提及(@)可能凸显那些在报道中用推特用得很出色的媒体发文者,以及那些表现平平的。在研究中,我们发现这两种情况都存在。

我们注意到,将推特作为一项社会研究的资料来源,有着多方面的方法。首先,骚乱语料库的采集方法意味着我们必须允许抽样偏差这一可能性的存在,这可能会使我们的研究出现变形。研究中可能出现这样的情况,一些推文与我们的调查具有相关性,但是由于没有包含任何一个筛选推文所用的标签,却被排除在语料库之外了。其次,推特用户整体上而言并不能代表人口总数(Mislove et al., 2011)。总之,如何避免社交媒体资源的抽样偏差仍然是一个待解的难题(Omand, Bartlett and Miller, 2012)。

最后,至于使用推特煽动或组织骚乱,有一点与我们可能从骚乱语料库中得出的结论特别相关的,是我们的抽样范围排除了没有公开发表出来的那些直接消息(DM)。

结论和展望

我们在本文中展示了我们的方法在结合计算机工具和更多已有的内容分析方法时,是如何对巨大语料库进行详细分析的。计算机工具提供了揭示语料库中的有用结构的手段,帮助我们决定将人的专业知识摆放在什么位置——人的知识对语料库结构的深入解读和稳健分析至关重要。

然而我们也看到了我们方法的不足。特别是,我们应该借助不断进步的计算机技术来分析社交媒体,确保以最有效的方式来使用那些依赖于人类知识的方法。

第一,本研究的语料库与我们未来能收集到的语料库相比是很小的。因此,我们使用的基础设施必须是可扩展的,这样才能满足不断发展的计算机要求。我们现在正在扩建基础设施,使之可以配置于基于云的多种解决方案,例如亚马逊EC211或Eduserve12。这为我们提供了一个有弹性的可扩展空间,允许用户保持对其资料的完全掌控。

第二,近年更多基以NLP的技术进行的实验,鼓舞着我们在比捕捉到的信息流语义更为丰富的相似性概念基础上生成推文集群。这将有助于揭示大型语料库中更多有用的结构,以抵消不断增加的数据质疑。不过,基于NLP的技术,短期内其可靠性不大可能达到在使用中“无人监督”的水平。因此在由人工编码员进行注解的调查中,我们强调标签性能对于语料库代表性样本的重要性。同时要注意,微博中的不规则语法和非标准语言会给“代表性”的定义带来新的挑战。

第三,(与前一点有关)如果要在社会调查中妥善应用计算机工具,那么用户充分了解这些工具的优劣点及其工作方式至为重要。因此,社会研究人员接受计算机方法和计算机工具的基本概念培训也是极为重要的,这样能够决定何时及如何应用它们(Wing, 2008)。

第四,在力求更好地了解推特等平台面对危机时所起作用的同时,我们要记住,社交媒体只是属于一个大得多也复杂得多的媒体和信息生态的一部分,必须承认它们之间的相互关系。

第五,可以肯定,警察、应急服务机构和政府机构还存在危机发生时如何有效使用推特等社交媒体平台的难题。虽然我们对推特谣言的分析表明,错误谣言是可以自我修正的,但是我们认为,公众信任的更为及时的消息来源更能维护公共安全。我们正与英国多个政府机构合作开发操作指南和政策建议,以化解这种挑战(Procter et al., 2013)。例如,可以借鉴“昆士兰警察服务媒体单元”处理谣言(Bruns et al., 2012)的成功经验。

参考文献

Allan, S.2006. Online News: Journalism and the Internet. Maidenhead: Open University Press.

Atkinson, M., Britton, D., DeRoure, D., Garnett, N., Geddes, N., Gurney, R., Trefethen, A. E. 2009. Century-of-information Research(CIR)-A Strategy for Research and Innovation in the Century of Information. Prometheus 27, 27-45.

Barsky, L., Trainor, J., and Torres, M. 2006. Disaster Realities in the Aftermath of Hurricane Katrina: Revisiting the Looting Myth. Natural Hazards Center Quick Response Report 84, 1-4.

Black, W. J., Procter, R., Gray, S., and Ananiadou, S. 2012. A Data and Analysis Resource for An Experiment in Text Mining A Collection of Micro-blogs on Apolitical Topic. Proceedings of the Eighth International Conference on Language Resources and Evaluation. Istanbul.

Bruns, A. 2006. Wikinews: The Next Generation of Online News? Scan Journal, 3(1). Retrieved from http://www.scan.net.au/scan/journal/display.php?journal_id=69. Bruns, A.(2008). Blogs, Wikipedia, Second Life, and Beyond: From Production Toprodusage. New York, NY: Peter Lang.

Bruns, A., Burgess, J., Crawford, K. and Shaw, F. 2012. #qldfloods and @QPSMedia: Crisis Communication on Twitter in the 2011 South East Queensland Floods. Brisbane: ARC Centre of Excellence for Creative Industries and Innovation. Available at mappingonlinepublics.net/2012/01/11/cci-report-on-qldfloods-and-qpsmedia-in-the-2011-floods/.

Burns, A. and Eltham, B. 2009. “Twitter Free Iran: An Evaluation of Twitter's Role Inpublic Diplomacy and Information Operations in Iran's 2009 Election Crisis. ”In Papandrea, F. and Armstrong, M.(Eds.)Record of the Communications Policy&Research Forum 2009. Network Insight Pty Ltd. Available at www.networkinsight.org/events/cprf09.html/group/6.

Crump, J. 2011. What Are the Police Doing on Twitter? Social Media, the Police and the Public. Policy and Internet 3, Article 7.

Halfpenny, P., and Procter, R. 2010. The E-Social Science Research Agenda. Philosophical Transactions of the Royal Society 368, 3761-3778.

Halfpenny, P., Procter, R., Lin, Y., and Voss, A. 2009. Developing the UK e-so-cialscience Research Programme. In N. Jankowski(Ed.), e-Research, Transformationin Scholarly Practice, 73-90. Abingdon: Routledge.

Kaigo, M. 2012. Social Media Usage During Disasters and Social Capital: Twitter and the Great East Japan Earthquake. Keio Communication Review 34, 19-35.

Katz, E., and Lazarsfeld, P. F. 1955. Personal Influence. Glencoe, IL: Free Press.

Krippendorff, K. 2004. Content Analysis: An Introduction to Its Methodology(2nded.). Thousand Oaks, CA: Sage.

Leskovec, J., Backstrom, L., and Kleinberg, J. 2009. Meme-tracking and the Dynamics of the News Cycle. In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Paris(pp. 497-506). New York, NY: ACM Press.

Lewis, P., Newburn, T., Taylor, M., Mcgillivray, C., Greenhill, A., Frayman, H., and Procter, R. 2011. Reading the Riots: Investigating England's Summer of Disorder. Retrieved from http://www.guardian.co.uk/uk/series/reading-the-riots.

Lotan, G., Graeff, E., Ananny, M., Gaffney, D., Pearce, I, and Boyd, D. 2011. The Revolutions Were Tweeted: Information Flows During the 2011 Tunisian and Egyptian Revolutions. International Journal of Communication(5)Feature: 1375-1405.

Mendoza, M., Poblete, B. and Castillo, C. 2010. Twitter under Crisis: Can We Trust What We RT? In 1st Workshop on Social Media Analytics(SOMA 10). Washington, D. C. :ACM Press.

Mislove, A., Lehman, S., Yong-Yeol, A., Jukka-Pekka, O., and Rosenquist, N. J.2011. Understanding the Demographics of Twitter Users. Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media, Barcelonapp. International Journal of Social Research Methodology 211, 554-557.

Morrell, G., Scott, S., McNeish, D., and Webster, S. 2011. The August Riots in England: Understanding the Involvement of Young People. National Survey Research Centre. Retrieved from www.natcen.ac.uk/study/the-august-riots-in-england.

Navarro, G. 2001. A Guided Tour to Approximate String Matching. ACM Computing Surveys 33, 31-88.

Omand, D., Bartlett, J., and Miller, C. 2012. #INTELLIGENCE. Demos, London. Retrieved from www.demos.co.uk/publications/intelligence.

Paranyushkin, D. 2012. Informational Epidemics and Synchronized Viral Contagion in Social Networks. Nodus Labs. Retrieved from http://noduslabs.com/publications/text-polysingularity-network-analysis.pdf.

Procter, R., Crump, J., Karstedt, S., Voss, A., and Cantijoch, M. 2013.“Reading Theriots: What Were the Police Doing on Twitter? ”Policing and Society Specialissue on Policing and Cybercrime.

Sutton, J., Palen, L., and Shklovski, I. 2008. Backchannels on the Front Lines: Emergent Uses of Social Media in the 2007 Southern California Wildfires. In Proceedings of the 5th International ISCRAM Conference. Washington, DC: ISCRAM.

Thelwall, M., and Stuart, D. 2007. “RUOK? Blogging Communication Technologies During Crises. ”Journal of Computer Mediated Communication 12, 523-548.

Twitter. 2011. One Hundred Million Voices. Twitter Blog. Retrieved from blog. twitter.com/2011/09/one-hundred-million-voices.html.

Vis, F. 2009. Wikinews Reporting of Hurricane Katrina. In S. Allan & E. Thorsen(Eds.), Citizen Journalism: Global Perspectives(pp. 65-74). New York, NY: Peter Lang.

Vis, F. 2012. Reading the Riots on Twitter: Who Tweeted the Riots? Retrieved from Researching Socialmedia.org/2012/01/24/reading-the-riots-on-twitter-who-tweeted-the-riots/.

Voss, A., and Procter, R. 2009. Virtual Research Environments in Scholarly Work and Communications. Library Hi Tech Journal, Special Issue on Virtual Research Environments 27, 174-190.

Weaver, M. 2010. Iran's Twitter Revolution was Exaggerated, Say Editor, Guardian. Retrieved from www.guardian.co.uk/world/2010/jun/09/iran-twitter-revolution-protests.

Wing, J. 2008. “Computational Thinking and Thinking about Computing. ”Philosophical Transactions of the Royal Society 366, 3717-3725.

Wu, S., Hofman, J. M., Mason, W. A., and Watts, D. J. 2011. Who Says What Towhom on Twitter. In Proceedings of the 20th International Conference on World Wide Web Conference, Hyderabad(pp. 705-714). New York, NY: ACM Press.

责任编辑:彭铭刚