云环境下的文件档案可信性保障
上QQ阅读APP看书,第一时间看更新

数字文件的真实性

——基于行业实践的调查

科琳·罗杰斯科琳·罗杰斯(Corinne Rogers),美国人,博士,InterPARES Trust国际研究项目总协调人,加拿大不列颠哥伦比亚大学兼职教授。主要研究兴趣为数字文件的真实性、信息伦理以及数字取证在档案实践中的应用。

张淑霞 聂曼影译者:张淑霞,任职于国家档案局档案科学技术研究所;聂曼影,任职于国家档案局档案科学技术研究所。

引言

预计未来十年数字信息将以每年40%的速度增长,企业和政府纷纷制定相关战略,充分利用数字信息的多样化带来的机会(Turner et al. , 2014)。云计算带来了显著的规模经济,且云用户无须掌控设备和技术,因而机构正在快速或至少正在考虑将现有的计算机实践(包括数字文件存储和管理)移到云端。目前云计算仅占机构IT总支出的5%,但这个数字还在增长。据国际数据公司(IDC)国际数据公司(IDC),是全球著名的信息技术、电信行业和消费技术市场的知识提供商。的数据称,传统数字资源有了新技术基础设施的支撑之后,我们正在进入“第三平台”时代,即“由移动设备访问、利用大数据并且基于云的下一代计算平台”的时代。虽然并非所有数字信息都需要或会被保存,但那些值得保存的数据和文件应如何在多样化和快速发展的技术环境中建立和保护其真实性呢?

2014年国际数据公司的报告指出,机遇的最大化需要IT机构采取一些必要措施,但是,“真正向数据驱动或软件定义的机构转变”这一措施需全员参与,而不仅限于IT机构(Turner et al. , 2014)。文件领域应该对这一预测感到很高兴。毕竟,公共机构和私营机构的许多数字资源在我们领域内是作为文件和数据而形成、捕获、管理和保存的,这些文件和数据是业务决策的基础,也是集体与社会记忆的基础。我们的职业道德规范让我们遵从文件档案管理的原则,如问责制、完整性、合规性、可获得性、透明度、真实性、安全性、保存、保护、利用、隐私和信任 [Association of Canadian Archivists(加拿大档案工作者协会), 1999; Society of American Archivists(美国档案工作者协会), 2011; ARMA International(美国文件档案管理者协会ARMA International曾被译为“美国文件管理者协会”。), 2014]。

无论文件被存储在何种介质上,文件长期保存的可信性(即可证明文件与其来源一致、可靠和准确)是档案工作的核心。长期保存不仅是指安全存储,还涵盖了保存中所有的工具、技术、政策和程序,确保目标材料不受时间和技术变革影响仍能可信、可访问和可使用。这需要包括档案工作者、文件管理者以及IT专业人员在内的跨学科团队的合作和共同努力。在数字世界,真实性是难以捉摸的,但仍然吸引我们持久关注。

尽管数字世界中85%的数据是由机构生成和负责的,但2014年的国际数据公司报告中并未提及这些数据的真实性、可信性、可靠性或完整性问题。这些特性似乎被归入了其他方面,如安全和隐私要求、使用移动设备和应对其快速增长(及增长中产生的数据)的能力以及(跨境和跨地区)查询数据的能力。此外,安全预算的分配情况也表明,机构在预防数据泄露及未授权访问上投入的资金远远超过了用于安全破坏响应的资金(EMC Corporation, 2013)。并且,如果发生安全破坏事件,机构优先考虑的是恢复服务,而这往往是以牺牲有助于调查的痕迹证据为代价的(Endicott-Popovsky, Frincke and Taylor, 2007)。正如大卫·温伯格(David Weinberger)常被引用的那句名言所说,如果透明度是新的客观性,那么安全就是新的真实性。

档案工作者和文件管理者对隐私、访问和安全领域的专业研究可能与信息技术部门对数据的关注有所重叠。然而,双方之间通常能够进行对话,却很少形成合作。虽然机构仍认为文件和数据的可信性是文件工作者的责任范围,但安全的重要地位往往使他们将信息技术置于文件档案管理之前。由于企业在系统实施上高度依赖信息技术,并且十分关注对业务有较大驱动力的信息数据分析,文件档案工作者的影响力往往被掩盖或削弱(Richards, 2014)。

本研究对文件工作者展开调查,了解他们在实践中是如何确保和评估其所负责的文件、记录和数据的真实性。该调查不仅限于云中文件和数据的管理问题,事实上,大多数受访者主要工作在“第二平台”,即基于局域网/互联网和C/S架构的分布式平台(EMC Corporation, 2013)。2013年,数字世界中仅有不到20%的数据在云中存储或处理,但到2020年,预计这一数字将翻一番。了解了在当前企业服务架构中如何评估和保护数字文件和数据的真实性,就更容易理解文件工作者当前在云平台所面临的挑战。如果企业和政府所依靠的信息和数据日益来自第三方、移动设备和传感器,真实性将继续成为一个关键问题。

1.真实性问题

大多数人直观地将真实性理解为真实的品质,但很少有人能够准确地确认需要什么来确保、评估和保证真实性。真实性,即文件保持其应有面貌的性质,历来被认为源自文件的形成环境(如可知的话)、保存方式和地点。例如文件中的签名表明作者同意了文件的内容,并对其中所记录的事务进行了认证。证人或加签人的签名进一步验证了文件的真实性。必要时,可以就文件质问签名者和加签人,而他们的证词也可以作为真实性的保证。这种真实性的确定是基于观察和证词的。

这种解释,虽然应用起来难度大,但理解起来十分简易,是档案学理论、文书学理论和法律理论的根本,并已被编写入文件档案管理标准。档案学中文件的真实性“是指文件本身的可信度,即文件保持其应有面貌的品质,并且未被篡改或破坏”(InterPARES Glossary)。《布莱克法律词典》(Black's Law Dictionary)将“authenticity”(此处的“真实性”,在英文中为“authenticity”)定义为:“真正的;真的;具有原件的性质和权威;被恰当地赋予了一切必要的手续和合法的证明;胜任、可信和可靠的证据。”美国档案工作者协会将“authenticity”定义为:“真正的、没有被伪造、篡改的品质,通常从内部和外部的证据,包括其物理特征、结构、内容和背景来推断。”该定义通过测试文件的物理和形式特征来验证文件的真实性,将文件的真实性与文件的生成者密切联系起来。文件的真实性并非一定意味着文件内容的可靠性(Duranti, 1998; Pearce-Moses, 2005)。最后,我们看国际文件档案管理标准ISO 15489中真实性的概念。


一份具有真实性的文件应符合下列条件:

•文件与其制文目的相符;

•文件的形成和发送与其既定的形成者和发送者相吻合;

•文件的形成或发送与其既定时间一致(International Organization for Standardization,国际标准化组织)。


在普通法体系中,书证必须经过认证才能被法庭采纳。防伪认证过程中建立的真实性,已通过法令和普通法编写入我们的法律体系。书证的认证通过证人证词、专家分析、非专家意见来确定,或者如果书证本身是公文或其他特殊类型的文件也可以,另外还能根据文件的形成和保存环境来确定文件的真实性。联邦证据法,http://www.law.cornell.edu/rules/fre。

这些对真实性的判断在很大程度上基于文件的外观,这种启发式的判断方式已经形成了几个世纪,至今仍在采用,但往往被错误地应用于数字文件。2011年,在与数字文件取证项目的律师、数字取证专家和文件管理者的访谈中,法律界的一位受访者回答了关于如何确定文件真实性的问题:“通过对文件的观察就能判断。”(Rogers, 2011)

真实性也与背景有关,其含义与不同的学科有关(Lauriault et al. , 2007),最近有一些文献探讨了这一观点(MacNeil and Mak, 2007; Duncan, 2009; Mak, 2012)。这些探讨在根本上都将真实性作为一种社会建构的产物,依赖于真实性得以定义和解释。如果我们认同数字资源随着时间的推移在其形成、使用、迁移、保存和访问过程中“处于不断变化的状态”,那么它们的真实性也是如此(MacNeil and Mak, 2007)。在这两种情况下,问题的关键仍然是如何在给定的背景下定义和评估构成真实性的必要要素。

文件工作者对数字文件的性质及其属性进行了大量研究,可能有助于判断文件的真实性。然而,目前评估真实性的手段仍未有任何可量化的措施。而财务、政府、卫生、关键基础设施和社会网络等领域的测量越来越依赖于复杂且相互依存的(尽管不一定是互操作的)综合分布式网络系统,对可量化的评估有迫切的需求。

众所周知,数字技术为记录型材料带来了诸多好处,也提出了诸多挑战。数字技术使得记录更易于生成、搜索、访问和共享,但同时数字资源也存在易被篡改、完整性缺失难以或无法被察觉、所有权和作者身份难以确定以及知识产权难以执行等问题。云计算的出现更是加剧了以上问题,尤其是带来了第三方数字资源管理的问题以及在全球范围内生成、存储和传输数字资源所引发的管辖权问题,而这仅仅是众多问题中的两例而已。

文件是在实践活动过程中形成或接收的、具有保存或参考价值的记录,是档案研究的原材料(Duranti, 1993; Eastwood, 1994; Duranti and Michetti, 2015)。在数字环境中,信息管理领域的研究者认为文件的真实性是文件必备的特性之一,必须在数字保存活动中确保文件的真实性(连同可持续性、可访问性和可理解性),不受时间和技术变革的影响,并将真实性的概念由档案学理论界定的狭义“文件”扩大到所有类型的记录、数据和数字对象。

档案学和文书学帮助档案工作者理解传统文件的真实性。具有真实性的文件可以确认其身份,并可通过不间断的保管链来证明其完整性。文书学认为,所有文件都可以通过普遍适用和去情境化的正式要素系统进行分析、理解和评估(Duranti, 1998)。InterPARES项目(电子系统中文件真实性永久保障国际合作研究项目的第一阶段和第二阶段)在数字文件研究中采用了文书学理论框架,并成功定义了保存链:“一种贯穿整个文件生命周期的控制系统,当有任何操作影响文件存储的描述方式或利用的呈现形式时,也能确保文件的身份和完整性”(InterPARES Glossary)。保存链的概念扩展了隐含在保管链概念中的控制,以解决数字文件易受损、易丢失的特性。数字文件的真实性要求形成于电子文件真实性推定的基准要求、电子文件真实副本制作的基准要求(Duranti, 2005b)以及文件生成和保存者指南(Creator and Preserver Guidelines)的基础之上(Duranti and Preston, 2008)。

数字文书学非常适合分析档案学定义的数字文件的真实性,但是档案学中的“文件”是一个精确但范围狭窄的定义,当分析主题扩大到其他不满足“文件”定义的数字对象时,这种分析作用是有限的。档案工作者正在与数字取证专业人员开展合作研究,以发展和拓宽数字文书学在数字保存领域的适用性,并重点关注真实性、可靠性和准确性(MacNeil and Gilliland-Swetland, 2005; Duranti & Endicott-Popovsky, 2010)。

在传统环境中,如果一份文件被其生成者作为开展业务的依据,并且由其生成者或生成者的合法继承人维护在一个完整的保管链中,则可以推定这份文件具有真实性(Duranti, 1997; Eastwood, 1994)。作为档案保存的文件,是由文件联集成的文件聚合体的一部分,由于有其聚合体的生成和维护环境的证明,其真实性也可以得到认证,因此也被认为是可靠的、内容准确的。

但在数字环境中,不存在这种自动推定的真实性。传统的控制系统能确保文件的真实性,但数字技术打乱了保持真实性的传统系统和手段(MacNeil and Gilliland-Swetland, 2005; Lauriault et al. , 2007)。数字文件明显不同于纸质文件。在计算机中生成和存储的档案、文件和数据,即使在生成者的监护下也易变、易损,并易受到有意或无意的篡改、污染或破坏。它们的作者、来源或保管链可能难以确定或不可能确定,它们可以被轻易传输、共享和复制,它们的可访问性受硬件和软件更新的影响,还可能会受不兼容性的限制。即使生成者在业务过程中依赖于某份数字文件,并努力保证其保管链完整,数字文件的脆弱性和易损性仍需要生成者采取相关措施来保护文件的真实性。此外,可靠性和准确性不再与真实性直接相关,并可能一起或分别受损(Duranti and MacNeil, 1997; Duranti, 2005a; MacNeil and Gilliland-Swetland, 2005; Duranti and Thibodeau, 2006)。

本研究是数字文件及数据真实性概念和实践研究项目的一部分,于2014年3月3日至5月1日期间展开在线调查。调查旨在收集相关信息,了解文件、信息或系统专业人员如何确保、评估和/或保护数字文件的真实性;使用或依赖什么样的元数据;以及认为什么样的真实性指标重要;等等。该调查通过英语国家的主要档案和文件管理领域的邮件联络表进行发布。

本研究基于以下假设进行:尽管有关项目已经针对长期保存中的真实性进行了大规模的、有意义的研究,并且产生了一定的影响力,但这些项目的理论成果并没有在文件工作者的实践中得到一致应用。调查中探讨了这一假设的正确性。文件工作者在实践中是如何保持文件真实性的?这一广泛性的问题激发了本研究的开展,本研究对数字文件和数据真实性的概念进行了质询,对文件工作者如何解释、确保和评估真实性进行了调查。

该调查包括17个问题,旨在了解文件工作者对文件真实性的看法,调查其相关的工作实践。调查首先询问了受访者的个人情况,包括其工作/职位以及他们工作的部门、年龄、受教育程度和学科专业。后续问题主要关注受访者的职业责任、用来确保真实性的手段、为保证真实性通常应用或依赖的元数据,以及是否曾被要求在法律或行政诉讼中正式证明文件的真实性。如果受访者曾有过此类经历,那么他们认为哪些指标在这些法律或行政诉讼证明中是最重要的,他们所在的机构是否在其政策工具中对真实性进行了明确界定。这项调查旨在探索实践与研究假设之间的关系,即文件工作者在工作中依赖什么样的文件,文件的性质是否与档案学的角度认定的真实性指标相符。该调查还对真实性的任务和指标进行了“社会”类和“技术”类的区分。


社会任务是将文件或数字对象作为概念进行的任务,而真实性的社会指标是由机构开发的支持文件生成、管理或保存的工具(例如,分类方案、保管和处置以及政策和程序文件)。这些工具是基于领域知识的,并按照特定人(文件档案工作者、管理层、法律顾问等)的意图制造和实施的。并非所有的机构都有这些工具;如果机构有这样的工具,那么对工具的应用可能是自愿的,也可能是强制性的;但即使是强制性的,也可能在实践中被机构规避或调整。这些工具包括档案和文件管理实践中的基础工具,如政策工具、分类方案或归档方案、保管和处置期限表以及档案著录或其他著录方式(可以捕获的各种描述性元数据)。


技术任务将文件视为逻辑对象,涉及保存/管理、监控/安全维护、文件系统设计等方面。技术指标并非任意创建的,它们是文件工作过程或状态变化的结果(如系统元数据捕获日期的形成和修改),由整个文件系统(如校验和审计日志)的技术组件(如计算机、网络)按照算法生成或实施,用来管理和控制系统的访问和安全;或由第三方制定,用做技术系统的规范(例如关于软件的记录)。技术指标可以用于控制文件,但更侧重于控制存有文件的系统。技术指标包括审计日志、访问控制和安全措施、加密验证技术、系统元数据和技术文档(IT用语,即technical documentation)。研究通过一系列有序的、李克特式(Likertstyle)的问题对两类指标进行了探讨。此外还设有开放式问题,要求受访者自行界定真实性,并提供他们认为最重要的指标。

2.初步调查结果

调查共收到441份回复。其中,148份没有回答除个人信息之外的任何问题,因此被舍弃。剩余的293份回复中,参与者主要以档案工作者(45%)和文件或信息管理者(33%)为主,另外22%的受访者所属行业较为分散,包括信息专业人员(图书馆员和行政人员,占10%)、教育工作者(6%)和其他人员(6%)。来自信息和文化产业(包括图书馆、档案馆、广播和电信部门)以及政府部门的受访者最多(见图1)。本研究所采用的行业部门分类标准来自《北美行业分类系统体系·2012》(Statistics Canada, Standards Division, 2012)。

图1 受访者职业和行业分布(n=293)

这项调查在全球领域内展开,但收到的回复也局限在特定地区,其中大多数受访者来自北美洲(55%),其次是欧洲(15%)和英国(12%)(见图2)。

图2 各地区受访者所占比重

受访者需要回答一系列问题,以使调查方明确他们的工作职责,了解他们如何保证文件的真实性以及是否曾被要求证明文件的真实性。问题列表见本文附录A。

77%的受访者表示他们经常或十分频繁地进行文件或信息管理,67%的受访者经常进行信息检索,56%的受访者经常管理或设计元数据,51%的受访者经常设计信息或文件政策。安全或访问权限监控以及文件档案管理系统设计是最不常见的活动;35%的受访者表示从未或不经常进行安全或访问权限的监控;37%的受访者表示从未或很少设计文件档案管理系统。

调查还要求受访者根据其使用频率评估真实性的社会或技术指标,超过50%的受访者表示他们“大部分时间”或“一直”依赖于传统(社会性的)档案和文件管理工具,特别是文件档案管理政策(55%)和文件档案系统管理政策(60%)、文件系统说明(51%)、分类方案(61%)以及保管和处置期限表(51%)。53%的受访者使用了访问控制和安全措施,54%的受访者“大部分时间”或“一直”都在使用标准化元数据。但是,51%的受访者从来没有或很少依赖于工作过程中的审计日志,61%的人从来没有或很少使用加密验证技术。

在采用的各种加密技术中,数字签名是最不常用的。只有11%的受访者使用数字签名技术来确保真实性,61%的受访者从未使用过这种技术。只有5%的受访者曾被要求在法庭诉讼中证明文件的真实性,10%的受访者曾参与电子发现或法律冻结。70%的受访者从未被要求为任何目的(包括查阅或利用)证明他们所管理的文件的真实性。

调查进一步询问了受访者在被要求证明文件或数据的真实性时曾使用哪些指标,或如果遇上类似情况他们认为哪些指标是必要的。曾被要求证明真实性的受访者最常使用的指标是数字文件相关政策、关于访问控制的信息以及有关数字资源更改的信息。没有被要求证明过真实性的被访者则表示相信所有指标的价值。然而,调查仍在保存活动、标准化元数据的使用、信息变更记录、软件信息和加密技术的使用等方面发现了指标选择的较大差别(见图3)。

图3 真实性指标的比较(n=247)

调查要求受访者评估真实性指标的重要性(如果需要在法律或行政诉讼中提供真实性证明的情况下), 68%的受访者表示标准化的元数据非常或极其重要;66%的受访者表示加密验证技术非常或极其重要;76%的受访者表示审计日志非常或极其重要;88%的受访者认为访问控制或安全措施非常或极其重要。因此,尽管目前的实践还比较落后,验证真实性的技术手段是被认为与传统手段一样重要的。关于机构文件和信息政策,54%的受访者表示他们的机构没有定义数字资源的真实性;17%的人不知道他们的机构政策是否包含这样的定义。

调查最后的两个开放性问题,即你对数字文件真实性的定义是什么?你认为哪些指标对证明数字文件的真实性至关重要?需要受访者进行叙述性的回答。对受访者答复的初步分析表明实践中通常根据传统的社会启发方式对真实性进行评估。针对第一个问题,几位答复者指出,日常普通业务过程中产生的文件应该可以推定为真实的,以响应普通法中管理商业文件的法规和先例。大多数受访者认为完整性是建立真实性的手段,部分受访者表示,在文件被“固定”之后,就是说在文件被选择作为该文件所代表的行动的证据或因其长期参考的价值被保存到档案馆后,就必须坚持真实性。总体来说,这些答复呈现了保证真实性的务实性的方法,例如,一位受访者回答:


“文件”对于其用途来说是不是充分的?它能满足法官或裁定者的要求吗?无论我对该文件持何种说法,我可以用事实来支撑我的主张吗?真实的文件的基本定义应该是“该文件是否可以在需要真实文件的情况下被用做真实文件”,虽然这是一个选择疑问句,但实际上这并不是简单的“是”或“否”能回答的,而是一个范围的问题。我希望文件的真实性符合将来的使用要求。他们不必是最真实的,只要足够真实就好。


最后一个问题探讨了受访者对真实性的基本指标的看法。答案多关注保管链、文件生成和管理控制、关于文件访问和确保来源信息方面的政策、文件生成者和生成背景的元数据的添加或捕获。部分受访者指出了加密验证技术的重要性,部分受访者专门说明了安全和访问控制的至关重要性,其中一位受访者特别指出了这些控制措施在基于公共云的电子邮件和文件共享使用中的重要性。

对调查数据的初步分析为文件真实性的进一步研究指明了方向,例如,探索文件真实性的社会与技术指标的重要性以及在司法或行政听证会上受到质疑时如何使用这些指标等。下一步计划对调查回复,尤其是对开放式问题的回复进行编码和分析,并对愿意提供更多信息的受访者展开半结构化访谈。本研究还将在不同环境下,特别是文件和数据得以生成、维护或保存的云计算背景下,对数字文件和数据真实性指标的适用性和权威性进行评估。随着越来越多的机构转向云服务提供商寻求业务支持,法院将持续面临越来越多的数字证据的挑战,有关数字文件真实性的研究将越来越重要。

3.局限性

基于网络的调查能快速接触到大范围人群,但也有其局限性,其中最主要的是无法保证受访者的典型性。即使使用行业邮件联络表(在这种情况下能够保证受访者有大致相同的目标、训练和责任),受访者也会对调查问题进行选择性回答。本调查中的所有受访者都是本研究的目标人群,但并非所有的目标人群在行业邮件联络表上,也无法保证所有的受访人群都能接触到这些邮件联络表。因此,调查结果的普遍性是局限的,其有效性也不能得以客观地衡量。但是,作为一般实践情况的反映,这样的调查是能够提供有用信息的。

4.结论

初步结果显示:受访者仍倾向于依赖传统的启发式的判断方式来确保文件的真实性,即使当被要求证明文件的真实性的时候,他们声称更信任技术手段。文件和信息专家即文件档案工作者是传统意义上保证文件档案安全、真实和可靠的值得信任的专业人员。随着复杂技术越来越多地影响到文件档案本身及其用户,文件档案工作者有必要信任信息技术工作者。可以说,原本被信任的文件档案工作者正在变成可信技术的用户——受托人变成了委托人。但是,每个学科都有其独特的知识,并且可以互补。文件档案工作者知道以文件和数据形式存在的信息哪些有价值且必须保存,而信息技术专业人员知道如何保护这些信息的安全。如果我们的文献遗产是民主和问责的根源,那么两种职业在真实性维护上的贡献都是有价值的。

参考文献

ARMA International.2014. “ARMA Generally Accepted Recordkeeping Principles. ”http://www.arma.org/r2/generally-accepted-br-recordkeeping-principles.

Association of Canadian Archivists.1999. “Code of Ethics: The Association of Canadian Archivists. ”http://archivists.ca/content/code-ethics.

Black's Law Dictionary. n. . d.2nd ed. . http://thelawdictionary.org/.

Duncan, C. .2009. “Authenticity or Bust. ”Archivaria, 68: 97-118.

Duranti, L.1993. “The Archival Body of Knowledge: Archival Theory, Method, and practice and Graduate and Continuing Education. ”Journal of Education for Library and Information Science, 34(1): 8-24. http://dx.doi.org/10.2307/40323707.

——.1997. “The Archival Bond. ”Archives and Museum Informatics, 11(3/4): 213-18. http://dx.doi.org/10.1023/A:1009025127463.

——.1998. Diplomatics: New Uses for an Old Science. Lanham, MD: Scarecrow Press.

——.2005a. “The Long-Term Preservation of Accurate and Authentic Digital Data: The InterPARES Project. ”Data Science Journal, 4: 106-118. http://dx.doi.org/10.2481/dsj.4.106.

——.2005b. The Long-Term Preservation of Authentic Electronic Records: Findings of the InterPARES Project. San Miniato: Archilab.

Duranti, L. , and B. Endicott-Popovsky.2010. “Digital Records Forensics: A New Science and Academic Program for Forensic Readiness. ”Journal of Digital Forensics, Security and Law, 5(2): 1-12.

Duranti, L. , and G. Michetti.2015. “The Archival Method: Rediscovering a Research Tradition. ”In Research in the Archival Multiverse, ed. Anne Gilliland, Sue McKemmish, and Andrew Lau. Melbourne, Australia: Monash Publishing.

Duranti, L. , and H. MacNeil.1997. “The Preservation of the Integrity of ElectronicRecords:An Overview of the UBC-MAS Research Project. ”Archivaria, 42(1): 46-67.

Duranti, L. , and K. Thibodeau.2006. “The Concept of Record in Interactive, Experiential and Dynamic Environments: The View of InterPARES. ”Archival Science, 6(1): 13-68. http://dx.doi.org/10.1007/s10502-006-9021-7.

Duranti, L. , and R. Preston.2008. “Research on Permanent Authentic Records in Electronic Systems(InterPARES)2: Experiential. Interactive and Dynamic Records. ”Padova:Associazione Nazionale Archivistica Italiana.

Eastwood, T. .1994. “What Is Archival Theory and Why Is It Important? ”Archivaria,37(1): 122-30.

EMC Corporation.2013. Leaders Edge: Highlights from CIO Summit 2013. Atlanta, GA:EMC Corporation. http://www.emc.com/microsites/cio/articles/cio-summit-2013/cio-summit-2013-atlanta.pdf.

Endicott-Popovsky, B. , D. A. Frincke, and C. Taylor.2007. “A Theoretical Framework for Organizational Network Forensic Readiness. ”Journal of Computers, 2(3): 1-11. http://dx.doi.org/10.4304/jcp.2.3.1-11.

——.2009. “From Digital Diplomatics to Digital Records Forensics. ”Archivaria, 68(2): 39-66.

International Organization for Standardization.2001. ISO-15489(2001)Information and Documentation-Records Management, No. ISO-15489(2001). http://www.iso.org/iso/catalogue_detail? csnumber=31908.

InterPARES Glossary. n. d. . InterPARES 2 Project: Terminology Database. http://interpares.org/ip2/ip2_terminology_db.cfm.

John, J. L.2012. “Digital Forensics and Preservation: Digital Preservation Coalition. ”http://www.dpconline.org/component/docman/doc_download/810-dpctw12-03pdf.

Kirschenbaum, M. G. , R. Ovenden, and G. Redwine.2010. Digital Forensics in Born Digital Cultural Heritage Collections. Washington, DC: Council on Library and Information Resources.

Lauriault, T. P. , B. L. Craig, D. R. F. Taylor, and P. L. Pulsifer.2007. “Today's Data Are Part of Tomorrow's Research: Archival Issues in the Sciences. ”Archivaria, 64(2):123-180.

MacNeil, H. , and A. Gilliland-Swetland.2005. “Authenticity Task Force Report. ”In The Long-Term Preservation of Authentic Electronic Records, ed. L. Duranti, 19-65. San Miniato, Italy: Archilab.

MacNeil, H. , and B. Mak.2007. “Constructions of Authenticity. ”Library Trends, 56(1): 26-52. http://dx.doi.org/10.1353/lib.2007.0054.

Mak, B. .2012. “On the Uses of Authenticity. ”Archivaria, 73: 1-17.

Pearce-Moses, R. .2005. “A Glossary of Archival and Records Terminology. ”http://www.archivists.org/glossary/.

Richards, L. .2014. Conversation with the Author. Washington, DC, 13 August.

Rogers, Corinne.2011. “Trust Me! I'm a Digital Record: Findings from the Digital Records Forensics Project. ”Presented at the Archives 360, Society of American Archivists, Chicago, IL, 27 August.

Society of American Archivists.2011. SAA Core Values Statement and Code of Ethics. http://www2.archivists.org/statements/saa-core-values-statement-and-code-ofethics.

Statistics Canada, Standards Division.2012. North American Industry Classification System(NAICS)Canada. Ottawa, ON: Statistics Canada. http://www.census.gov/eos/www/naics/.

——.1997. “The Archival Bond. ”Archives and Museum Informatics, 11(3/4): 213-218. http://dx.doi.org/10.1023/A:1009025127463.

Turner, V. , J. Gantz, D. Reinsel, and S. Minton.2014. “The Digital Universe of Opportunities: Rich Data and the Increasing Value of the Internet of Things, White Paperno. ”IDC 1672. Toronto: IDC Corporation. http://idcdocserv.com/1678.

附录A

调查问卷

1.下列跟数字文件 [如电子文件、电子图像、电子数据、电子数据集、数据库文件、电子存储的信息(ESI)、网页等] 有关的工作多久做一次?如果你是个体经营户或者已经退休,参考你认为最相关的工作或合同。(从不、很少、偶尔、经常、非常频繁)进行检索和存取:

•监控或加强安全/利用特权;

•监控或加强个人信息隐私权;

•监控或实施与档案保管法规政策的一致性;

•进行保存或保管;

•设计文件存储和管理系统;

•制定信息、文件政策;

•管理文件或信息;

•管理/设计元数据;

•其他。

2.当你生成或管理数字文件的时候,你多久依靠或采用下列措施保证它们的真实性?(从不、很少、偶尔、大部分情况、一直)

•针对文件系统管理的书面政策和程序;

•文件系统的技术文档(设计、操作、管理等);

•针对数字文件的书面政策和程序;

•用于生成和管理数字文件的软件信息;

•随着时间的推移对数字文件所做的改变信息(如迁移、标准化等);

•保存数字文件所采取措施的信息;

•分类方案或归档方案;

•保管和处置期限表;

•档案著录;

•访问控制/安全措施;

•审计日志加密校验技术(如数字签名、哈希摘要等);

•标准化的元数据。

3.你使用下列加密校验技术的频率?

•数字签名;

•可信时间戳;

•校验码;

•哈希摘要;

•安全传输。

4.你日常使用或管理什么元数据?请勾选出所有使用的元数据。

•一个元数据方案或指南(如都柏林核心元数据、保存元数据实施战略PREMIS、欧盟《电子文件管理通用要求》“MoReq”的既有译法,本译集不做修改,但其中的“records”应理解为“文件档案”。MoReq等),请列出:______;

•为你的机构定制的上述元数据方案的修改版,请描述:______;

•完全定制的元数据方案(元素设计不依赖于任何现存的元数据方案),请描述:______;

•仅使用由单位的办公软件或文件系统产生的元数据;

•不确定。

5.你曾被要求在下列任何情况下保证或检测电子文件的真实性吗?

•在法庭上或行政听证中提供证明;

•未决诉讼或行政行为(电子发现程序);

•为研究目的或答复查阅需求而提供数字文件副本的真实性;

•其他______;

•我从未被要求保证或检测电子文件的真实性。

6.当你被要求保证或检测电子文件的真实性时,下列各项在你评估过程中的重要程度如何?(完全不重要、非常不重要、比较重要、非常重要、极端重要)

•针对文件档案管理系统的书面政策或程序;

•文件系统的记录(设计、操作、管理等);

•针对数字文件的书面政策和程序;

•用于生成和管理数字文件的软件信息;

•随着时间的推移对数字文件所做的改变信息(如迁移、标准化等);

•保存数字文件所采取措施的信息;

•分类方案或归档方案;

•文件保管和处置期限表;

•档案著录;

•利用控制/安全措施;

•审计日志;

•加密校验技术(如数字签名、哈希摘要等);

•标准化的元数据。

7.如果你需要评估电子文件的真实性时,下列各项在你评估过程中的重要程度如何?(完全不重要、非常不重要、比较重要、非常重要、极端重要)

•针对文件档案管理系统的书面政策或程序;

•文件系统的说明文件(设计、操作、管理等);

•针对数字文件的书面政策和程序;

•用于生成和管理数字文件的软件信息;

•随着时间的推移对数字文件所做的变更信息(如迁移、标准化等);

•保存数字文件所采取措施的信息;

•分类方案或归档方案;

•保管和处置期限表;

•档案著录;

•访问控制/安全措施;

•审计日志;

•加密校验技术(如数字签名、哈希摘要等);

•标准化的元数据。

8.假如其他条件都是相同的,仅基于对存储条件的考虑,下列存储情况下你对文件的真实性有多少信心?(没有信心、有点信心、比较有信心、相当有信心、完全有信心)

•由文件生成机构存储在移动介质(如USB key、移动硬盘、光介质、磁介质)上的数字文件;

•由文件生成机构存储在独立的计算机上的数字文件;

•由文件生成机构存储在映射网络驱动或文件系统中的数字文件;

•由第三方云服务提供商维护的云存储中的数字文件;

•存储在档案馆的数字文件;

•在文件生成机关本地或异地保存的传统文件(如纸质文件、缩微胶片);

•存储在第三方(不是档案馆)的传统文件;

•存储在档案馆的传统文件。

9.你们机构的文件政策定义了数字文件的真实性吗?

•是;

•否;

•不清楚。

10.你对数字文件的真实性的定义是什么?

11.你认为哪些指标对证明数字文件的真实性是必要的?