数字出版与数字图书馆
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4.1 仓储管理系统

这些系统自2000年开始陆续出现,当然还不能完全实现所设想的全部特色功能。区分这些系统主要从功能的类别,模型所支持的信息对象的类型和结构的开放程度等方面来判断。

仓储管理系统是数字图书馆管理系统的雏形。它在一定程度上是可以进行配置的,但其可配置程度存在差别。大多数系统在安装之后,系统的管理者只拥有设限的管理权限,不能实现实质性扩展。

绿宝石数字图书馆开源软件(Greenstone)由Walkato大学的新西兰数字图书馆项目与联合国教科文组织合作开发与发行。系统开发的目的是提供标准的检索和浏览功能来简化数字化馆藏的建设和展示。

DSpace是麻省理工图书馆和惠普实验室共同研发的仓储系统,旨在成为一个面向研究机构的开源数字仓储软件。DSpace信息空间的组织旨在反映研究机构的典型结构,例如,某一群体建立了一个DSpace仓储,每个DSpace可以对应一个实验室、研究中心或者一个部门。馆藏是相关内容的聚合,每项馆藏内容都由条目组成,这些条目也是仓储的基本组成元素。DSpace的第一个版本于2002年12月发布,至2010年6月,其最新版本是DSpace1.6.2。它简单高效,被广泛使用并赢得了肯定,但灵活性不足,只适于在特定的范围内使用。

灵活的可扩展的数字对象存储架构 (Flexible Extensible Digital Object Repository Architecture,Fedora)最初是1997年由美国国防高级研究项目署和美国国家科学基金会共同资助的关于复合数字对象模型的研究项目,主要目标就是解决灵活性的问题。2001年康奈尔大学和弗吉尼亚大学基于Fedora数字对象和仓储框架开发了第一个数字对象仓储管理系统,并于2003发布了开源软件系统Fedora。Fedora仓储系统具有强大的灵活性和可扩展性,可以对文本、音频、视频、数据、数据集等多种数据类型进行处理,适用于多种应用场景,能够满足不同层次的需求。Fedora 是一个三层结构的系统,最上层Web 服务层,中间层是内部服务层,底层是存储层。Fedora中,每一条数据都被视为一个数据对象,它包括数字内容、表示数字内容的元数据以及分发数字内容的软件工具或服务链接。Fedora3.1及后续版本中提出的内容模型框架(Content Model Architecture,CMA)概念是其重要的组成部分,相对于旧版本对数字内容的管理方式有了重要改进,如更加简单灵活及可扩展,符合现实中管理数字内容的模式及高效地交流知识产品。

2009年5月,DSpace和Fedora联合建立DuraSpace,目标是引领全球的开源技术。DuraSpace继续发展Fedora和DSpace这两个重要的仓储平台,也提供新技术和服务来应对Web动态环境,满足用户的新需求。2011年11月,DuraSpace推出托管云服务DuraCloud,这是第一个横跨多个云服务提供商的托管云服务。客户能够使用一个或多个云存储提供商,并且仍然能够通过一个Web界面管理所有内容,既能降低成本,又能保存内容,还能保证内容的可访问性。DuraCloud的功能主要包括:①使用一个统一的接口来复制和同步横跨多个云服务提供商的内容;②访问嵌入在 DuraCloud 平台中的一系列应用程序来更好地利用数据;③分布和分流数据到任何一个互联网设备;④安全存储数字档案,定期对内容进行健康检查,确保信息保存完好;⑤使用一个简单易用又功能强大的控制台来管理云上的所有内容;⑥一个致力于开发持续发展技术的开源社区,为简化向云的过渡提供支持。

OpenDLib是第一批专门面向仓储系统的管理系统之一,由意大利国家研究委员会开发,目标是满足人们对常规用途软件的迫切需求。OpenDLib的目标明确:①提供基本服务,支持提交、描述、索引、查询、浏览、检索、访问、保存和信息对象的可视化;②提供其他特定服务,比如,信息对象的访问政策的实施等;③支持PNP扩充,系统的各个方面能够随着时间推移有所发展(比如服务、支持的元数据格式、面向的用户群体等方面)。OpenDLib支持的信息对象模型很强大,很灵活,能够代表结构化的、多语的多媒体对象,能够根据内容进行定制。OpenDLib还引入了虚拟馆藏的概念,即图书馆借助计算机系统收集、组织、整理后可为本馆提供检索服务的、只有使用权而无所有权的网络信息资源的总和。每个馆藏都有自身的访问政策,并可动态更新。除了服务最终用户外,OpenDLib也支持数字图书馆的管理人员保存对象、进行对象检查、处理用户和用户群体的文档、部署和管理分布式服务器的服务。这些都是OpenDLib 的创新之处。

Mopseus是一个基于Fedora系统的数字图书馆服务项目。易于安装、配置和使用,可满足小型图书馆的各种需求。Mopseus不使用外部数据库或者外部技术,它支持数字对象使用多种元数据模式。Mopseus强调利用创新服务和元数据实施战略规范(Preservation Metadata Implementation Strategies,PREMIS)标准来保存数字资源。Mopseus的主要优点是可以通过Fedora-commons实现最小化定制和开发工作。

实际上,自从数字图书馆开始研发和使用,数字环境就提供了创新的可能,这在传统图书馆领域是无法预想的。数字图书馆可能成为科学产出周期中的重要工具,不仅包括信息检索,也包括信息的分析以及新内容的生成、出版、传播和使用。早期践行这一观点的系统是在Scholnet 和Cyclades项目的框架之下研发的。两者都由欧盟第五框架计划提供资金支持。两个项目都旨在服务学者间的远程交流合作,拓展数字图书馆的功能。Scholnet旨在提供专项服务,使全球的多语社区能够很快获得、传播技术文件。Scholnet既能提供多媒体文件方面的传统服务,比如教程或者研讨会的视频,也能提供文件批注等新式服务。另外,Scholnet提供跨语言检索功能,用户可以用自己的语言提交问题,得到其他语言的检索结果。相反,Cyclades 是要实现开放、协作的虚拟文库服务环境,支持学者个人和学术团体的工作。它允许访问大型、异构、多学科、遵循OAI-PMH标准并在Web分布的文库。其功能设计更侧重个性化、支持协同工作,例如共享工作空间,包括用户自己的文件、馆藏、相关链接、文本标注和评定等。

数字图书馆管理系统的一个突出特点就是采用很多组件来建立数字图书馆。著名的实例有 DELOS 框架下开发的 Delos 数字图书馆管理系统(Delos Digital Library Management System,DelosDLMS),采用DELOS成员研发的各种数字图书馆服务整合成一个统一的工作体系,核心是要将独立个体结合在一起。另一著名实例是以5SL、5SGraph和5SGen为代表的一系列工具。5SL是一种基于XML的数字图书馆建模语言,表达特定领域内各类实体及其相互关系,以及对问题的抽象表述。5SGraph 是数字图书馆建模工具,能够帮助用户利用 5SL 快速建立自己的数字图书馆原型系统。5SGen能够半自动生成数字图书馆组件,实现5SL语言中描述的模型。

在数字图书馆需求快速增长和需求日益多样化的同时,数字图书馆管理系统的核心问题也越来越清晰了。人们现在一致认为资源共享是降低数字图书馆开发和运行成本的有效方法,不过,能够真正实现资源共享的数字图书馆系统还很少。