1.3 数字版权保护技术研发现状
1.3.1 数字权利登记注册
数字内容产业的发展,推动了数字版权管理模式和保护体系的变革,针对作品的全流程进行版权管理是当前发展的重点之一,而数字作品权利的登记注册又是全流程版权管理和保护的基础。
1.数字版权管理与服务
版权管理与服务的主要内容包括:版权贸易信息管理,如版权的许可使用信息、版权转让信息的收集、整理等;版权权利内容管理,如版权登记注册、版权数据存储与编目、版权合同登记、版权质押登记等;反盗版信息管理,如作品使用跟踪、盗版行为的证据记录、盗版作品信息披露等。这些任务的完成必须依靠版权管理与服务系统作为有力的支持。
美国版权局的CORDS系统则是版权管理与服务系统的成功代表。该系统开发始于1993年,宗旨是通过互联网实现数字作品的在线版权登记申请、注册与保存。该系统的工作机制大体如下:当接收版权登记申请人通过电子邮件寄送的电子申请表格后,版权局进行一系列记录与存储活动,如进行数字化签名的确认、编制跟踪记录并反馈给申请人,审查作品的版权性质及其他要求、给定有效登记日,给定登记号、打印版权确认证书,确定版权标识、进行作品编目、将记录输入版权数据库等。这样,其他网络用户就可通过版权局的版权数据库进行版权数据的检索。从这一系列过程可以看出,CORDS是一组管理系统与软件组件的集成,分别进行版权登记、注册、存储、信息处理、检索等功能的实现。
在我国,近年来也有很多版权管理与服务的系统或平台投入使用,但在提供的功能上还不够全面和完善。中国版权保护中心著作权登记管理信息系统于2009年3月正式启用,系统初步实现了著作权登记申请和登记业务办理的网络化。该系统具有在线填报、登记受理、审查、审批、发证、公告等功能。
2.数字资源唯一标识符的研发
数字资源的唯一标识符是互联网上重要的基础设施和名称管理机制,是实现目前互联网上数字版权管理应用系统互操作的关键之一。
目前,已经形成了一批应用在不同环境下的标识符方案。但是,很多标识符方案仅仅定义并形成了一个标识符名称空间及标识符构成机制,尚未构成一个完整的包含解析系统的标识符系统,如SICI、BICI、PII等。这类标识符详细定义了构成规则并由特定机构对其进行登记管理,但是在制定时并没有为其设计一套用于互联网环境的分布式的解析和管理机制,当前最为普遍和实用的标识符解析机制仍然是基于HTTP/DNS的。
由美国CNRI(Corporation for National Research Initiatives)建立的Handle System是互联网上比较成功的唯一标识符系统。近年来,我国已有若干机构对唯一标识符系统进行了深入研究,开展了基于Handle System的应用试验,并取得了实质性的研究成果和进展,在此基础上建立的系统已经在国内投入了实际应用。
1994年,美国出版商协议(American Associate of Publishing,AAP)成立了非盈利组织IDF(International DOI Foundation),在CNRI Handle System的基础上,专门研发了一种既能保护知识产权又能保障版权所有者商业利益的系统——数字对象标识符(Digital Object Identifier,DOI)。DOI系统由标号体制、元数据、解析系统和政策框架4部分组成。目前,DOI已经得到了广泛认可,大约90%以上的出版商都通过DOI注册机构Crossref使用了DOI。Elsevier、Blackwell、John Wiley、Springer、Science Direct、Web of Knowledge等大型出版商大多都使用了DOI系统。DOI已经广泛应用于期刊、学位、图书、科学数据等领域。实现了引文与全文的开放式链接,建立了不同信息资源之间的链接关系,使参与DOI系统的所有资源形成了一个有机整体,最大限度地保持了知识体系的完整。
北京万方数据股份有限公司联合中国科学技术信息研究所于2007年3月成为全球唯一的中文DOI注册机构(RA),其在Handle System基础上开发了中文DOI注册与服务系统,提供学术期刊论文和科学数据DOI注册、DOI元数据查询、DOI解析等方面的服务,该系统获得了2009年第三届中国数字出版博览会创新技术奖。截至2012年9月,中文DOI的注册数量超过190万,居全球所有RA中的第二位,已经为1500余种科技期刊提供了DOI注册、查询与解析服务。
1.3.2 多粒度授权技术
随着网络技术和阅读终端的发展,人们的阅读和消费习惯发生了变化,数字版权保护技术针对的内容粒度和销售形式更加丰富。数字内容作品除了传统的整体封装型销售模式外,还出现了超级分发、预览、试读等多种促销模式和按章节销售、按权利销售、按需印刷、多内容个性化组合、内容共享等多种内容服务模式。更进一步的是,在实际应用中,这些新的内容服务模式存在很大的潜在市场。用户可能更关心数字内容中的局部内容,或者只是想体验一下开头的部分内容再决定是否付费购买,内容提供者也可能希望为用户免费提供前面部分的数字内容以吸引更多的客户,或者对数字内容的不同部分提供不同的权限。例如,为了促进电子图书的销售,很多电子图书需要开放部分免费预览服务和允许分章节购买。一个用户可以先翻阅图书的第一章,再决定是否购买该书,还可以仅购买其中的第三章和第五章,并按章付费。此外,还可以根据用户的需求,为用户颁发多个数字内容的分段授权的数字许可证,实现定制化授权,方便用户购买多个数字内容作品的部分内容,为用户提供个性化服务。
现有数字版权保护的整体封装型授权模式无法对数字内容作品进行更细致的权限管理和使用控制。数字内容的服务需要更加易用的DRM技术支持,实现更加灵活的商业模式,可以根据用户的实际需求进行“按需授权”,支持超级分发等分发模式,兼容整体授权、分段授权、多硬件环境下的适应性授权等多种授权模式。然而,对于这样的需求,现在的技术厂商和运营商都是采用将电子图书拆分成几个文件分别控制的方式。但这样的拆分销售方式事实上破坏了电子图书作为一本具有独立版权的出版物的整体性,常常造成商业行为上的漏洞,带来版权方面的诉讼。因此,如何在保持电子图书完整性的情况下,实现电子图书的分段保护和分段付费,就成为一个影响到电子商务模式继续发展的重要问题。
1.3.3 硬件绑定技术
随着Kindle、iPad、智能手机等终端设备的日益丰富和广泛应用,针对不同设备的数字版权保护技术也越来越多。国内外相关企业开始关注数字内容作品与承载设备之间的绑定技术。这种技术旨在通过数字许可证将数字内容与承载设备或者额外的专用设备绑定,使得数字内容只能在特定的设备或者带有特定专用设备的机器上使用[4,9-11,13-19]。加密后的数字内容可以随意传播,数字许可证却只能为一台设备使用。
但是,硬件绑定技术引入了硬件适应性问题,即当用户升级系统、更换机器的一个或者几个相关硬件设备后,原先购买的数字内容就不能使用了。系统选定的用于绑定数字许可证的硬件设备统称为相关硬件设备。无论是用户升级数字内容使设备的软件系统或者硬件配置后原数字内容不能使用,还是非法用户通过设备软/硬件环境变更实现对版权内容的非法共享,这都是不合适的。
针对设备硬件部件变更引发的数字内容使用问题,Macromedia公司通过与版权服务器联系,重新获取许可证的方式来解决这个问题。WinXP则是通过保存原先硬件配置信息、比较新旧硬件配置信息的方式来解决这个问题。这两种方式部分解决了一定范围内硬件部件变更的自适应问题。但是,前者需要用户有良好的网络连接,并且需要对用户硬件配置信息进行跟踪,存在隐私问题[28],还会增加用户上网费用和服务器负担;而后者将原先硬件配置信息存在本地,新旧信息的比较点容易成为攻击点,存在安全隐患。
针对上述问题,北京大学计算机研究所的研究团队结合秘密共享方法和硬件绑定方法,提出了一种具备硬件适应性的数字内容与硬件绑定的方法[29]。可以根据部分硬件设备信息保持原有的加密机制。通过该方法,用户在购买数字内容并获得数字许可证后,可以变更许可申请设备的部分硬件而不会影响数字内容解密密钥的恢复和数字内容的使用,而非法复制到其他设备的数字内容及其许可信息,将会由于设备硬件配置差别太大而无法使用,确保了版权的安全性。
对于多机授权的数字内容使用问题,关键在于提供一种局部共享机制,使得用户能够方便地在所拥有的多个同类或者不同类型的设备上使用受保护的数字内容,同时又需要保护数字内容的版权,使数字内容复制到其他用户的设备上无法使用。最初,人们采用一种简单的安全策略,允许用户在几个设备上下载购买的数字内容及使用权利以实现数字内容在多个设备上的使用[36],或者采用Rights Locker架构方式[31-32,36],将用户购买的所有数字内容及使用权利保存在中心服务器Rights Locker上,通过中心服务器的在线控制实现数字内容在不同设备上的使用。这两种方法都要求所有用户设备连接服务器下载数字内容和数字许可证,存在多台设备重复下载同一个数字内容及数字许可证的问题。随着移动终端的普及,这种共享策略已经不能满足用户的需求。目前,某些移动设备,如有些电子书阅读器不能直接上网,需要通过PC作为代理下载数字内容和数字许可证,较为烦琐。
为了避免多台设备重复下载同一个版权内容,Microsoft和Adobe公司通过将数字许可证与个人绑定、个人与多台计算设备绑定的方式,允许用户在一定数量的设备上共享受保护的数字内容33-35]。但是,这类共享只考虑一定范围内设备的增加问题,没有考虑设备的删除问题,共享的动态性差,无法满足用户更换授权设备的需要。针对该问题,IBM、Marlin、OMA、Philips等[37-40]引入了授权域Domain)架构,实现数字内容在多台设备上的共享与保护。授权域架构最早是由DVB联盟[41]提出的,其目的是为了便于组建安全的家庭网络。用户合法获得的数字内容可以在授权域内各设备间无缝流动,但域和域之间的内容传播有严格限制。目前,基于授权域的方法主要包括:基于域密钥共享、基于域成员信息共享。
基于域密钥共享的主要思想是令域内所有成员设备拥有一个共同的秘密——域密钥,通过域密钥将有版权的数字内容绑定到域,使得数字内容可以在域内的任何一台设备上使用,并通过域密钥的更新和管理实现域内设备的更换和域的更新。OMA DRM V2.0[38]正是采用了基于域密钥共享的方法来实现多设备内容共享与保护的。OMA DRM V2.0的密钥管理是基于域密钥来实现的,内容密钥与域密钥相绑定,域密钥与域成员设备的设备密钥相绑定。域成员设备获得许可证后,利用其设备密钥可以解密获得域密钥,进而利用该域密钥解密获得内容密钥,使用数字内容。域成员设备之间可以传输许可证,而不必连接RI(Rights Issuer)获得,这对设备与RI之间的连通性降低了要求。OMA DRM V2.0采用基于域密钥共享的方法可以有效实现数字内容共享,并能够实现设备的动态加入/离开,但设备变更时,域密钥也需要更新。对于设备变更频繁的授权域来说,域密钥更新操作将占据较大的开销。
基于OMA DRM V2.0架构,有人[40,42]提出了将域管理与权限管理相分离,引入域管理器(Domain Management,DM)负责域管理事务,为RI减轻了负担。有人[43]在OMA DRM V2.0的基础上,提出了新的ROAP协议,该协议支持新颖的电话支付功能。该协议引入了一个Network Operator,移动电话通过Network Operator请求RO,获取付费信息,用户确认支付后由Network Operator生成电话账单并执行电话支付。支付成功后由Network Operator获取RO并返回给移动电话。该协议有助于域内的移动电话更加方便地使用数字内容。另外,针对注册协议发生频率低、RO获取协议及加入域协议发生频率高的状况,采用对称加密算法来替代高频协议中出现的非对称加密算法,提出了一种轻量级的密钥管理方法。
Carlos等人[44]也采用基于域密钥共享的方法实现多设备内容共享与保护,并撰文提出将移动电话作为身份设备,利用该身份设备将设备加入授权域,并需要满足物理接近原则,一定情况下可以避免陌生设备非法接入。另外,该文献中还提出了计数机制来限制设备的频繁变更,防止数字内容的无限扩散,加强了域的管理机制。
Ryoichi等人[45]在OMA、Marlin等DRM共享机制的基础上,结合域与基于上下文的访问控制策略,完善并加强了域的管理,给出一个多设备共享数字内容的版权保护模型,通过域许可证描述的上下文信息审核终端设备,决定该设备是否可以加入域并访问该域所拥有的数字内容。
基于域成员信息共享方法的主要思想是令域内设备共享域成员的相关信息,使得域内任何两台设备之间可以执行相互的身份认证,确认彼此为域成员,并进行安全的内容交换,从而实现数字内容在整个授权域内的共享。Wired等人[46]是这类方法的典型代表,其发表的文章也是目前引用率最高的内容共享与保护类文献之一。该文献中,域管理机制主要包括适应设备加入和适应设备离开。适应设备加入域时需要与域管理器进行相互的身份认证,即校验设备证书。认证成功后,域管理器为其分发其他所有域成员相关信息。如上所述,设备离开域时,撤销机制较为复杂,它依赖于撤销列表。撤销列表分为本地撤销列表和全局撤销列表,主动申请离开的设备或因丢失/损坏而离开的设备将被域管理器加入到本地撤销列表中,但被强制撤销的不安全设备则被授权机构加入到全局撤销列表中。更新后的全局撤销列表与数字内容相捆绑,由内容管理器引入到域中,提交给域管理器处理。域管理器将其中的有效部分合并到本地撤销列表中。只有不在撤销列表上的设备才可以相互执行内容交换。另外,设备变更时,所有在域的适应设备需要更新其存储的离域设备的相关设备信息。
Axel等人[47]提出为每台加入域的设备分发一个域证书,域证书中包含域信息、版本号及当前在域的成员设备信息,如设备ID。根据域证书,域成员设备之间可以执行身份认证,认证成功后进行内容交换,实现内容共享。设备变更时,域证书将会更新其中的在域成员设备信息并提升版本号,然后分发给各个域成员设备。如同域密钥更新,域成员信息更新也依赖于良好的网络连接,以便在设备加入或离开授权域时更新所有设备上保存的域成员信息,共享成员之间不具备独立性。但是,这对移动设备或离线设备带来了挑战。
基于授权域的多设备内容共享与保护方法在使用方面过于复杂。目前,不基于域的多设备内容共享一般通过将内容与智能卡相绑定[49]或将内容与用户证书相绑定[50]来实现。基于智能卡的方法往往限制了多台设备的同时使用,并且智能卡需要随身携带,具有一定的不便性。基于用户证书的方法,则要求每个授权用户申请并拥有一个数字证书,这也为用户带来了一定的不便性。而且数字证书机制相对复杂,因此往往存在效率低的问题。基于上述问题,北京大学计算机研究所的研究团队提出了基于遍历加密的多设备内容共享与保护方法[48],以满足版权的安全性、系统的灵活性和用户使用的方便性。
1.3.4 多种分发技术
互联网的发展使数字内容产业链发生了变化,交易与分发模式更加丰富,新颖的内容获取形式随着终端设备和传播渠道的变化层出不穷。目前,网络中典型的分发模式包括:B2B交易分发模式(如图书批发)和B2B二次分发模式(如图书馆馆际互借),B2C交易分发模式(如图书零售)和B2C二次分发模式(如批发图书的机构将批发得到的图书销售/出借/出租给消费者),C2C(Consumer to Consumer)分发和C2C二次分发模式(如用户将购买的图书赠送给其他用户)和超级分发等。其中以B2C交易分发、B2B交易分发、B2B交易分发融合B2C二次分发(简称B2B2C分发)和超级分发等模式最为常见。
与B2C交易分发不同的是,超级分发指的是用户之间通过邮件、P2P平台、蓝牙、记忆棒或者其他分发渠道传播诸如文字、音乐、视频、游戏或者软件等数字内容的一种多级分发方式。超级分发概念起源于软件保护领域。1990年,Ryoichi Mori和Masaji Kawahara首次提出了超级分发的概念和超级分发体系,他们指出“超级分发是一种软件分发方式,是一种在保护软件不被修改和未经授权的使用前提下,支持软件可以毫无限制地被自由分发的分发方式”[17]。1994年,Brad Cox将超级分发概念扩展到整个数字内容领域[18]。现有的DRM技术在支持数字内容超级分发内容交易与分发版权保护研究方面取得了一定的成果。B2C内容交易与分发版权保护技术是人们最先研究也是取得较好成果的内容交易与分发版权保护技术。现有的DRM技术在支持数字内容B2C交易分发方面已经有了比较完善的研究并开发了一系列应用系统,已经有了较好的应用,如微软的WMRM和DAS、Adobe Content Server、OMA DRM、北大方正的Apabi DRM等。
现有的DRM系统能够很好地支持数字内容的B2C分发,也能够支持超级分发。但它存在以下特点和不足:
(1)依赖于可信第三方。这种由可信第三方进行授权的方式,使得数字内容提供商/发行商必须完全信赖可信第三方(Trusted Third Party,TTP),提供商本身无法对计数进行审核,且必须通过TTP才能与销售商进行交易。而且,在实际应用中,一个高度可信的TTP必然对应一至多个内容提供商,而一个内容提供商的数字内容也可以由多个销售商进行分发销售,随着提供商的增多和并发用户的增加,TTP的负担就会加重,并很有可能成为系统的“瓶颈”。
(2)超级分发版权保护的灵活性不够。超级分发有益于用户分享与获取数字内容的授权,提高DRM系统的易用性。现有DRM系统虽然能够为数字内容的超级分发提供一定的支持,如Microsoft Digital Asset Server、Adobe Content Server、RealNetworks HelixDRM、InterTrust Rights System、OMA DRM等,但这些DRM系统都是以整个数字内容作品为单位来支持超级分发的。而针对P2P等网络的内容下载,当传输节点发生问题、用户无法获得完整作品时,现有的超级分发方案均不能提供有效的版权保护。因此,需要给出一种机制,使得用户在超级分发模式下,即便只获得部分数字内容,也可以获得该数字内容的授权和完整的数字内容文件。
(3)二次分发指的是用户购置的数字内容及其授权在不同设备、不同用户之间的转移,是数字内容使用权的转移。其难点在于如何确保权利的有效转移,确保源用户暂时或永久丧失已转移的数字内容使用权,目标用户暂时或永久拥有相应的数字内容使用权利。
对于B2B内容交易与分发模式下的版权保护问题,在电子图书领域,NetLibrary[50,51]和OverDrive[52]采用基于Web的数字图书馆模式来实现电子图书从提供商到图书馆的B2B交易分发,图书馆购买的电子图书并未真正交给图书馆,读者必须通过由NetLibrary/OverDrive管理的数字图书馆系统借阅本馆的电子图书。因此,并未真正实现B2B授权,其后续的B2C采用的是传统的B2C分发模式,而非B2C二次分发,不支持授权的转移,不能满足不同数字图书馆的不同需求,不利于数字内容批发模式的开展。Apabi DRM在一定程度上实现了批量分发授权和二次分发授权,并取得了不错的应用效果。但是还需要进行系统化的研究和提升,特别是在批量分发授权流程、动态权利信息的安全存储和保护等方面需要进行进一步的研究。此外,目前还未见有DRM系统支持的数字内容B2B二次分发技术。
对于C2C二次分发模式下的版权保护问题,有人[53,54,22,21]从纯软件角度进行了详细的研究并得到了一定的结果[53,54,23]。通过在客户端引入DRM服务中心的方式来实现二次分发。这种方式只涉及分发者和接收者,不需要第三方参与。但是,该方式增加了客户端程序的复杂性和运行负担,同时这种在用户本地处理二次分发、生成对等许可证的方式对PC等通用设备存在安全隐患。而且,不存在任何机制来跟踪用户在转让数字内容后的行为,用户可以通过硬盘克隆等方式,恢复已转移的数字内容及其许可证并可以再次进行转让。
还有人[22]利用内容发行商(CD)和数字水印技术实现二次分发。这种方式只能在发现盗版后进行验证,不能防止盗版,且在每次二次分发中,用户都要向CD发送数字内容副本,CD要对数字内容进行插入水印、公钥加密等处理,服务器负担重、花费时间长。更主要的是,在源用户转让数字内容后,虽然不能再次转让该数字内容,但仍可以使用该数字内容,而且只能通过CD从用户本地的数字内容副本中提取交易标识水印信息的方式来发现这种盗版行为,难度较大。
O.Sibert等人[21]提出,通过可信第三方,利用激励机制,在P2P网络上实现数字内容的二次分发和传播,通过提高Peers(按照协议分发)的积极性来减少盗版。事实上,这不是一种C2C二次分发解决方法,而是一种商业模式,是一种让用户参与分发销售并分享收益的行为,需要用户自觉遵守分发规则,对用户获取数字内容后的行为没有任何约束,用户可以随意共享获得的数字内容及其密钥。
所有这些均无法实现权利的真正转移,无法保证原购买者在内容所有权转移后不能再使用相应的数字内容了。就纯软件的DRM而言,是不可能完全解决用户通过硬盘克隆方式恢复PC上已转移数字内容的非法行为的。但是,可以给出一定的机制,跟踪并发现用户在转让数字内容后的非法恢复行为,防止用户再次分发已转移的数字内容,并能采取一定的措施隔离非法设备。而现有的二次分发版权管理机制均缺少有效的跟踪检测机制。数字内容所有权的转移问题,是DRM技术中的一大难点问题,权利转移问题的关键在于权利的监控和跟踪上。
权利管理系统[30]提到,通过在客户端安装可信计算模块(Trust Platform Module,TPM),并依赖可信的授权中心(Licensing Organisation,LO)对数字内容提供商和设备制造商进行授权,实现了数字内容及其权利由内容使用者分发到其他内容使用者的C2C二次分发模型。该方法的缺点在于:
(1)依赖合法设备及其TPM,实现存在一定的难度。
(2)对于非法用户的追踪效率低且时效性差,需要耗费数字内容提供商的大量计算资源。
Dhamija R.等人[31]还提出了一种不依赖安全硬件的二次分发方法,版权安全性由数字内容提供商的中央服务器控制,移动Agent用于供服务器向客户端传送内容密钥密文和权利信息。为了防止移动Agent遭受攻击从而泄露内容密钥,可以使用在一定时间段内具有抗攻击能力的黑盒(Time Limited Blackbox)机制来实现移动Agent。该方法的缺点在于,二次分发的安全性依赖于可信服务器,服务器维护授权状态,开销很大。
现有的DRM技术在支持数字内容B2C交易分发模式方面已经取得了比较多的研究成果并开发了一系列的应用系统。但在支持数字内容的超级分发、B2B交易分发、B2C二次分发与权利转移,以及C2C二次分发等方面存在不足。因此,针对上述内容交易与分发版权保护研究现状,以及新的应用环境,还存在如下关键问题亟待解决:
(1)数字内容超级分发版权保护技术。它支持超级分发模式下对数字内容的整体保护与细粒度保护,实现对数字内容的安全传输、动态授权与授权使用,并实现对多硬件环境下适应性授权的支持。
(2)数字内容批量分发版权保护技术。它实现对数字内容作品的批量授权,以及批量授权的验证、解析、管理与保护,确保批量数字内容作品购买方能得到所购买的数字内容作品及其权限,并能根据权限进行二次分发。
(3)数字内容二次分发版权保护技术。它实现对数字内容作品权利的有效转移。
1.3.5 富媒体内容版权保护技术
数字内容作品向移动化和富媒体化发展已逐渐成为趋势。富媒体是由文字、图片、音视频、Flash、显示样式、超级链接、Applet应用程序等多种类型的媒体资源组合而成的新一代复合媒体形式。目前,富媒体已经开始大量出现在数字报刊、广告等平面媒体形式中。数字化的富媒体资源很容易遭到非法复制和扩散,为了保护发布富媒体内容资源的版权不受侵犯,需要对富媒体内容版权保护技术进行研究。
富媒体概念自2000年被提出之后,开始只使用在广告领域,在2005年之后,由于各大门户网站的加入,使得富媒体真正大规模应用到非广告领域,越来越成为重要的、新型的媒体形式。随着富媒体内容数据的快速增长,富媒体的版权问题日益凸显,亟待解决。
1.富媒体内容加密封装技术
在数字图像加密算法方面,研究比较广泛的有基于混沌系统的图像加密算法。混沌是非线性动力系统中出现的一种确定性的类随机过程,具有遍历性、混合性、确定性,以及对初始条件和控制系数的敏感性等特点,这使得混沌系统很适合于数据的加密。另一方面,高维混沌映射也很适合对图像进行置乱。基于这一原理,主要研究有基于广义Baker映射、三维Cat映射和标准映射提出的未压缩图像的加密算法。国内学者也对该领域进行了广泛而深入的研究,采用了广义映射、类标准映射、Henon映射、Lorenz系统、混沌掩盖和单向耦合映射格子等多种混沌映射和技术实现图像的快速加密。
在多媒体加密算法方面,由于MPEG系列标准是目前流行的视频编码标准,针对MPEG系列标准的快速加密算法被广泛研究,包括DCT系数选择加密、移动向量和预测模式的加密,以及系数置乱等加密方法研究。尽管多媒体加密技术与传统加密技术的目的都是保护数据的安全性,但两者在研究对象、研究方法和研究重点上均有所不同。传统加密技术的研究对象是普通的二进制数据,它通过设计并组合基本的加密运算来构造加密算法。传统的加密算法不关心数据本身的结构和含义,而着重研究算法的效率和安全性。多媒体加密技术的研究对象则是视觉或听觉上可感知的图像、视频或音频,它利用多媒体的特性,调用传统加密算法对多媒体对象的部分数据或结构进行加密。多媒体加密技术假定传统加密算法本身是安全的,着重研究如何根据多媒体的特性来选择被加密的数据和结构,并保证加密后的多媒体对象从视觉感知的角度是安全的。
2.富媒体权利描述
数字权利描述语言(Digital Rights Expression Language)为数字版权管理提供特定词汇供版权拥有人及著作权人使用,可以限定提供的内容及使用者使用的方式。常见的权利描述语言有ODRL、XrML等。
Lanella在2000年提出ODRL这个开放性的权利描述语言。ODRL目前由十多个团体共同研发,同时也是W3C所认可的国际标准。ODRL目前被许多在澳洲及欧洲的学院、数字图书馆使用,也有商业的应用。2003年时被纳入成为W3C的标准,2005年又被NISO纳入成为NISO标准。ODRL是一种以XML为基础的语言,它提供了数字权利描述语言与资料字典和数字权利管理表达语义,适合所有形态的数字内容作品。ODRL是设计给各类工业使用的,保留了延伸性,并提供互通性的机制,可以免费自由取用,并没有版权上的要求。ODRL主要目的在于提供数字资源发行、散布、消费时,描述其灵活性,并建立跨平台、互通的数据共享机制。
XrML(Extensible Rights Markup Language)是由ContentGuard公司提出的一种版权描述语言,专门用来描述数字内容版权及版权使用限制的XML语言,为目前使用最多的数字版权描述语法标准,主要目的在于提供一个国际通用的方式,来达到指定版权、使用条件与保护内容的目的。XrML可应用于各种模式上的各种数字化资源,包括数字形态的内容、线上服务或应用程序等,可针对不同对象提供多种授权方式及限定各种使用限制,并使用数字签名技术,让收到版权描述文档的数字内容使用者无法私自窜改版权描述文档内容。
3.标识符嵌入与检测技术
在标识符嵌入与检测技术方面,目前主要的研究集中在图像、音频、视频方面。
(1)二值图像即黑白图像,其每个像素点只用一位表示,“0”代表黑,“1”代表白,这个特点决定了任意修改像素值是不可行的。在嵌入水印时,不能像灰度图像和彩色图像中那样孤立地考虑一个像素点,而必须考虑该像素邻域情况,否则会引起视觉异常。与灰度图像和彩色图像相比,二值图像的视觉冗余少,水印技术重点考虑视觉上的隐蔽性问题。水印技术的嵌入容量与鲁棒性是一对矛盾。鲁棒性越强嵌入容量越小,鲁棒性越弱嵌入容量越大,增强技术的鲁棒性会以牺牲隐藏容量作为代价。因此,需在鲁棒性与嵌入容量之间寻求一种平衡,根据应用需求不同对鲁棒性与嵌入容量做不同的侧重。
二值图像水印算法可按嵌入原理的不同分为行移或字移、基于图像分块的水印算法、变换域水印算法等几类。其中,分块嵌入的二值图像水印算法是一种较为典型的水印算法,由于其算法简单、嵌入容量大,相对于其他算法而言具有更强的实用性。在变换域水印算法方面,变换域嵌入水印信息,再返回到空间域后,为了确保图像的二值性,需进行二值化处理,通常会大大削弱水印强度,甚至会除去水印信息,因此,不能通过简单地修改变换域上系数来嵌入水印。
(2)数字音频水印技术就是在不影响原始音频质量的条件下向其嵌入具有特定意义且易于提取信息的过程。根据应用目的不同,被嵌入的信息可以是版权标识符、作品序列号、文字(如艺术家和歌曲的名字),甚至是一个小的图像或一小段音频等。数字音频水印算法需要具备透明性、安全性、鲁棒性。目前,比较成熟的音频数字水印技术有低比特位替代法、回声隐藏方法、相位编码方法、扩展频谱方法、量化索引调制法和压缩域方法等。
(3)数字视频水印技术大都是从水印的嵌入、提取角度出发进行研究的。一般来说,按水印嵌入域分类可将视频水印划分为非压缩域视频水印和压缩域视频水印两类。
第一类嵌入方案是直接将水印信息嵌入到原始视频中,形成含水印的原始视频信息,然后进行MPEG视频编码。其优点是可以利用某些现有的静止图像水印算法,且不影响现有MPEG编/解码器的使用。这种方法的最大优点就是可以抵御编码方式变换时的攻击;其缺点是嵌入水印需要对视频进行全解全编,大大增加了水印算法的时间复杂度。在非压缩域的视频水印算法中,原始视频序列被看作一个连续的视频帧,各种成熟的图像水印技术直接应用于视频帧当中。Hartung等借鉴扩频通信的基本思想,提出了在未压缩视频序列中嵌入水印的算法,将视频信号看作一维信号,水印信息经过扩频调制后,变成伪随机序列,采用加法将该伪随机序列嵌入到视频信号上。Pik-Wah Chan等提出了一种新的基于场景的视频水印算法,该方法也是直接对未压缩的视频序列做DWT变换,然后利用小波系数的大小关系嵌入不同场景的水印信息中。
第二类嵌入方案是直接将水印信息嵌入到MPEG压缩码流中,其最大的优点在于无须完全解码和再编码过程,因此对视频信号造成的影响较小。但视频系统对视频压缩码率的约束将限制水印的嵌入信息量,同时可能对运动补偿环路造成影响,为抵消这一影响采取的措施明显增加了该算法的复杂度。Hartung等人利用扩频思想在MPEG-2压缩视频流中嵌入水印,对MPEG-2视频流进行部分解码,得到每一帧图像的DCT系数,然后选择其中不会增加视频比特率的系数进行修改。用这种方法得到的视频码率在4~12Mb/s之间,适用于DVD和数字电视广播技术。Adnan MAlattar等人提出了一种鲁棒的低比特率视频水印算法,把水印信号嵌入到MPEG-4 ASP压缩视频流中。水印信号由原始消息信号和一个同步模板组成,经直接序列扩频调制后,嵌入到I帧和P帧的AC系数中,嵌入强度由全局增益因子和局部增益因子控制,同时还利用漂移补偿和比特率控制算法,进一步减小水印对原始视频流的影响。该方法最后的视频比特率小于784kb/s。Jordan等通过修改MPEG-4编码流的运动矢量来隐藏信息,该方法使用一定的嵌入规则,选择运动矢量的不同分量,在运动估计的搜索范围内修改运动矢量的大小。MauroBarni等人利用MPEG-4基于对象压缩的特点,通过随机选择的宏块中DCT系数对之间的关系,在每个视频对象中嵌入水印。Gang Qiu等人提出了另一种H.264/AVC视频流上的等级视频水印算法,他们在每个I帧的AC系数中嵌入1bit鲁棒水印,在每个P帧的运动矢量上嵌入1bit的易损水印,所提出的水印框架既能用于版权保护,又能用于内容认证。