➢ 什么是隐私计算
作为发展尚处早期的新兴技术,隐私计算刚刚从极小众的圈子跳出并走进大众视野,而因其技术流派的多样与复杂,隐私计算的命名也并未得到完全统一。除隐私计算外,Gartner用的是“隐私增强计算”,国内部分研究机构和企业也分别提出“隐私安全计算”“隐私保护计算”等名称,但其内含和范围殊途同归。目前国内产业界对“隐私计算”这一用法还是最为普遍认可的。
如上文提到,隐私计算技术是为了解决数据流通过程中的一些问题、确保数据“可用不可见”的一系列技术。因此,所谓“隐私计算”技术其实并不是一个特定技术,而是为了实现某些功能的一组技术的统称。从目的角度讲,隐私计算指借助多方安全计算、同态加密、零知识证明、差分隐私和可信执行环境等为代表的现代密码学和信息安全技术,在保证原始数据安全隐私性的同时,实现对数据的计算和分析的一类技术。从技术原理讲,隐私计算并不能简单归属于某一个学科领域,而是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系。隐私计算能够保证在满足数据隐私安全的基础上,实现数据价值的流通。
从学术定义角度来看,John J.Borking等学者在2001年就提出隐私计算(其称之为隐私增强技术)的概念。文章将隐私计算定义为融合多种信息通信技术的关联系统,该系统在保证不丧失原有功能的情况下,通过消除或减少个人数据直接流通、避免对个人数据进行非不必要或非意愿处理来保护隐私。
2002年,经济合作与发展组织(OECD)在《隐私增强技术研究报告》中指出,“隐私增强技术通常是指有助于保护个人隐私的各种技术。从提供匿名的工具到允许用户选择是否、何时以及在何种情况下披露个人信息的工具,隐私增强技术的使用有助于用户就隐私保护做出明智的选择。”
2015年,欧盟网络和信息安全局为提高隐私计算的灵活性和适应性,对隐私计算提出更广泛的定义,即隐私计算是指支持隐私或数据保护功能的技术集合。
2016年,李凤华等学者在国内首次提出了较完善的“隐私计算”学术定义——隐私计算是面向隐私信息全生命周期的计算理论和方法,是在隐私信息的所有权、管理权和使用权分离的前提下面向隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为性信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。隐私计算涵盖了信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。
这一概念并不容易理解,是一个更为广泛的学术定义。其涉及隐私信息的全生命周期,如图1-3所示。
图1-3 隐私数据的全生命周期
如果抛开上述学术定义,聚焦到对于隐私信息的处理与分析层面,那么可以给出更为简略的隐私计算概念。隐私计算是指在保护数据本身不对外泄露的前提下,实现数据分析计算的一类技术集合,主要分为可信硬件和密码学两大领域,包含多个代表性技术。