知识图谱:认知智能理论与实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5.4 知识图谱应用技术

中国的历史源远流长,不同时代有着不同的社会治理情景,古人留给我们许多珍贵的经验之谈。比如,在元杂剧《庞涓夜走马陵道》中,有一句非常有名的谚语“学成文武艺,货与帝王家”。如果将“文武艺”比作知识图谱所代表的知识,那么“货与帝王家”就是知识图谱的应用。知识图谱如果仅保存在图数据库而没有任何应用,那就如“深山隐士”一般,即使才高八斗、学贯中西,对社会和人类的价值也不大。同样的,知识图谱如果仅存在于图数据库或向量数据库中,其价值也未必有多大。在DIKW 模型中,正是知识的应用产生了智慧,它强调的是可执行的应用。“可执行”是价值的体现,知识图谱的可执行应用恰恰是解决“知识到哪去”的问题,即知识的去向,也就是价值的体现。这一点与哲学三大终极问题中的第三个问题殊途同归,即“我去向何方”及其所蕴含着的“我的人生价值在哪里”。

在图1-4 的技术体系中,知识的应用体现为两部分,一是知识图谱应用技术,二是用户接口与界面。前者是从知识图谱的视角来看待知识的应用技术,后者则是从业务或场景的视角来看待知识的应用方式。更重要的是,后者会组合运用前者来实现所需的功能,这是知识图谱价值最直接的体现。本节着重介绍应用技术,用户接口与界面将在1.5.5节中介绍。

回顾一下,《思考,快与慢》这本书将人类大脑分为直觉系统和理性系统,分别对应思维模式的快思考与慢思考。在知识图谱的应用中,也存在类似的理念。或许未来的认知智能恰恰是由类似的“快”与“慢”两种系统组合实现的,并且这两种系统互相关联、互相配合、融为一体。本书借鉴了这两个概念,将知识图谱的应用分为两类,分别是运算简单低能耗的快应用、运算复杂且需要较多计算资源和能耗的慢应用。

(1)快应用

快应用类似于人类大脑的直觉系统,特点是低能耗,反应迅速,直截了当,只能做简单工作。在知识图谱中,知识检索和知识探索是两种“快应用”技术。

知识检索是知识图谱与信息检索的交叉技术。在给定一个输入时,知识检索技术从知识存储系统中快速找到与之相同的或最类似的知识(实体或关系)。

知识探索则类似于大脑中的直接联想活动。通常来说,知识探索可以分为以下3种情况。

① 根据一个实体获取所有与该实体直接关联的关系。

② 根据实体和关系,获取关系另一端的实体。

③ 根据两个实体查找实体间的直接关系。

为了实现快的目标,快应用通常会在图数据库系统中建立索引,或者使用搜索引擎技术等。以图1-1所示的知识图谱为例,输入“月球”,通过图数据库查询快速找到“月球”实体,并返回该实体及相关的属性,就是知识检索的过程。在“月球”实体的基础上,经“谈及”关系,找到作品《水调歌头·明月几时有》则属于知识探索的过程。

(2)慢应用

慢应用类似于人类大脑的理性系统,特点是高耗能,反应迟缓,迂回曲折,善于做复杂的、需要大量计算或复杂推理的工作。在知识图谱中,知识计算和知识推理是“慢应用”技术。

知识计算是指通过复杂的图算法,从给定的输入找到符合条件的输出。以图1-1所示的知识图谱为例,给定两个实体“苏轼”和“王文广”,从知识图谱中找到符合条件的路径联系将这两个实体联系起来。通俗地讲,就是判断两个实体是否有关联,这很常见,其所用到的最短路径算法比较复杂,计算量也大,是一个“慢”的应用。

知识推理是指通过复杂的逻辑推理,经表示学习后的向量/矩阵计算或深度学习模型等方法,从给定的输入中找到符合条件的输出。仍以图1-1所示的知识图谱为例,给定两个实体“金庸”和“杭州”,推断金庸是否去过杭州,这是知识推理中最常见的链接预测功能。链接预测本身需要消耗巨大的计算资源,也是一个“慢”的应用。

事实上,慢应用和快应用是可以互相转换的,这点也类似于大脑的直觉系统和理性系统。在人类大脑的思维活动中,如果一个人经过长时间训练,对某个内容非常熟悉,那么他就可以把某个思维活动从理性系统转到直觉系统中,这往往被称为专家直觉或者“第六感”。比如,围棋大师看一眼棋盘就能判断哪一方占优,而普通的围棋爱好者则需要长时间的思考和“数子”才能得出相应的结论。

同样的,在知识图谱中,知识图谱补全的本质就是将“慢应用”转为“快应用”。在图1-1所示的知识图谱中,推断金庸是否去过杭州,需要至少两个步骤——“<金庸,任职于,浙江大学>”和“<浙江大学,位于,杭州>”。知识图谱补全利用知识计算或知识推理的方法,为“金庸”和“杭州”两个实体创建一个关系,比如“住在”,当“<金庸,住在,杭州>”这个关系建立起来之后,使用知识检索或知识探索的方法即可得到所需的结果。

第5章将介绍图数据库的查询语言,基于图数据库的查询语言容易实现知识检索和知识探索等快应用。第6章和第7章则介绍了许多慢应用的方法,除知识计算和知识推理的本身的应用之外,基于这些方法还可以实现知识图谱的补全,实现将高频使用的知识,从慢应用转到快应用上,从而提升知识图谱应用的效率和效果,降低能源的消耗。这其实很“人类”,因为人类就是这样喜欢靠直觉判断,而不愿意启动理性系统来做深度思考,即使直觉常常犯错。