前言
知识图谱,是近年来最火热的研究方向之一,被认为是实现认知智能的核心基础技术。知识图谱以图的形式表现客观世界中的实体、概念及其之间的关系,致力于解决认知智能中的复杂推理问题。
随着大数据时代的红利逐渐消失,以深度学习为基础的感知智能逐步触碰到天花板,理论突破也越来越难。而在认知智能的前进道路上,基于统计概率的深度学习模型仍然无法真正实现和人类相同的推理和理解能力。
充分有效地利用人类社会中海量的知识是可行的解决路径之一。而知识图谱将人类知识表示为图的形式,可以让机器更好地利用知识,实现一定程度的“智能化”。然而,虽然知识图谱被寄予厚望,可以实现人工智能从感知到认知的跨越,但通用知识图谱的建立和完善是一个漫长的过程。在现阶段,知识图谱还是大量应用在简单场景和垂直场景上,例如搜索引擎、智能问答、语义理解、决策分析、智慧物联等。
构建知识图谱是一个系统工程,涉及知识的表示、获取、存储、应用以及自然语言处理等各项技术,如何全面掌握知识图谱的构建,成为很多同学和从业者最为关注的问题。纵观目前市场上的知识图谱书籍,我们发现,大多数的书都是以理论介绍为主,虽然内容充分翔实,但缺乏应用性的梳理和阐述。
写这本书的初衷,就是希望将我们在实践中构建知识图谱的经验,包括踩坑的教训,以文字的形式做出总结,同时分享给各位奋战在一线的知识图谱从业人员。书中不仅对知识图谱的概念和理论做了详细介绍,同时用开源代码的形式阐述了落地细节。书中代码资源下载地址为https://github.com/zhangkai-ai/build-kg-from-scratch。
本书一共分为8章。第1章给出了知识图谱的概览,第2章围绕知识图谱的整体技术体系,详细阐述了知识的表示与建模、抽取与挖掘、存储与融合,以及检索与推理。第3章以具体的实例介绍了各种知识图谱工具的使用。第4章和第5章从实战的角度带领读者从零到一构建通用知识图谱和领域知识图谱,并配以详细的代码解读。第6章给出了知识图谱的具体应用。第7章也是从实战的角度对知识图谱的问答系统做了详尽阐述。最后第8章给出了知识图谱的总结和展望。
知识图谱领域仍然有很多问题需要解决,需要各位同人一起努力。希望本书能够为读者解决问题提供些许帮助。
由于种种原因,本书成稿过程颇有波折。我们要特别感谢编辑杨福川和李艺,他们对本书出版提供了大力支持。