8.3 关键技术
8.3.1 自然语言处理技术
自然语言处理(Natural Language Processing,NLP)主要是研究人与计算机交互中的语言问题的一门学科。自然语言处理要研究表示语言能力和语言应用的模型,建立计算机框架来实现这种语言模型,提出相应的方法来不断完善语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。在未来,我国将重点突破自然语言的语法逻辑、字符概念表征和深度语义分析的核心技术,推进人类与机器的有效沟通和自由交互,实现多风格、多语言、多领域的自然语言智能理解和自动生成,目前的自然语言处理技术主要采用了RNN、LSTM、Attention等模型辅助实现各类应用场景。
8.3.2 计算机视觉
计算机视觉也称为机器视觉,同一含义的两个术语往往使用在不同的场景中。在图像、视频等识别和分析中,常常使用计算机视觉;而在机器人等应用场景中,一般称机器视觉。计算机视觉主要解决“让机器看”的问题。计算机视觉研究如何用摄像机等视觉传感装置代替人眼对物体进行识别、跟踪和测量,并由计算机处理这些视觉信息,从而达到像人眼一样对事物进行感知和认知的效果。在未来,我国将重点研究复杂环境下基于计算机视觉的定位、导航、识别等机器人及机械手臂自主控制技术。采用的技术包括GooLeNet、AlexNet、VGG等。
8.3.3 机器学习
机器学习是通过运用计算机强大的运算能力及数据处理能力,对大批的数据进行训练,使计算机具备自发模仿人类学习行为,通过学习获取经验和知识,在不断地改进自身性能的同时,实现人工智能的能力。未来机器学习主要有两个重点领域:一是在神经生物学方面,从人类自身出发找出大脑本身的生物学习机制,进而继续加强对人脑学习动作的探索研究;二是在算法方面,加强各类机器学习算法的联系和统一,避免使用单一算法导致限制系统性能情况的出现,建立切实可行的算法应用系统,特别是结合当下互联网时代的背景,对多种学习算法的一体化和集成化进行进一步探索。
8.3.4 深度学习
深度学习以大数据为依托,着重于发现特征,并且对特征进行分层。根据模型的复杂维度,可以有非常丰富的特征表达方式。深度学习在提升准确性方面有强大的功效,可以大幅提升图像识别、语音识别等领域的准确性。
强化学习所采用的大部分数据并非直接标注,而是等到最后结果出来,再指导前面的机器学习过程。强化学习的目的是学习策略,它依赖于人为定义的状态空间,需要人工提供知识才能启动。强化学习加上深度学习打破了以往的分析处理局限,如DeepMind的AlphaGo在人类引以为傲的智慧高地围棋比赛中打败了人类顶尖棋手,其背后技术就是深度强化学习。
8.3.5 知识图谱
知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。未来我国将重点突破跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与学习、知识演化与推理、智能描述与生成等技术,实现跨媒体知识表征、分析、挖掘、推理、演化和利用,构建分析推理引擎。