第一节 智能软硬件
人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学。自20世纪50年代以来,人工智能开始走入大家的视野,学界和业界对人工智能的理解也众说纷纭,科技和商业的多元化发展导致对人工智能的定义、发展动力及表现形式理解各异。通常来讲,人工智能可以分为类人行为(模拟行为结果)、类人思维(模拟大脑运作)以及泛智能(不再局限于模拟人类)。
人工智能的驱动因素主要有算法/技术、数据/计算、场景和颠覆性商业模式。随着算法的升级、大数据的爆炸式增长和应用场景的落地,可以预测,未来几年人工智能将呈现指数级别的爆发式增长(图1-4)。
图1-4 人工智能将迎来指数级的增长
纵观世界科技发展史,许多技术在第一阶段发展缓慢,长时间感受不到升级,甚至会与直线型增长预期有偏差。直到第二阶段,突然在某个时间点出现快速发展,一下子追上了直线型增长水平。而当万事俱备进入第三阶段后,将会迅猛发展,无限接近垂直型增长——眼前的新一代人工智能就是如此。
为了更好地迎接人工智能的指数级增长,我们需要培育壮大面向人工智能应用的基础软硬件产业。《新一代人工智能发展规划》要求,开发面向人工智能的操作系统、数据库、中间件、开发工具等关键基础软件,突破图形处理器等核心硬件的研发,研究图像识别、语音识别、机器翻译、智能交互、知识处理、控制决策等智能系统解决方案。
硬件主要包括CPU、GPU等通用芯片,深度学习、类脑等人工智能芯片以及传感器、存储器等感知存储硬件;软件平台可细分为开放平台、应用软件等。开放平台主要指面向开发者的机器学习开发及基础功能框架,如TensorFlow开源开发框架、百度PaddlePaddle开源深度学习平台以及科大讯飞、腾讯、阿里巴巴等公司的技术开放平台;应用软件主要包括计算机视觉、自然语言处理、人机交互等软件工具以及应用这些工具开发的相关应用软件。
就硬件而言,首先,核心器件多元化创新,带动人工智能计算产业发展。GPU、DSP、FPGA、ASIC以及类脑等人工智能芯片创新频繁,支撑云计算、终端等方面的人工智能计算需求。人工智能计算产业快速发展,尤其是云端深度学习计算平台的需求正在快速释放。以英伟达、Google、英特尔为首的国外企业正在加快各类人工智能技术创新,我国寒武纪科技等企业也在跟进。
其次,人工智能芯片产业体系初步形成。人工智能芯片指能够实现各类深度学习算法加速的计算芯片。在深度学习算法的运行中,卷积、矩阵乘法运算以及内存存取等操作较为频繁,更擅长串行逻辑运算的传统CPU计算效率较低,难以满足需求。现阶段人工智能芯片类型主要包含GPU、FPGA、ASIC、类脑芯片等。其中,GPU芯片通用性较强且适合大规模并行计算,但售价贵、能耗高;FPGA可通过编程灵活配置芯片架构适应算法迭代且能效优于GPU芯片,但产品开发技术门槛较高,开发生态不完善;ASIC芯片通过将算法固化实现极致的性能和能效,且大规模量产后成本优势凸显,但前期开发周期长,易面临算法迭代风险。类脑芯片目前仍处于实验室研发阶段。
近些年,领先企业加快了人工智能芯片布局。英伟达凭借高性能的GPU芯片占据应用规模优势,AMD、英特尔、Google等企业加速追赶。英伟达快速推出针对人工智能运算优化的Tesla GPU系列产品,其中最强的V100GPU芯片提供每秒120万亿次张量计算能力,同时拓展CUDA生态开发深度学习加速库cuDNN,提升GPU面向深度学习算法和主流开发框架的运行效率。强劲的硬件性能和完善易用的开发者生态助力英伟达迅速形成了巨大的市场优势,现有客户覆盖Google、Facebook、微软等巨头企业和大量的初创企业、科研院所等。AMD也加速追赶,最新发布全球首款7nm制程、专为人工智能任务设计的GPU芯片产品,试图抢占服务器和工作站市场。
与此同时,英特尔、Google等企业开发兼具更高能效和低成本优势的ASIC芯片,构筑竞争实力。Google面向Google云计算业务需求,自研人工智能ASIC系列芯片TPU,其中,训练芯片具备实现业界最高的每秒180万亿次峰值浮点计算能力,TPU芯片也与旗下TensorFlow开发框架、算法和Google云平台深度耦合,构建了垂直完备的产业生态;英特尔通过收购芯片初创企业Nervana掌握了ASIC训练芯片技术,第二代产品将于2019年下半年正式推出,性能对标Google TPU产品。
就软件而言,人工智能平台正在逐步形成,也是产业竞争的焦点。如Google、Amazon、Facebook加快部署机器学习、深度学习底层平台,建立产业标准。目前业内已有近40个各类人工智能学习框架,生态竞争异常激烈。典型企业如科大讯飞、商汤科技利用技术优势建设开放技术平台,为开发者提供人工智能开发环境,建设上层应用生态。
基础开发框架在人工智能产业链中占据着承上启下的核心地位。在移动互联网时代,Android系统通过Google移动服务(Google Mobile Service)与下游云计算服务融合,通过版本控制与上游芯片、整机厂商紧密耦合,实现以Android操作系统为核心的移动互联网闭环生态。在人工智能时代,开发框架也具备媲美Android操作系统的核心地位,具有统领产业进步节奏,带动硬件配置、终端场景与云端服务协同发展的核心作用,占据着承上启下的关键地位。以Google深度学习开发框架TensorFlow为例,TensorFlow向上与Google云紧密绑定,以云平台模式提供云机器学习服务,向下与芯片和硬件厂商紧密协同做定制优化,Google TPU专用于TensorFlow。
领先企业围绕开发框架平台呈现多元化发展模式。一是以Google为典型代表,纵向打通模式,从硬件到开源平台再到云平台至应用服务,贯通产业链上下游,构建全产业生态;二是以Amazon、阿里巴巴为代表,向上布局行业应用服务模式,以业务为导向,通过核心平台向上布局重点行业应用;三是以寒武纪科技为代表,算法下沉于硬件模式,核心算法固化于硬件,以硬件形态提供行业通用或专用计算能力;四是以科大讯飞为代表,围绕语言识别的核心技术,为行业提供基础能力。在四种发展模式中,云平台和应用服务产生的所有数据均回流于训练平台进行数据反哺,可有效提升平台的综合能力。
国际巨头纷纷开源人工智能开发框架,意图加快掌握技术产业组织的主动权,占领客户、应用和数据资源,逐步建立新的产业格局和技术标准。
2015年11月,Google宣布其开源深度学习框架TensorFlow具备深度学习基本算法,可满足图形分类、音频处理、推荐系统和自然语言处理等基本功能,成为GitHub最受欢迎的机器学习开源项目,目前吸引了ARM、京东等大批合作伙伴。2016年,Amazon宣布MXNet作为其官方支持框架,具有优异的分布式计算性能,拥有卡耐基·梅隆大学、英特尔、英伟达等众多合作伙伴。2015年11月,IBM宣布开源机器学习平台SystemML可根据数据和集群特性使用基于规则和基于成本的优化技术动态地编译和优化,应用于不同工业领域。2016年9月,百度开源其深度学习平台PaddlePaddle,可实现机器视觉、自然语言理解、搜索引擎排序、推荐系统等功能。2017年6月,腾讯和北京大学、香港科技大学联合开发的高性能分布式计算平台Angel正式开源,具有较强的容错设计和稳定性。众多开源学习框架促进了人工智能应用程序的发展。据IDC预测,到2020年,60%的人工智能应用程序将在开源平台上运行。
为贯彻落实《中国制造2025》和《新一代人工智能发展规划》,加快人工智能产业发展,推动人工智能和实体经济深度融合,工业和信息化部制定了《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,并于2017年12月14日正式印发,其中对部分人工智能软件提出了发展要求和目标。例如:
◆视频图像身份识别系统。支持生物特征识别、视频理解、跨媒体融合等技术创新,发展人证合一、视频监控、图像搜索、视频摘要等典型应用,拓展在安防、金融等重点领域的应用。到2020年,复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%,支持不同地域人脸特征识别,产品达到国际先进水平。
◆智能语音交互系统。支持新一代语音识别框架、口语化语音识别、个性化语音识别、智能对话、音视频融合、语音合成等技术的创新应用,在智能制造、智能家居等重点领域推广应用。到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%。
◆智能翻译系统。推动高精准智能翻译系统应用,围绕多语言互译、同声传译等典型场景,利用机器学习技术提升准确度和实用性。到2020年,多语种智能互译取得明显突破,中译英、英译中场景下产品的翻译准确率超过85%,少数民族语言与汉语的智能互译准确率显著提升。