1.1 AI是什么
人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够完成自主学习、判断、决策等人类行为的范畴。AI是人工智能的英文Artificial Intelligence的首字母的组合,它是当前人类所面对的最为重要的技术变革。AI技术给予了机器(这里的机器不仅仅指机器人,还包括消费产品,如音箱、汽车等范围更广的物体)一定的视听感知和思考能力。例如,苹果Siri和亚马逊Echo智能音箱可以帮助我们通过语音控制的方式设置闹钟、播放音乐、回复信息、询问天气,还可以聊天;滴滴出行和Uber应用也是在人工智能技术的驱动下帮助司机选择最佳路线。
除了日常生活外,人工智能在工业、金融、安防、医疗、司法等领域也发挥了巨大的作用。工业机器人代替人类完成焊接、铸造、装配、包装、搬运、分发货物等单调、重复、繁重的工作;在金融领域,人工智能技术可以帮助金融机构提供投资组合建议,创建高精度的风险控制模型,实现精准营销等金融活动;对于安防行业,以图像识别、人脸识别为代表的人工智能技术对摄像头获取的海量视频信息进行解析,已被广泛应用于门禁系统、车辆检测、追踪嫌犯等场景中,对增强安防水平、维护社会稳定、提高刑侦效率等都有重大意义;在医疗领域,IBM的人工智能系统Watson(沃森)已被多家医疗机构采用,它可以帮助医生更快、更准确地诊断疾病,还能提出对医疗方案的疗效及风险的评估,这将有效地弥补有些地区医疗资源不足的缺陷;美国人工智能律师Rose Intelligence可以理解律师向它提出的问题,收集已有的法律条文、参考文献和法律案件等数据,进行推论,给出基于证据的高度相关性答案,这样的系统可以减少法律服务成本,使更多的人能够获得法律帮助。
1.1.1 火热的AI
人工智能发展到今年(2018年)刚好是62年。这62年的发展实际上经历了三个阶段:第一个阶段,1956年到1976年,注重逻辑推理。第二个阶段,从1976到2006年,以专家系统为主。2006年起进入重视数据、自主学习的认知智能时代。这是第三个阶段,它会持续多长时间,没有人知道。
最近几年,在算法、大数据、计算力等技术的推动下,人工智能开始真正解决问题,在各行业的应用场景逐渐明朗,并带来实际商业价值。目前,无论在学术界、投资界,还是在职场,AI异常火热。根据斯坦福大学2017年12月发布的AI报告,AI论文发表数量激增:自从1996年以来,每年发表的AI论文数量增加了9倍以上,如图1-1所示。斯坦福大学入学选修人工智能和机器学习入门课程的学生人数从1996年以来增长了11倍以上。在美国,有资本投资的AI创业公司数量从2000年以来增加了14倍,如图1-2所示。在美国,投资AI创业的基金数量也在增长,从2000年以来,每年投入AI创业的资本额增加了6倍。美国最近几年中,每年都有几十亿美元的风险资本(VC)进入AI领域,人工智能相关岗位的需求也在急剧增长。图1-3展示了Indeed.com平台上,从2013年1月份起,AI技术相关工作岗位的份额的增长。
图1-1 AI学术论文每年发表情况
图1-2 美国AI创业公司数量
图1-3 需要AI技能的工作岗位
在开源软件使用和生态上,AI软件也是异常火热的。图1-4展示了AI各个软件包在GitHub上加星标的次数。排在第一的TensorFlow是排在第二的scikit-learn的4倍左右。
图1-4 AI开源软件
1.1.2 AI的驱动因素
某著名咨询公司预计,到2025年,全球AI市场规模将达到3万亿美元。AI持续火热的驱动力主要来自于技术本身的提高,包括数据、算法、计算力、大数据和物联网等技术,而这些正是人工智能技术发展的基础。
● 高质量和大规模的海量数据使得AI成为可能
海量数据为AI技术的发展提供了充足的原材料。在数据生成量方面,预计到2020年,将达到44ZB。表1-1展示了数据量与医疗图像准确性的关系,表明了训练数据量越大,准确性越高。
表1-1 训练数据量与医疗图像模型准确性的关系(%)
● 计算力提升突破瓶颈
以GPU为代表的新一代计算芯片提供了更强大的计算力,使得运算更快。同时,在集群上实现的分布式计算帮助AI模型可以在更大的数据集上快速运行。
● 机器学习算法取得重大突破
以多层神经网络模型为基础的算法,使得机器学习算法在图像识别等领域的准确性取得了飞跃性的提高。
● 物联网和大数据技术为AI技术的发展提供了关键要素
物联网为AI的感知层提供了基础设施环境,同时带来了全面的海量训练数据。大数据技术为海量数据在存储、清洗、整合方面提供了技术保障,帮助提升了深度学习算法的性能。