7 科技前沿创新产品案例分析
领域1:人工智能
【人工智能案例1】腾讯发布首个AI辅诊开放平台:可诊断、预测700多种疾病(8)
2018年6月21日,腾讯正式发布首个AI医学辅助诊疗开放平台,宣布开放旗下首款AI+医疗产品“腾讯觅影”辅诊引擎,助力医院HIS系统、互联网医疗服务实现智能化升级,构建覆盖诊前、诊中、诊后的智慧医疗生态。
“腾讯觅影”的AI辅诊引擎也成为国内首个开放的医疗AI引擎。腾讯副总裁陈广域表示,希望“腾讯觅影”能成为医院和医疗信息化厂商的“工具箱”,助力医疗行业打造面向下一代智能医疗服务的“超级大脑”。同时,腾讯还与多家医疗信息化企业以及医疗机构分别签署了人工智能战略合作协议。
国内首个开放的医疗——AI引擎
作为腾讯首个将人工智能技术应用在医学领域的产品,“腾讯觅影”具备AI医学图像分析和AI辅助诊疗两项核心能力,与国内100多家顶尖三甲医院达成了合作。基于“腾讯觅影”在AI+医疗探索上取得的突破,国家科技部明确依托腾讯承建国家新一代人工智能开放创新平台。而此次腾讯发布首个AI辅诊开放平台,则是继2017年11月13日“腾讯觅影”首次发布AI辅助诊疗能力后,首次宣布开放“腾讯觅影”AI辅诊引擎。未来,医院、医疗信息化厂商可以通过开放的接口使用“腾讯觅影”AI辅诊引擎,定制化打造覆盖诊前、诊中、诊后的智能化医疗服务。
据介绍,“腾讯觅影”AI辅诊引擎通过模拟医生的成长学习、积累医学诊断能力,能辅助医生诊断、预测700多种疾病,覆盖全学科,涵盖了医院门诊90%的高频诊断。与人类医生的学习路径相似,“腾讯觅影”AI辅诊引擎也遵循类似的学习过程:医科学生的成长经历了熟读医学书籍的积累期,临床实习的诊断技能提升期,以及大量临床实践的医生期,才有可能成为医学专家。而“腾讯觅影”的AI辅诊能力成长也经历了三个阶段,才能为医生提供专业的决策辅助。首先,运用腾讯AI Lab广泛应用在腾讯服务中的自然语言处理和深度学习等人工智能技术,学习、理解和归纳权威医学书籍文献、诊疗指南和病历等医疗信息,自动构建出一张“医学知识图谱”;其次,基于病历检索推理和知识图谱推理,建立诊断模型;最后,在人类医学专家的校验下,优化诊断模型。
2017年11月13日首次发布AI辅诊能力以来,“腾讯觅影”AI辅诊引擎也迎来了能力的升级:目前其储备了约50万条医学术语库,超过20万条医学标注数据库,超过100万条术语关系规则库,超过1000万条健康知识库,超过8000万条高质量医疗知识库以及超过1亿条的开放医疗百科数据,涵盖了绝大部分对外公开的权威医学知识库。
开放的“腾讯觅影”AI辅诊引擎将成为医疗服务智慧化的工具箱。通过开放接口,医疗信息化厂商可以将“腾讯觅影”AI辅诊引擎与医院的HIS系统融合,让医院HIS系统具备AI辅诊能力,实现医院内部数据与应用的共享共通,实现医院HIS的智能化。其中,临床辅助决策支持系统(CDSS)应用AI辅诊能力后,将辅助医生提升对常见疾病的诊断准确率和效率,并为医生提供智能问诊、参考诊断、治疗方案参考、意图分析、辅助知识库和结构化电子病历等辅助决策服务。
通过开放引擎,腾讯开启“POWERED BY腾讯觅影”的合作模式
依托“腾讯觅影”AI辅诊引擎和微信智慧医院生态,医院和医疗信息化厂商能实现移动医疗服务的智慧化升级,在诊前通过AI导诊、AI分诊预诊,提升诊前信息收集的精确度和效率,诊后AI随访等新的应用场景也可以在诊室之外实现医生与病人的智慧化沟通。
未来,通过腾讯AI辅诊开放平台,“腾讯觅影”的AI辅诊能力将帮助医院以及医疗信息化厂商实现智能化,打造自己的“医疗超级大脑”,构建覆盖诊前、诊中、诊后的智慧医疗生态。
【人工智能案例1分析】
“人工智能+医疗”指的是人工智能对医疗领域的改造,如今医疗产业边界已经从疾病的治疗扩展到药品、保健、生物技术等医疗相关的各领域。人工智能的加入不仅使医疗生产活动成本降低、效果增强,而且推动了医疗产业整个产业链的创新发展。我国正处于医疗人工智能的风口,2016年中国人工智能+医疗市场规模达到96.61亿元,2018年达到200亿元。(9)另据世界知名咨询公司麦肯锡统计,(10)到2025年,人工智能应用市场总值将达到1270亿美元,其中医疗行业将占市场规模的1/5。
目前“人工智能+医疗”产品面临以下几个瓶颈和挑战:
首先,数据的积累和创新应用。数据是人工智能技术最重要的因素之一,对于医疗人工智能而言,数据的重要性更加明显。人工智能技术产品所需要的医疗数据一般从公开数据或某个医疗企业、某个医院合作采集,但是医疗设备如果层厚、电流、电压、扫描时间等参数不同,数据建模就需要重新针对新设备机型进行数据预训练。此外,病人接受检测时候的姿势(如侧卧、平躺或俯卧等)也会对数据建模产生影响,因此数据问题能否解决是医疗人工智能诊断产品能否广泛应用的关键。
其次,从试验到临床应用的突破。医疗机构和企业在构建数据模型时通常会有自己的数据库,并采用自身研发的算法对数据进行建模训练并验证数据模型的准确性。在没有得到临床验证前,基于自身标准或特定数据集的实验室测试结果并不具备太多的实际意义。但临床的数据采集、数据格式、诊断标准和应用场景都很复杂,如何采集筛选有效数据并构建统一分析标准是医疗人工智能产品亟待解决的问题。
最后,寻求可持续的商业模式。目前人工智能+医疗企业主要与单点医疗机构开展合作,数据作为医疗机构的资产也难以让企业通过医疗人工智能产品置于医院边界外使用。同时,医疗人工智能产品想以销售软件的形式让医院按需、按量付费存在困难。因此,寻求可持续发展的商业模式是医疗人工智能产品和人工智能+医疗产业能够长久发展的关键。
案例中互联网巨头腾讯构建的人工智能+医疗平台,能够借助自身强大的实力整合医疗人工智能数据、企业和产品资源,通过辅助引擎推动人工智能与临床医疗的产业化落地,为医疗人工智能技术产品的可持续发展搭建平台生态,对人工智能+医疗产业化具有全面推动意义。
【科言漫语】01 AI:问诊
【人工智能案例2】Google Duplex:能打电话完成真实世界任务的AI系统(11)
长期以来,人类和计算机之间交互的目标都是希望两者之间可以进行自然的对话,就像两个人之间讲话那样。近几年来,计算机理解和生成自然语音的能力出现了革命性的提高,谷歌语音搜索、WaveNet之类基于深度神经网络的技术功不可没。
即便如此,当前最先进的人机对话系统也仍然只有生硬的电子声音,而且也不理解人类的自然语言。具体来说,自动呼叫系统即便只是识别简单的单词和控制指令也不令人满意,更不用说和人进行自然的对话了。打电话的人需要调整自己的说话方式来适应系统,系统却没办法适应打电话的人。
2018年5月9日,谷歌发布的Google Duplex就包含了新的技术,它可以打电话给人类,通过自然的对话完成一系列真实世界的任务。这项技术目前针对的是执行一些特定的任务,如为某几类活动约定时间。在这些任务中,Duplex能让对话过程尽可能地自然,电话另一端的人类可以像和另一个人说话一样自然地交流,无须做任何调整,甚至实际上对方可能根本就没有发现这通电话不是人类打来的。
在这项技术的研究中,一个重要的研究要点是把Duplex的功能限制在封闭的场景中,这些场景涵盖的内容足够少,以至于AI系统可以充分地探索学习。相对应地,Duplex经过这些场景的深入训练后,也就只能执行这些场景内的自然对话任务,还不能和人进行一般的对话。不过,在这些任务中,Duplex带来了令人惊喜的表现,对话过程对人类来说非常舒服。
认识Duplex
借助语言理解、交互、时间控制、语音生成方面的最新技术发展,Google Duplex的对话听起来相当真实自然。
Duplex的核心是一个RNN网络,它是由TensorFlow Extended(RFX)构建的。为了达到高精度,谷歌用匿名的电话对话数据训练了Duplex的RNN网络。这个网络会使用谷歌自动语音识别(ASR)的识别结果文本,也会使用音频中的特征、对话历史、对话参数(如要预订的服务、当前时间)等。谷歌为每一种不同的任务分别训练了不同的理解模型,不过不同任务间也有一些训练语料是共享的。最后,谷歌还利用TFX的超参数优化进一步改进了模型。
生成自然的语音
谷歌联合使用了一个级联TTS引擎和一个生成式TTS引擎(其中使用了Tacotron和WaveNet),根据不同的情境控制语音的语调。
这个系统还可以生成一些语气词,这也让语音变得更自然。当级联TTS需要组合变化很大的语音单元,或者需要增加生成的停顿时,语气词就会被添加到生成的语音中,这就让这个系统可以一种自然的方式向对方示意“是的,我听着呢”或者“我还在考虑”。
另外,系统的延迟也要能够符合人类的期待。例如,当一个人在电话里讲了“你好”这样的简单句子之后,他们会希望很快听到一个简短的回复,这种时候会对延迟更加敏感一些。当AI系统检测到需要短延迟的情境时,就会使用更快但精度也更低的模型来处理。在某些极端情况下,系统甚至都不会等待RNN运行,而是直接使用快速逼近模型。这样的做法就可以让系统达到100ms之内的极短延迟。
系统运行
Google Duplex系统可以进行复杂的对话,它可以全自动地完成大多数任务,不需要任何人类参与。系统也有一个自动监控机制,不仅成功完成一个任务后可以给用户弹出提醒,还可以识别出没能成功完成的任务(如处理某个异常复杂的预订)。在这种情况下,它会给人类操作员发出一个指令,转交给人类完成任务。
为了在训练系统处理新的情境,谷歌也使用了实时监督训练。这种训练方式和许多事情的教学方法类似,都有一个教学者指导一个学生,边做边提供必要的指导,确保任务的执行效果达到教学者的质量要求水平。在Duplex系统中,有经验的人类操作员就可以作为这样的教学者,当系统打电话处理新的、不熟悉的情境时,人类操作员就可以实时影响系统的行为。这样的边做边学的过程可以一直持续到系统达到理想的表现为止,然后系统就可以全自动地打电话了。
有益于用户,也有益于商家
许多商户并没有自己的在线预订系统,使用的仍然是人工预订。Duplex就可以帮助他们,无须改变每日的行为惯例或者培训员工,就可以让用户通过Google Assistant轻松完成预订。Duplex也可以减少用户“放鸽子”的情况,可以在手机上自动提醒用户预订事项,以及帮助用户轻松地取消或者重新安排时间。
但在一些情况下,用户会打电话向商户询问营业时间,如节假日期间的营业时间,一般在店铺的在线信息页面是看不到的。Duplex打电话询问之后可以通过谷歌服务把这个信息公布出去,省去其他用户打同一个电话、问同样的问题的精力,也帮商户节省了人力。同时,商户就像往常一样正常营业即可,这项新技术并不需要他们学习任何技能或者做任何改变就可以享受到便利。
对用户来说,Google Duplex当然可以帮助他们轻松地完成它支持的各种任务。用户只需要和Google Assistant做简单的互动,Duplex就会自动在后台打电话,并且自动补全所需的用户信息。
Duplex还能给用户增加一项便利,就是可以非同步地作为服务提供商的代理,如在非营业时间给商户打电话,或者在手机信号不好的时候,Duplex就成为一个额外的信息获取途径。它也可以帮助残障人士或者语言不通的用户,替听力受损的用户打电话完成预约,或者替用户用另一种语言完成任务。
【人工智能案例2分析】
人机交互是人工智能的重要应用领域,而语音识别将是近来人机交互的主要模式之一。语音识别是以语音为研究对象,通过信号处理和识别技术让机器自动识别和理解人类的口述语言之后,将语音信号转换为相应的文本或命令的一门技术。
目前,苹果、谷歌、微软等行业巨头纷纷研发自己的智能语音技术,主要目的就是抢占最新人机交互产业入口。智能语音正在迅速切入各场景,影响多个产业变革。智能语音可以提高传统行业效率,融合传统行业各个部门。据统计,2017年中国语音识别产业市场规模已突破百亿。(12)国际知名市场研究公司Research and Markets也发布报告认为,到2020年,全球智能语音市场规模预计将达到191.7亿美元。(13)在大数据、移动互联网、云计算以及其他技术的推动下,全球的人工智能语音产业已经步入应用的快速增长期。
目前,人工智能语音产品化受限于技术成熟度和用户使用习惯,语音交互并未成为真正帮助人们操控设备的工具。但在语音识别率方面,随着语音技术如深度学习、高性能计算和大数据的逐渐成熟,百度、谷歌和科大讯飞等主流平台的技术产品对人类语音的识别准确率均在96%以上,稳定的识别能力为语音技术产品在生产生活中落地提供了可能。
案例中谷歌基于人工智能代打订购或订餐电话这个细分消费场景推出的智能语音系统,能够较好地使用人工智能语音产品服务一种接近标准化模式的应用场景,将人类从这些电话服务交流中抽身出来完成更重要的工作,这是语音技术产品落地应用的典型场景。
【科言漫语】02 AI:订餐