转型:从语音技术提供商到语音生态平台
2009年,上市刚满一年的科大讯飞营收增速放缓,同比仅增长19%,营业利润甚至同比下滑了10个点。科大讯飞增速疲软的背后是风云突变的智能语音市场。
智能语音市场格局突变
2010年深度学习算法开始在语音识别领域应用——该建模技术可模拟人脑行为,同时优化特征选择和模式分类,克服发音干扰等瓶颈。除了算法升级外,移动互联网也在飞速发展,这两个底层技术的升级使得技术迭代加快,从原先几个月一次的迭代周期快速进入到每天甚至更快的连续性迭代,语音识别准确率平均从70%提升至90%,大幅降低了语音识别的行业门槛,直接导致全球智能语音市场格局变化:
国际智能语音市场,2010年前,Nuance全球市场占有率超过70%,一家独大。2010年后谷歌、微软、苹果、亚马逊等互联网公司纷纷加强在智能语音市场的布局,特别是苹果Siri的发布标志着智能语音技术进入快速应用阶段。
国内智能语音市场,除了科大讯飞、接通华声、中科信利、思必驰等智能语音提供商外,百度、搜狗、腾讯、云之声、虫洞语音助手、智能360、小i机器人等互联网公司也进军语音市场(见图1.1)。
图1.1 智能语音产业规模情况
资料来源:中国语音产业信息网,《中国智能语音产业发展白皮书》,2016-05-23
对科大讯飞来说,这既是机遇也是挑战:
机遇是智能语音产业终于迎来了产业爆发期。随着国家战略推进、政策支持以及移动互联网技术提升背景下外部市场需求的驱动,全球智能语音技术需求正在迅速扩大,产业规模进一步提升,应用场景也更加丰富。
挑战是技术差距逐渐缩小,智能语音市场的竞争从技术层面转到了生态层面。互联网公司把技术免费的思维带入了市场,科大讯飞原有的业务模式受到了冲击。
搭建平台:从B2B到B2B2C的服务转变
由于服务电信运营商,科大讯飞从2007年开始就逐步感知到移动互联网时代即将到来。与此同时,科大讯飞陆续收到来自中小企业和开发者的应用需求。此前,科大讯飞客户主要是大中型企业,开发应用“需要先花30万元买硬件,花30万元买平台,再加上其他成本,没有100万元预算根本没办法开展业务。”这一投入对于中小企业来说过于高昂。刘庆峰从水龙头的功能中获得了启发——用户不用建自来水厂,拧开水龙头就可以接到水,科大讯飞也可以做中小企业和开发者的“水龙头”。
为了应对行业新挑战,2010年底科大讯飞发布了全球首个移动互联网智能语音交互的“讯飞语音云平台”并同步发布了“语音输入法”体验版,重新进入消费者市场。
平台的推出应该是双赢的效果:对创业者而言,降低了开发门槛——产品可直接依托讯飞语音云平台开发并对外提供服务,免去在服务器上的资金投入;对科大讯飞而言,在为中小企业提供“水”的同时也为自己发掘了源源不断的活水——通过云端后台数据样本,科大讯飞可以基于深度学习算法进行语音识别技术的迭代。
但由于缺少对小B和C端用户的开发经验,语音云发布之后相当长一段时间成绩并不理想——半年仅积累了100万用户。这和刘庆峰最初的预期相比落差非常大。
通过调研,科大讯飞了解到是由于此前公司的语音识别技术没有在移动网络环境下提供大规模的云端服务的经验,导致准确率出现了问题。对此,科大讯飞加快样本学习,对产品进行优化迭代,同时转变服务思路,开始针对移动互联网用户需求注重产品实用功能的研发,比如打电话、发短信、听音乐等需求,推出了“讯飞输入法”“灵犀”等现象级应用。此后,用户使用量开始慢慢上升,截至2017年1月,讯飞开放平台在线日服务量超过30亿人次,用户超过9.1亿,合作伙伴达25万家。同时,伴随着人工智能技术与资源的注入,“讯飞语音云”也进化成为“讯飞开放平台”,并形成了完整的生态系统。
开放式创新:加速智能语音行业应用布局
2004—2008年,科大讯飞营业收入从破亿到2.57亿元,4年时间仅增长2.5倍;而2008—2015年,科大讯飞营业收入从2.57亿元增至25.07亿元,增长近10倍。科大讯飞迎来了第二次发展高峰,市值一度接近700亿元人民币,成为中国沪深两市市值最高的软件企业。这主要归功于它的开放式创新:
善于利用产学研资源:自成立起,科大讯飞就通过建设研究所和实验室等方式引进全国各地的科研人员。比如2000年整合中国科技大学、清华大学等成立语音技术联合实验室;2002年设立博士后科研工作站;2005年成立科大讯飞研究院;2011年设立语音及语言信息处理国家工程实验室。
推出开放平台后,则充分利用平台上合作伙伴的先进技术加速创新。比如香港中文大学教授汤晓鸥将人脸识别技术应用到讯飞开放平台上,使得开放平台的人脸识别准确率提高到99%以上;哈尔滨工业大学在讯飞开放平台上推出“哈工大讯飞语言云”,成为国际最具影响力的中文处理基础平台。
此外,科大讯飞在内部人才建设方面也不遗余力,研发人员占公司员工的60%,研发投入占销售收入的比例达到25%(见图1.2)。2014年科大讯飞启动“超脑计划”,聚集了来自语音及语言国家工程实验室、清华大学、加拿大约克大学等机构的10多位人工智能领域顶级专家。2016年启动“春晓行动”,面向全球人工智能领域引进10位国际顶尖人才、100名行业领军人才、1000名各类骨干人才。
图1.2 科大讯飞研发投入和研发人员情况
资料来源:wind
鼓励内部创业机制和战略合作机制:科大讯飞通过与战略投资者、业务团队共同参股的方式对新业务进行孵化,加速产品创新和落地。如科大讯飞玩具事业部自成立起连续亏损7年;2015年通过原骨干参与增资扩股、引入群兴玩具等战略合作者的方式,成立独立公司淘云科技,2016年已基本实现盈亏平衡。此外,科大讯飞在智能硬件、人工智能等方向也采用战略合作机制,如与京东合作成立了智能硬件公司灵隆科技;与实体KTV合作探索人工智能与KTV结合的公司等。
以讯飞为龙头的产业集群逐步形成:2016年2月,中国声谷获工信部批准,该产业园依托科大讯飞语音技术研发基础,以“大创客”带动“小创客”,利用科大讯飞的核心语音技术、讯飞开放平台和产业资源,推动集群创新和产业孵化器模式形成。据报道,基地内通过招商引资已入驻企业50家,计划投资约25亿,已完成投资12.5亿元;在谈项目超过100个,预计投资额超过85亿元。
基于开放式创新的理念,科大讯飞在客户数量和行业布局上都实现了跨越式突破。客户数量方面,1999—2009年10年时间,科大讯飞仅开发2000多个客户;而2010年底至2017年1月五年多时间,科大讯飞共开发合作伙伴25万家,覆盖用户超过9.1亿(见图1.3)。在行业布局方面:
图1.3 科大讯飞第三方应用和开发者增长情况
资料来源:科大讯飞提供
智能手机领域:科大讯飞形成了以运营商、手机厂商为核心的智能手机语音生态体系。通过与中国移动、各手机厂商组成战略联盟,科大讯飞语音云用户规模和创业项目数量都在行业中遥遥领先。其中,讯飞输入法排名在2013年超过QQ输入法、2014年超过百度输入法。2016年三季度讯飞输入法用户数破4亿,活跃用户数达1.1亿,语音输入用户覆盖率超过40%。截至2016年底,灵犀语音助手月活跃用户超过1600万,识别率准确度达97%。
智慧教育领域:科大讯飞通过和基础教育出版行业龙头人民教育出版社合作,进行教学平台、网络学习、电子书包等联合开发和应用;通过与北京师范大学合作,共同推出了教育评价云。此外,科大讯飞已完成15个省级教育平台、20余个市/县/区级教育信息化整体方案的建设,服务覆盖师生超过8000万。面向学生的个性化教与学平台智学网用户突破500万,覆盖学校超过4000所。普通话水平智能测试实现全国覆盖,累计测试考生超过2600万人次。
智能家居领域:科大讯飞和北京、广东等地方广电、三大运营商以及海信、长虹、TCL等电视机品牌商均有合作。此外,智能语音助手灵犀3.0已可操控智能家居设备。2015年5月,讯飞和京东合资公司研发的叮咚智能音箱发布,2016年11月份升级版的叮咚智能音箱集成了双全工技术、声纹识别等服务,并搭载人机交互系统AIUI,可实现智能家居控制,并接入了京东购物功能。2016年双11当日,叮咚智能音箱在京东平台上智能音箱品类里销量排名第一,截至2017年2月,叮咚销售同比去年增长137%。
智能车载领域:科大讯飞在宝马2015年3月的中文评测及奔驰2015年6月的中文语音云效果评测中均力拔头筹,并已与奔驰、宝马、大众、丰田、雷克萨斯、马自达、上汽、一汽、长城、长安、吉利、奇瑞、江淮、广汽、海马、东南等国内外汽车品牌开展合作,搭载讯飞语音技术的轿车前装出货车型达到31款,市场占有率第一。此外,科大讯飞与奇瑞共同开发了Cloudrive2.0智云互联行车系统,目前已搭载在艾瑞泽5、瑞虎7、瑞虎3x上,其中搭载Cloudrive2.0的艾瑞泽5,上市11个月累计销量突破15万辆,刷新中国品牌最快增速纪录。2017年3月,科大讯飞与奇瑞签署战略合作协议,开始进行智能化终端机、车联网开发与应用的全面合作。除了Cloudrive2.0,2016年11月讯飞还首次对外发布了独立研发的基于AIUI的汽车智能互联系统——“飞鱼助理”,将于2017年迎来量产。