创业:进入智能语音市场
“语音是人类最自然便捷的沟通手段,会带给人机交互根本性的变革。”
——刘庆峰
从实验室走向商业化
1952年智能语音技术开始萌芽,经历了40余年漫长的探索,终于在20世纪90年代实现了应用突破,全球掀起第一波智能语音浪潮,并迅速涌现出Nuance、微软、IBM、摩托罗拉等一批语音技术企业。2000年以前,中文语音应用几乎全部为国外公司所垄断,微软、IBM等均在华设立专门的语音研究基地。而此时中国的几大语音研究机构还处于各自为政、力量分散的局面。刘庆峰也是这其中的一员,他于1992年进入中国科技大学和国家计算机研究开发中心联合设立的“人机语音通讯实验室”,1995年担任国家863项目“KD系列汉语文语转换系统”的主要负责人,1998年在导师王仁华的带领下研究出语音合成系统,评测分3.0,达到可实用门槛。
在1999年国内大学生创业潮下,刘庆峰为首的创业团队利用中国科技大学、安徽省经贸委等单位的300万元种子基金创办了科大讯飞,开始了从实验室走向商业化的探索;并随即在2000年开发了两款针对消费者市场的产品“畅言2000”和“话王98”,目标3年创造100亿元营收。
但发展并没有想象中快,智能语音市场仍处在早期阶段。技术方面,由于通信技术落后,智能语音缺乏技术支持和应用场景,语音合成的实际效果并不理想,和真人感官存在较大差距。市场方面,当时智能语音市场尚未培育,大家对其是否具备发展前景充满质疑。“时机未到”直接导致了科大讯飞研发的两款产品石沉大海。
在巨大的生存压力下,2001年创始人团队在巢湖半汤举行会议沟通公司未来的战略发展。经过讨论,大家一致认为——未来的世界一定是智能语音的,任何一项技术都会经历从开始到产业化不断波动的发展周期曲线,当业界期待提升时,资源会逐渐步入,整个智能语音产业会快速发展。在清晰的发展方向下,科大讯飞确定了自己的定位和发展模式:“首先做中文语音产业的领导者,未来发展成为全球最出色的多语种语音技术提供商。”波峰尚未来临之前,坚持“大波浪+小波浪”式的发展——核心源头技术方向不变的前提下,适时调整商业模式。
科大讯飞业务从消费者市场调转至B2B市场,并提出iFLY inside平台战略——为各个行业的大中型客户提供语音开发平台。为了向B端普及智能语音技术,讯飞通过举办语音应用行业会议、出版语音应用案例期刊等方式教育市场;并很快找到了切实可行的业务场景——呼叫中心。
从语音合成到语音识别
2001年前后,呼叫中心市场开始蓬勃发展,仅中国电信160、168语音服务一年就能产生几十亿人民币的收入。由于信息服务的大量产生,运营商对智能语音的需求非常强烈,亟待通过自动语音应答提高语音增值服务的效率。对此,华为、中兴等大型客户希望科大讯飞能够快速研发出基于中文语音的自动应答系统。
但完整的自动应答系统需要集成语音合成技术和语音识别技术,而当时科大讯飞只有语音合成技术。在这个情况下,讯飞果断选择先通过外部合作(和擅长语音识别的国际语音提供商Nuance合作)占领市场,并集中攻关研发,于2002年迅速推出自动语音应答系统,开始为华为等企业提供服务。
在为大客户提供方案和应用的过程中,科大讯飞发现语音识别存在巨大市场,如果没有自主知识产权,很难做出最佳的应用效果,于是坚定了自主研发的目标,2003年开始从嵌入式端切入语音识别技术的研发。
语音识别技术的准确率需要通过不断迭代来提高——迭代首先要进行数据采样,然后在样本库上进行建模,再进入应用系统,通过观察实际应用效果不断更新算法模型。采集样本则是迭代的基础,而对当时的科大讯飞来说,这点相当困难——公司是服务B端的,并不能直接获取终端数据。在运营商客户的帮助下,科大讯飞进行了样本的初始积累,但因为数据量不够,公司还通过在全国招募测试人员,让测试人员从各地拨打系统的方式扩充样本。这一阶段,科大讯飞平均几个月进行一次技术迭代。2006年科大讯飞发布了第一个服务器端的语音识别系统,标志着公司拥有了从语音合成技术到语音识别技术的自主知识产权。
从亏损走向盈利
基于iFLY inside,科大讯飞开始扭转只见投入不见产出的局面。截至2001年6月,与科大讯飞合作的厂商就达到了100多家,应用场景也从呼叫中心逐渐切入车载、金融等领域。2004年,科大讯飞达到了盈亏平衡点,全年销售收入近亿元,先于行业其他参与者实现了从实验室到商业落地、从亏损到盈亏平衡的成长。
2006年到2008年,科大讯飞围绕“自主创新、顶天立地”的长期发展战略,在核心技术和产业优势方面持续增强。
核心技术方面:公司三次获得国际英文合成大赛第一名,确立了在英文语音合成技术上的领先地位;公司参加国际说话人识别大赛并获得综合指标第一名,确立了在语音识别领域的领先地位。
产业优势方面:公司坚持将研究成果产业化,推动语音支撑软件(包括电信级语音平台、嵌入式语音软件)出现新的增长点;在行业应用方面,积极应对3G带来的新业务机会,不断围绕核心技术研发新产品;在教育方面,积极推动语音技术在口语考试方向的业务进展。
2008年,科大讯飞在深交所上市,同年全年营收2.57亿元,同比增速25%。