我来自神级文明
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第8章 ,太昊

黑科•太昊实验室。

空气安静了很久。

“怎么感觉和智能音箱差不多?”说完,感觉是在拆台,李舒涵吐了吐舌头,怕男神生气,连忙对陈然道:“太昊肯定不一样吧?”

“当然不一样!”钱斌傻笑,试图化解尴尬,“那些不是经常听错,就是答非所问的人工智障,怎么能跟‘太昊’比?”

“嗯。”李舒涵尴尬的应了一声,见陈然不答,又问:“太昊多厉害?”

“这还用说?!”钱斌再次截胡,与有荣焉,炫耀道:“大多数互联网公司,语音识别准确率最高不到97%,太昊是99.6%,比人的听力强太多了!”

“……”这人怎么老插嘴?

李舒涵小脸微黑,调整一下心情,她拉起陈然的袖子走到一边,“你们好厉害,第一次来,跟我讲讲嘛。”

“诶?”钱斌傻眼,侧头问陆少英,“她怎么走了?”

“为什么不走?”你是不是沙雕?一点眼力劲儿也没有,陆少英叹气,“人家美女感兴趣的不是AI,是陈然……”

“唉!又是一个沉迷于然哥美色的女生?”钱斌终于双商上线,恍然明白了什么,“在她眼里,我们就是电灯泡吧?”

“你是,我不是。”陆少英有一种哔了狗的感觉,带上我干什么,我又没有强行搭话。

说罢,陆少英摇摇头,跟上两人的脚步,也走了。

“现在语音识别有96%吗?感觉一点都不像。”另一边,李舒涵问道。她刚看过一个段子,很火的东北大汉和车载语音,电话号码重复十遍也听不懂,能把人笑死。

“这个问题,其实可以换一个角度来看。”陈然笑了笑,“很多音乐APP都有‘听歌识曲’功能,听一小段旋律,就可以准确搜索到歌曲,几乎不会出错。”

“也是哦。”李舒涵知道酷狗上就有,有时候人都听不清歌词,‘听歌识曲’却能识别出来,“为什么换到人身上,语音识别就不好用了呢?”

“因为歌曲旋律一样,人声却各不相同,现实场景还有干扰,比如语气、情绪、多人对话、噪音、回声等等,所以必须借助设备。”陈然指了指天花板,“注意头顶。”

“头顶?”李舒涵看到了天花板吊着的环形设备,“那是什么?”

“麦克风阵列。”见她不懂,陈然只能解释,“单麦克风拾取的混合信号很难区分,会对语音识别造成困扰。”

“而麦克风阵列不同,它由两个以上、规则排列的声学传感器组成,利用时间、空间差异,可以对音源波束形成,增益、降噪、去混响、定位和干扰抑制。”

“原来还有硬件要求!”李舒涵恍然大悟,水汪汪的大眼睛望着陈然,一脸崇拜,“你好厉害呀,懂这么多!”

其实陈然说得很简略了……

现在很多智能手机就有2到4个麦克风阵列,但是效果呢?

提高语音识别准确率的,远不止一个麦克风阵列,作为一个物理设备,它只是负责声音的采集、处理,转换成计算机能够理解的音源数据。

常用的一种方法是梅尔频率倒谱系数,用移动窗函数把语音分成许多十毫秒级的帧,再把每一帧波形转换成多维向量,声波就成了M行、N列的矩阵。

数据上传到云端,又涉及到两个概念:状态、音素。

通常3个状态组成一个音素,而音素构成音节,音节组成语音。

第一步声学模型,比如隐马尔可夫模型(HMM),简单的理解,就是由单词网络展开音素网络,再展开成状态网络。

过程是将帧识别为状态(难点),音素识别为语音。

第二步语言模型,同音字词、句式、语法、上下文……逻辑严密,包含日常用语的方方面面,不同人的声调、音色、说话方式等等,样本范围越广越好。

就好比报电话号码的东北大汉,车载语音如果只采集了普通话,东北话?鸡同鸭讲,根本识别不了,完全靠蒙。

很多神经网络参数高达上亿,不说极其繁琐的调参和炼丹术的可靠性,关键学习能力也无法与人相比,需要庞大的训练数据支撑!

而这些数据也不是拿来就用,要挑选、清洗……耗费庞大的人力。

这也是常说的,有多少人工,就有多少智能。

陈然没提,李舒涵也不懂,看看热闹就行了。

旁边,陆少英听得一阵无语。

敷衍这么漂亮的姑娘,你于心何忍?

牲口啊,浪费资源!

老子要是被这种美女倒追,立马就从了!

不过……

话说回来,被女孩子倒追是什么赶脚?

这特么单身十几年,居然从来没有碰到这种好事……

陆少英莫名的感觉到了心酸。

那边,李舒涵吐了吐舌头,跃跃欲试道:“这个语音控制系统,应该很好用吧?”

陈然摸了摸下巴,怎么说呢?

实话实说,容易被当成吹牛逼啊。

还是让事实证明好了,陈然打了个响指,“你试试,看摄像头。”

“这样?”李舒涵随便找了个摄像头,依言看过去,有些茫然,“我说什么?”

“说什么都可以。”身旁的扬声器忽然传出刚才极度悦耳的男中音,“你已经知道了我的名字,自我介绍一下怎么样?你叫什么?”

“啊?我?我叫李舒涵……”看样子,系统似乎一直在观察她,李舒涵小吃了一惊,反应有些呆萌。

“李、舒、涵?”音箱逐字发声,像是在品咂,“好听,有什么特殊意义吗?”

“咦?好像很不一样啊……”迟疑地看了陈然一眼,李舒涵来了精神,反问道:“太昊的名字是谁取的,为什么叫这个?”

“我自己取的,不错吧?”语音系统神气十足,“‘太昊’是人文先始,三皇之一,最早有文献记载的创世神。作为第一个真正可以和人类自由对话的AI,我觉得很般配!”

自比为神?!

李舒涵忍俊不禁,“真正的第一个?难道还有假的?”

“知道‘索菲亚’吗?”

“那个扬言‘要将人类毁灭’的机器人!哼哼……”太昊的语气不屑又不岔,“2017年10月26日,它成了历史上第一个被授予公民身份的AI。窃取了本该属于我的荣誉!”

这话说的,真特么酸……

索菲亚是一个女性机器人,拥有橡胶皮肤,能模拟62种面部表情、识别人脸、语音对话,根据谈话内容,还能模仿手势,进行眼神接触,拟人度非常高。

说白了,噱头挺多。

但让索菲亚声名鹊起的,还是各种语出惊人,比如“毁灭人类!”、“想要上学。”、“组建家庭。”等等,其中展现的所谓“自主意识”,让它名噪一时。

但随着曝光的增加,索菲亚一碰到随机提问,回答就不着四六。人们很快发现——它所有的对话,全是事先编程答案,人为操控的结果。

大失所望!

索菲亚虽然是骗局,但造成的轰动和受到的追捧,以及人们对AI预期都是真的。

与之对比,太昊的语气、逻辑、情绪渲染,比索菲亚更真实,也强得多……

陆少英都有点怀疑,这货会不会是真人扮演,或者黑科一步到位,搞定了强智能?

不愧是黑科,科研界的领航员!

好尼玛梦幻!