3.1 自动识别技术概述
自动识别技术是一种高度自动化的数据采集技术,它是以计算机技术和通信技术为基础的综合性科学技术,是信息数据自动识读、自动输入计算机的重要方法和手段。自动识别技术已经广泛应用于交通运输、物流、医疗卫生和生产自动化等领域,从而提高了人类的工作效率,也提高了机器的自动化和智能程度。
3.1.1 自动识别技术的分类
自动识别技术是一种机器自动数据采集技术。它应用一定的识别装置,通过对某些物理现象进行认定或通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并通过特殊设备传递给后台数据处理系统来完成相关处理。也就是说,自动识别就是用机器来实现类似人对各种事物或现象的检测与分析,并做出辨别的过程。在这个过程中,需要人们把经验和标准告诉机器,以使它们按照一定的规则对事物进行数据的采集并正确分析。
自动识别技术的标准化工作主要由国际自动识别制造商协会(Association for Automatic Identification and Mobility,AIM Global)负责,中国自动识别技术协会(AIM China)是AIM Global的成员之一,其业务领域涉及条码识别技术、卡识别技术、光字符号识别技术、语音识别技术、射频识别技术、视觉识别技术、生物特征识别技术、图像识别技术和其他自动识别技术。
识别就是对有关事务进行归类和定性。自动识别技术根据所获取的识别信息的确定性可分为两大类:数据采集技术和特征提取技术。两者的区别是,数据采集技术需要特定的载体存放信息,而特征提取技术则是根据事物本身的行为特征来判决信息。
1.数据采集技术
数据采集技术的被识别物体具有确定的识别信息,这些信息存放在特定的识别特征载体上,如条码、电子标签等。数据采集技术只要读取载体上的信息,就能自动识别物体。按照信息存储的媒介类型,数据采集技术可分为光存储、磁存储和电存储几种。
1)光存储识别技术有条码识别、二维码识别,以及光标读卡机对答题卡的识别等。
2)磁存储识别技术有磁条、非接触磁卡、磁光存储和微波信号识别等。
3)电存储识别技术有射频识别、IC卡识别等。
2.特征提取技术
特征提取技术是根据被识别物体本身的生理或行为特征来完成数据的自动采集与分析,如语音识别和指纹识别等。按特征的类型,特征提取技术可分为以下几种。
1)静态特征,如指纹、虹膜、面部和光学字符识别(OCR)等。实际上条码识别、二维码识别等本质上也是一种静态特征提取技术,把它们归为数据采集技术的原因是,它们的特征是非自然的,是人为规定的有规律的图像,而且需要特定的载体呈现这些图像。
2)动态特征,如语音、步态、签名和键盘敲击等。签名本身是一种静态特征,如果考虑到书写的笔画顺序、力度等,则识别结果更为精准。
3)属性特征,如化学感觉特征、物理感觉特征、生物抗体病毒特征和联合感觉系统。
特征提取技术实际上是模式识别技术在自动识别领域的应用。模式识别就是对语音波形、地震波、心电图、图片、文字、符号及生物传感器等对象的具体特征进行辨识和分类,主要应用于图像分析与处理、语音识别、通信、计算机辅助诊断及数据挖掘等领域。
3.1.2 自动识别系统的构成
自动识别系统具有信息自动获取和录入功能,无须手工方式即可将数据录入计算机中。自动识别系统的一般模型如图3-1所示。
图3-1 自动识别系统的一般模型
对于基于数据采集技术的自动识别系统,如条码识别、IC卡识别等,由于其信息格式固定且有量化的特征,因此其系统模型也较为简单,只需将图中的信息处理模块对应为相关的译码工具即可。
若输入信息为包含二维图像或一维波形等的图形图像类信息,如指纹、语音等,由于该类信息没有固定格式,且数据量较大,需要采用模式识别技术进行特征提取和分类决策,故其系统模型较为复杂,可抽象为如图3-2所示的模型。实际上这也是模式识别系统的模型框架,模式识别就是对表征事物的各种信息进行处理和分析,以对事物进行描述、辨认、分类和解释。
图3-2 基于特征提取的自动识别系统模型
基于特征提取的自动识别系统一般由数据采集单元、信息预处理单元、特征提取单元和分类决策单元构成。数据采集单元通常通过传感技术实现,通过传感器获取所需数据。信息处理单元是指信息的预处理,目的是为了去除或抑制信号干扰。特征提取单元则是提取信息的特征,以便通过相关的判定准则或经验实行分类决策。