数字图像处理与分析基础:MATLAB和VC++实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 数字图像处理与分析基础

1.1 视觉信息学概述

有句谚语“百闻不如一见”,就是说费尽口舌还不如一幅画一目了然。例如,单凭名字不能回忆起某人时,不妨翻看一下他/她的照片;仔细阅读某种机器设备的使用说明书之前,还不如先浏览一下其说明图表等。人类通过眼、耳、鼻、舌、身接收信息、感知世界,约 83%的信息来自我们的眼睛,即视觉,即使吃东西时也是如此。也许有人会认为吃东西时肯定是味觉占主导地位,实际上是眼睛首先看到食物的颜色和形状后刺激了我们的食欲。如果蒙上眼睛、塞住鼻子吃东西,我们甚至连自己吃的是什么都无法判断。曾经有人做过这样的实验,实验者被蒙上眼睛、捏住鼻子,然后分别喝橙汁和苹果汁,结果所有实验者都无法分辨自己喝的是哪种果汁。用同样的方法再做一个实验,实验者对于吃的是苹果还是生土豆也很难分辨。心理学上被称为“麦格克效应(McGurk effect)”的实验证明了人的听觉在很大程度上也受视觉的影响。可见,视觉是人类获取信息的最重要途径。既然如此,我们就需要研究与视觉信息的获取和处理等相关的学科。那么,哪些学科的概念和术语与此相关呢?下面就介绍几个重要概念和术语。

1.信息学(informatics)

信息学是研究信息的获取、处理、传递和利用的规律性的一门新兴学科。信息学是以信息为研究对象,以计算机等技术为研究工具,以扩展人类的信息功能为主要目标的一门综合性学科。

2.视觉信息(visual information)

人类视觉系统认识客观世界的过程是通过人眼获取有用的视觉信息,在大脑中形成图像,并对其进行加工、处理和转换,最终获得用以进行思维的抽象概念的一个信息处理过程。

3.视觉信息学(visual informatics)

视觉信息学是20世纪90年代初提出的一个学科概念,并于2009年11月在马来西亚首都吉隆坡召开了第一届视觉信息学会议Badioze Zaman H, Robinson P, Petrou M, et al. Visual Informatics Bridging Research and Practice. Springer-Verlag Berlin Heidelberg, Germany, 2009.。视觉信息学不仅包括信息学和计算机科学,而且包括工程信息学、虚拟技术与系统、医学和健康信息学及其教育等其他相关领域。它是综合运用数学、光学、计算机科学等基本原理及各种工具,对视觉信息进行有效提取、存储、传递、处理、分析和解释中出现和发展的各种新理论、新方法、新算法、新手段、新设备等进行综合研究和集成应用的一个新的统一框架。最近,它已成为计算机视觉、信息可视化、实时图像处理、虚拟现实、增强现实、表达视觉信息学、3D图形学、多媒体融合、视觉数据挖掘、视觉本体、视觉文化与服务等多学科交叉的领域。视觉信息学的内容非常丰富,覆盖范围广,主要包括作为视觉信息基础的图像的处理、分析和解释等相关的科学。

4.图像(image)

“图”是物体透射或反射光的分布,是客观存在的。“像”是人的视觉系统对图在大脑中形成的印象或认识,是人的感觉。图像信息(简称图像)是图和像的有机结合,既反映物体的客观存在,又体现人的心理因素;它是客观对象的一种可视表示,包含了被描述对象的有关信息。根据空间坐标和幅度(亮度或色彩)的连续性,图像可分为模拟图像和数字图像。

5.模拟图像(analogue image)

模拟图像也称光学图像,是空间坐标和幅度都连续变化的图像。

6.数字图像(digital image)

把空间坐标和幅度均用离散的数字(一般是整数)表示的图像,称为数字图像,本书中所涉及的图像都是数字图像,以下简称为图像。图像中每个基本单元叫做图像元素,简称像素(pixel)。根据抽象程度和研究方法等的不同,对数字图像的研究主要分为三个层次:图像处理、图像分析和图像理解。

7.图像处理(image processing)

图像处理主要指数字图像处理或计算机图像处理,即利用计算机对图像信息进行加工处理,以满足人的视觉心理需要和实际应用或某种目的的要求。图像处理着重强调在图像之间进行的变换,输入和输出的都是图像,包括图像采集和获取、图像增强、图像平滑、图像锐化、几何变换、图像编码、图像复原等。

8.图像分析(image analysis)

图像分析主要针对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。输入的是图像,输出的是特征。它包括图像分割、边缘检测、形态学图像处理、特征选择、彩色图像处理纹理分析、频率变换等。

9.图像理解(image understanding)

图像理解的重点是在图像分析的基础上进一步研究图像中各个目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。输入的是图像,输出的是知识。它包括图像识别、图像融合,以及利用小波变换、神经网络、遗传算法、数字水印、光谱分析、X 射线、视频、遥感等新理论、新工具、新技术实现图像的视觉认知、知识表达和更深层理解。

伴随着近年来的技术进步,计算机逐渐成为我们生活中不可或缺的东西。其中用计算机处理图像信息的视觉信息学也得到了迅速的发展和广泛普及。

该学科经过了以下发展历程。

① 20世纪20年代:图像远距离传输。

② 20世纪40年代:数字计算机的出现使数字图像处理成为可能。

③ 20世纪50年代:数字计算机发展到一定水平,但主要还是用于数值计算,满足不了处理大数据量图像的要求。

④ 20世纪60年代中期:美国喷气推进实验室用计算机对“旅行者七号”太空船发回的大批月球照片进行处理。

⑤ 20世纪60年代末至70年代初:数字图像处理开始应用于医学图像、地球遥感监测和天文学等领域。数字图像处理较完整的理论体系已形成,成为一门新兴学科。

⑥ 20世纪70~80年代:随着离散数学理论的创立和完善,数字图像处理的理论和方法进一步完善,1976年第一本数字图像处理专著问世Rosenfeld A, Kak AC. Digital Picture Processing. Academic Press, 1976.。20世纪80年代,随着三维图像设备和处理系统等硬件的发展,人们不仅可以处理二维图像,也开始处理三维图像。

⑦ 20世纪90年代至今:数字图像处理向更高级的方向发展,包括实时性、智能化、普及化、网络化和低成本。20世纪90年代初视觉信息学的学科概念被提出,这个学科概念为图像科学发展过程中出现的各种新理论、新方法、新算法、新手段、新设备等的综合研究和集成应用提供了一个新的统一框架。

图像有各种各样的形式,图1-1对各种图像进行了分类,总体上可分为动态图像(运动图像、视频)和静态图像(静止图像)。根据处理图像的种类、处理精度、处理速度选择适当的处理方法。

图1-1 图像分类

另外,现在电视机的显像管已成为个人计算机的显示器,反过来在个人计算机显示器上也可以观看电视节目。这使得拍摄图像的环境越来越复杂,图 1-2 给出了一些示例,不过模拟世界的电视机已经吸收了数字化技术和计算机技术,开始了全数字化的数字电视广播。打字机也从原来只能处理文字和灰度图像发展到能够处理真彩色的动态图像。计算机图形学(computer graphics)与图像处理(image processing)是分别发展起来的技术,但是它们相互作用、共同成长,现在已经很难把它们严格区分开来,虚拟现实技术就是两者高度结合的产物。

图1-2 拍摄图像的环境