2.1 图像与人类视觉的关系
图像在人类对外部世界的感知中起着最重要的作用并不令人奇怪,因为视觉系统是人类具备的感官系统中最高级也是最复杂的,但人类视觉被限制在电磁波波谱的可见光波段,无法像某些动物(比如猫科动物、爬行动物等)一样可以感知到热红外等波段。如下将简要介绍人类视觉系统模型及其感知特性。
2.1.1 人类视觉系统模型
人类视觉系统的结构是十分完备和极其复杂的。视觉是一个根据图像发现周围景物中有什么物体和确定物体在什么地方的过程,即视觉器官“眼睛”接收外界的刺激信息,大脑对这些信息通过复杂的机理进行处理和解释,使这些刺激具有明确的物理意义,进而从图像中获得和观察者相关的场景符号描述的过程。因此,可以说视觉感知是一个有明确输入和输出的信息处理过程。
人的视觉系统由眼球、神经系统及大脑的视觉中枢构成。具体的人眼视觉过程如图2.1所示。
图2.1 人眼视觉感知过程
人眼接收电磁波谱中的可见光波长在380~780nm之间,具有不同波长和强度的光线刺激人眼,经眼部的光学系统在视网膜形成外界物体不同的物像。视网膜是眼睛最里面的膜,它布满了整个后部的内壁。其表面分布的分离光接收器由锥状体和杆状体组成。锥状体形成锥状视觉,称为白昼视觉或亮度视觉。利用锥状视觉,人类可以充分地分辨出图像的颜色和细节信息。杆状体产生杆状视觉,称为夜视觉或暗视觉,可以得到视野内场景的总体图像。杆状体无彩色视觉,低照明度下对图像较敏感。因此,在白天呈现鲜明色彩的物体,在月光下却没有色彩,但是人眼能感觉到物体的轮廓。视网膜将物像的光能转换并加工成神经活动,经由视神经将活动传入视觉中枢,在人脑中产生不同的光强、色彩、形状等感觉与感受。
人类视觉系统(Human Visual System,HVS)相当复杂,并且关于这方面的认识非常有限。目前,人们通过研究认为人类的视觉感知有三个基本的特性,即视觉非线性特性(Weber定律)、视觉敏感度带通和多通道特性及掩盖效应。
人眼的感知亮度与所感知的场景实际亮度呈对数关系,即视觉非线性特性是Weber定律描述的基本内容。而视觉与对比度的关系用视觉系统的对比度敏感度函数CSF(Contrast Sensitivity Function,CSF)来表示,或称为人眼视觉系统空间调制转移函数MTF(Modulate Transform Function,MTF),简称为MTF过程。不同实验所得的CSF函数形式各异,但基本上都认为HVS的对比度敏感性是空间频率(正弦波光栅相邻两黑线条之间的距离称为空间周期,单位距离内所包含的空间周期数可称为空间频率。)的函数,且具有带通滤波器性质。对于静态灰度图像来说,图像的多通道特性可以由它的空间频率和方向性来表征,只要用足够多的适当的调谐部件,图像在视觉皮层的整个方向带和频率带都可以被完全覆盖,即可以完全模拟视觉系统的多通道。
CSF解释了对单一视觉激励的感知,一个激励单独存在时,人类视觉是很容易辨识的。几个激励同时存在时,激励间会产生相互作用,一个激励的存在将导致另一个激励探测阈值的改变,或由于另一个激励的存在导致它完全不能或者不容易被检测到,即被掩盖了,这种现象称为掩盖效应。在描述多通道中激励之间的相互作用时,掩盖效应是必须考虑的。激励可见度与激励所在地方的平均背景亮度有关的掩盖效应,称为对比度掩盖效应。此外,还有一种纹理掩盖效应,它是指由于背景亮度在空间或时间上的非均匀性所导致的可见度阈值的改变。据研究,大多数图像都包含复杂而不均匀的亮度背景,且在有较大亮度变化的区域和具有丰富活动性的区域,其可见度阈值增大。
除了上述三个基本特性外,还有一些与视觉现象密切相关的特性,如马赫带效应(Mach bands Effect)是马赫在1865年首先描述的。如果一幅图像一边暗一边亮,中间的过渡是缓慢斜变的,当我们观看这样的图像时,视觉会自然地产生亮的一边更亮,暗的一边更暗,同时靠近暗的一边的亮度比远离暗的一边要亮,而靠近亮的一边比远离亮的一边显得更暗的感觉。这种主观亮度和实际亮度不一致的情况称为马赫带效应。产生马赫带效应的原因是HVS的空间频率响应在较低的空间频率处,人眼视觉灵敏度并非随空间频率升高而下降,而是存在一个极大值,即在某一较低的空间频率处,视觉灵敏度最高。因为该空间频率成分被视觉强调突出,所以该空间频率成分出现在亮区就显得更亮,出现在暗区则显得更暗。因此,马赫带效应是图像亮度变化边界处的一种主观锐化效应。图2.2为马赫带效应示意图。
图2.2 马赫带效应示意图(见文后彩插)
2.1.2 视觉空间分辨率及感知特性
通过研究发现,人类视觉的空间分辨率(在空间上能区分相邻点的最小角距离称为极限分辨角,而其倒数被称为人眼分辨力。)具有以下一些特点。
①由于人眼的视锥细胞在黄斑区分布最密,因此,人眼对图像边缘、轮廓信息的变化很敏感。
②人眼对图像纹理细节的灵敏度与它所处的背景亮度有关,对高亮度和低亮度背景中的纹理细节人眼灵敏度较低,而对中高亮度背景中的纹理细节灵敏度较高。
③人眼对不同方向的图像细节信息具有不同的灵敏度,对水平方向和垂直方向上的细节灵敏度大于其他方向上的灵敏度。
④当视觉目标运动速度加快时,人眼视觉的空间分辨率会降低。
⑤人眼对彩色细节的分辨能力比对亮度细节的分辨能力差。
除了上述描述的视觉特性外,通过研究也发现了人类视觉感知物体的一些具体特点。
①相位特性:人眼对相位角的变化要比对模的变化敏感(人眼视觉可由光学传递函数描述,其包括调制传递函数和相位传递函数。相角由相位传递函数确定,不影响像的清晰度;而模由调制传递函数确定)。
②方向特性:人眼对倾斜方向的变化要比水平和垂直方向的变化敏感度低。
③形状特性:通常细长的形状比圆形更有吸引力。
④位置特性:眼睛跟踪实验表明,观测者的眼睛大多直接看到的是图像中间1/4的区域。
⑤前景/背景特性:观测者更多被前景而不是背景吸引。
⑥人物以及特定目标:很多研究表明人们更多把注意力投向场景中的人物,特别是他们的脸庞和眼睛。
⑦区域大小:区域的大小也是影响注意力的一个重要因素。较大的区域通常更容易得到关注,也可以说人类观察场景时首先是对场景的总貌进行感觉的。