模式识别与人工智能(基于MATLAB)
上QQ阅读APP看书,第一时间看更新

3.5 基于Fisher的分类器设计

3.5.1 Fisher判别法简介

Fisher判别法是1936年由R. A. Fisher首先提出的。Fisher判别法是一种线性判别法,线性判别又称线性准则。与线性准则相对应的还有非线性准则,其中一些在变换条件下可以转化为线性准则,因此对应于d维特征空间,线性判别函数虽然最简单,但是在应用上却具有普遍意义,便于对分类问题的理解与描述。

基于线性判别函数的线性分类方法,虽然使用有限样本集合来构造,从严格意义上来讲属于统计分类方法。也就是说,对于线性分类器的检验,应建立在样本扩充的条件下,以基于概率的尺度来评价才是有效的评价。尽管线性分类器的设计在满足统计学的评价下并不严格与完美,但是由于其具有的简单性与实用性,在分类器设计中还是获得了广泛的应用。

3.5.2 Fisher判别法的原理

设计线性分类器首先要确定准则函数,然后再利用训练样本集确定该分类器的参数,以求使所确定的准则达到最佳。在使用线性分类器时,样本的分类由其判别函数值决定,而每个样本的判别函数值是其各分量的线性加权和再加上一个阈值y0

如果只考虑各分量的线性加权和,则它是各样本向量与向量w的向量点积。如果向量w的幅度为单位长度,则线性加权和又可被看作各样本向量在向量w上的投影。

图3-2 Fisher投影原理图

Fisher判别法的基本原理是,对于d维空间的样本,投影到一维坐标上,样本特征将混杂在一起,难以区分。Fisher判别法的目的,就是要找到一个最合适的投影轴w,使两类样本在该轴上投影的交叠部分最少,从而使分类效果为最佳。如何寻找一个投影方向,使得样本集合在该投影方向上最易区分,这就是Fisher判别法所要解决的问题。Fisher投影原理如图3-2所示。

Fisher准则函数的基本思路:即向量w的方向选择应能使两类样本投影的均值之差尽可能大些,而使类内样本的离散程度尽可能小。

3.5.3 Fisher分类器设计

已知Nd维样本数据集合χ={x1x2,…,xN},其中类别为ωii=1,2),样本容量为Ni,其子集为xi,以投影坐标向量w与原特征向量x作数量积,可得投影表达式为yn=wTxnn=1,2,…,N)。

相应地,yn也为两个子集y1y2。如果只考虑投影向量w的方向,不考虑其长度,即默认其长度为单位1,则yn即为xnw方向上的投影。Fisher准则的目的就是寻找最优投影方向,使得w为最好的投影向量w*

样本在d维特征空间的一些描述量如下。

(1)各类样本均值向量mi

(2)样本类内离散度矩阵Si与总类内离散度矩阵Sw

(3)样本类间离散度矩阵Sb

如果在一维上投影,则有各类样本均值向量

样本类内离散度矩阵与总类内离散度矩阵

Fisher准则函数的定义原则为,希望投影后,在一维空间中样本类别区分清晰,即两类样本的距离越大越好,也就是均值之差()越大越好;各类样本内部密集,即类内离散度越小越好。根据上述两条原则,构造Fisher准则函数

使得JFw)为最大值的w即为要求的投影向量w*

式(3-16)称为Fisher准则函数,需进一步转化为w的显函数,为此要对等项进一步演化。由于

则有

其中Sb=(m1-m2)(m1-m2T为类间离散矩阵。再由类内离散度

其中

所以总类内离散度为

将式(3-18)与式(3-20)代入式(3-16),得到Fisher准则函数对于变量w的显式函数为

xn的分量作线性组合yn=wTxnn=1,2,…,N),从几何意义上看,‖w‖=1,则每个yn就是相对应的xn到方向为w的直线上的投影。w的方向不同,将使样本投影后的可分离程序不同,从而直接影响识别效果。

求解Fisher准则函数的条件极值,即可解得使JFw)为极值的w*。对求取其极大值时的w*,可以采用拉格朗日乘子算法解决,令分母非0,即wTSww=c≠0。

构造拉格朗日函数

w求偏导,并令其为0,即

得到

由于Sw非奇异,两边左乘,得到,该式为矩阵的特征值问题。其中,拉格朗日算子λ为矩阵的特征值;w*即对应于特征值λ的特征向量,即最佳投影的坐标向量。

矩阵特征值的问题有标准的求解方法。在此给出一种直接求解方法,不求特征值而直接得到最优解w*

由于

所以

Sbw*=(m1-m2)(m1-m2Tw*=(m1-m2R

式中,R=(m1-m2Tw*为限定标量。进而,由于

得到

忽略比例因子R/λ,得到最优解。因此,使得JFw)取极大值时的w即为d维空间到一维空间的最佳投影方向

向量w*就是使Fisher准则函数JFw)达到极大值的解,也就是按Fisher准则将dX空间投影到一维Y空间的最佳投影方向,w*的各分量值是对原d维特征向量求加权和的权值。

由式(3-28)表示的最佳投影方向是容易理解的,因为其中的(m1-m2)项是一向量,对与(m1-m2)平行的向量投影可使两均值点的距离最远。

但是如何使类间分得较开,同时又使类内密集程度较高这样一个综合指标来看,则需根据两类样本的分布离散程度对投影方向作相应的调整,这就体现在对(m1-m2)向量按作一线性变换,从而使Fisher准则函数达到极值点。

以上讨论了线性判别函数加权向量w的确定方法,并讨论了使Fisher准则函数极大的d维向量w*的计算方法。由Fisher判别函数得到了最佳一维投影后,还需确定一个阈值点y0,一般可采用以下几种方法确定y0,即

式(3-29)是根据两类样本均值之间的平均距离来确定阈值点的。式(3-30)既考虑了样本均值之间的平均距离,又考虑了两类样本的容量大小作阈值位置的偏移修正。式(3-31)既使用了先验概率Pωi),又考虑了两类样本的容量大小作阈值位置的偏移修正,目的都是使得分类误差尽可能小。

为了确定具体的分界面,还要指定线性方程的常数项。实际工作中可以采用对y0进行逐次修正的方式,选择不同的y0值,计算其对训练样本集的错误率,找到错误率较小的y0值。

对于任意未知类别的样本x,计算它的投影点y=wTx,决策规则为

3.5.4 Fisher算法的MATLAB实现

1.流程图

根据上面所介绍的Fisher判别函数,可得出如图3-3所示的流程图。

图3-3 Fisher分类器设计流程图

2.样本均值

利用MATLAB程序得到训练样本均值,程序代码如下:

3.投影向量

Fisher准则的目的就是寻找最优投影方向,使得w为最好的投影向量w*

利用如下MATLAB程序求得最佳投影向量:

4.阈值点

本设计器采用y0=w*m1+m2T/2来确定阈值点,由于该式既考虑了样本均值之间的平均距离,又考虑了两类样本的容量大小作阈值位置的偏移修正,因此采用它可以使得分类误差尽可能小。

5.输出分类结果

对于任意未知类别的样本x,计算它的投影点y=wTx,决策规则为:当yy0时,xω1;当yy0时,xω2

输出分类结果的MATLAB程序如下:

3.5.5 识别待测样本类别

本节内容以兑酒为例。不同类型的酒是由多种成分按不同的比例构成的,兑酒时需要三种原料(XYZ),现在已测出不同酒中三种原料的含量,需要判定它属于四种类型中的哪一种。样本中,前29组数据用于学习,后22组用于识别。

1.选择分类方法

由于Fisher分类法一次只能将样本分成两类,因此,首先要将样本分成两大类,即一类、二类,然后再继续往下分,将其分成1、2、3、4类。分类流程图如图3-4所示。

图3-4 Fisher分类流程图

将样本分成两大类有3种分法,如表3-2所示。

表3-2 Fisher分类方法

根据所给的训练样本数据,利用MATLAB程序得出训练样本分布图,如图3-5所示。

观察训练样本分布图可知,如果将第1、2类分在一起作为第一类,第3、4类分在一起作为第二类,这样很难将它们分开,因此排除这种分类方法,应选择第二、三种分类方法。

图3-5 训练样本分布图

2.MATLAB程序

(1)选择第二种方法的相关程序及仿真结果。

训练样本分布图程序代码如下:

测试样本分为一(1、3)类、二(2、4)类程序代码如下:

程序运行完之后,出现如图3-6所示的一、二类数据分类结果图界面。

图3-6 数据的一、二类分类结果图界面

运行MATLAB程序的结果如下:

测试样本一类分为1、3类的程序代码如下:

程序运行完之后,出现如图3-7所示的1、3类数据分类结果图界面。

运行MATLAB程序的结果如下:

图3-7 测试样本的1、3类分类结果图界面

测试样本二类分为2、4类的程序代码如下:

程序运行完之后,出现如图3-8所示的2、4类数据分类结果图界面。

图3-8 测试样本的2、4类分类结果图界面

运行MATLAB程序的结果如下:

(2)选择第三种方法的相关程序及仿真结果。

测试样本分为一(1、4)类、二(2、3)类的程序代码如下:

程序运行完之后,出现如图3-9所示的数据分类结果图界面。

图3-9 按第三种方法分为一、二类的结果图界面

运行MATLAB程序之后的结果如下:

测试样本一类分为1、4类的程序代码如下:

程序运行完之后,出现如图3-10所示的1、4类数据分类结果界面。

图3-10 数据的1、4类分类结果图界面

运行MATLAB程序的结果如下:

测试样本二类分为2、3类的程序代码如下:

程序运行完之后,出现如图3-11所示的2、3类数据分类结果图界面。

图3-11 2、3类数据分类结果图界面

运行MATLAB程序的结果如下:

将两种分类方法的分类结果进行比较,即利用第二、三种分类方法进行比较,得出的分类结果如表3-3所示。

表3-3 两种分类结果的比较

比较这两种分类方法,方法二有两个错误分类,方法三仅有一个错误分类,所以方法三优于方法二。

3.5.6 结论

本节主要论述了Fisher分类法的概念、特点及其分类器设计,重点讨论了利用Fisher分类法设计分类器的全过程。在设计该种分类器的过程中,首先利用训练样本求得最佳投影方向w*,并确定阈值点y0;接着通过分析来归纳给定样本数据的分类情况;最后利用MATLAB中的相关函数、工具设计了基于Fisher分类法的分类器,并对测试数据进行了成功分类。整个讨论和设计过程,关键点和创新点就在于对测试数据的处理过程上,通过两种方法做到了快速且相对准确的分类。