深度学习原理与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 M-P模型

M-P模型是首个模仿生物神经元的人工神经网络模型,由美国心理学家麦卡洛克(Warren McCulloch)和数学家皮茨(Walter Pitts)于1943年共同提出。

一个神经网络模型通常包括网络结构、连接权重和学习能力这三个部分。如图3-2所示,在M-P模型中,有多个输入{xi|i=1, 2, …, n},经过运算,产生一个输出y。如图3-2(a)所示,运算部分包括加权累加和阈值判别两部分。M-P模型规定,输入输出信号都是二进制信号,即0或1。

每个输入乘以相应的连接权重,然后相加得到激活值。每个输入信号都有一个连接权重,表示该输入信号与其他输入信号相比较的重要程度,权重越大,表示输入值越重要。

与生物神经元类似,如果输入的激活值足够大,神经元就会被激活而处于兴奋状态,否则神经元就处于抑制状态。用数学表示就是,如果激活值大于阈值,即,神经元处于兴奋状态,此时的输出应该是“1”;如果激活值小于等于阈值,即,神经元处于抑制状态,此时的输出应该是“0”。

但是,由于可能是一个任意值,而不是M-P模型限定的0或1,因此,还需要一个被称为激活函数的函数对这个任意值作一个变换,使其输出值为0或1。由此可见,激活函数既是阈值的判别器,又是输出值的规范器。

M-P模型使用的激活函数是一个阶梯函数,如图3-2(b)所示,如果激活值大于阈值h,输出1,否则输出0。归纳起来的数学表示为:

图3-2 M-P模型

总结一下,整个模型用数学公式表示:

函数f()是激活函数,M-P模型选用的是阶梯函数,也称阈值型激活函数。

从这个模型中可以看出,阈值判别器是一个边界决策超平面,如果取值位于这个边界决策超平面之上,输出值为1,如果在边界决策超平面之下,输出值为0。

M-P模型可以实现NOT、AND和OR三种逻辑运算。下面来看M-P模型是如何完成NOT、AND和OR三种逻辑运算的。

如图3-3(a)所示,取w=−1, h=−0.5,

模型就实现了NOT运算。

如图3-3(b)所示,取w1=w2=1, h=0.5,

图3-3 M-P模型表示的逻辑运算

模型就实现了OR运算;

w1=w2=1, h=1.5,

模型就实现了AND运算。

但是,M-P模型无法实现异或XOR运算,即如果两个值不同,则结果为1,如果两个值相同,结果为0。

注意,在M-P模型中,参数wi, h只能事先人为设定,因此这个模型是没有学习能力的,也就是模型参数无法在运行过程中自动修正。