深度学习与神经网络
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2.1 基本神经元模型

为了便于形式化表达,上述假定可用如图2-1所示的神经元的非线性模型表示。

图2-1 神经元的非线性模型

下面给出神经元非线性模型的3种基本元素。

(1)突触,用其权值标识。在神经元k的突触j上的输入信号xj乘以k的权值wk j中,第一个下标指输出神经元,第二个下标指权值所在的突触输入端。人工神经元的突触权值有一个范围,可以取正值,也可以取负值。

(2)加法器,用于求输入信号被神经元的相应突触权值加权的和。这个操作构成一个线性组合器。

(3)激活函数,用来限制神经元的输出振幅。由于它将输出信号压制(限制)为允许范围内的一个定值,所以激活函数也称为压制函数。通常,一个神经元输出的正常幅度范围可写成闭区间[0,1]或[-1,1]。

在图2-1中,bk表示外部偏置,根据其参数的正负性,增大或减小激活函数的网络输入。

m个输入信号分别用x1x2,…,xm表示,它们对应的神经元k的突触权值依次为wk1wk2,…,wkm,所有的输入及对应的连接权值分别构成输入向量X和连接权向量W

神经元k可以由式(2-3)和式(2-4)表示:

若将式(2-3)写成向量形式,则有

其中,uk为输入信号的线性组合器的输出;bk为阈值;φv)为激活函数;yk为神经元输出信号。

阈值bk的作用是对神经元模型中的线性组合器的输出uk做仿射变换(见图2-2):

图2-2 阈值产生的仿射变换

特别地,根据bk的正负性,神经元k的诱导局部域vk和线性组合器的输出uk的关系如图2-2所示,当bk=0时,vk=uk

bk是人工神经元k的外部参数。可以像在式(2-4)中一样考虑它。同样,可以结合式(2-3)和式(2-6)得到如下公式:

在式(2-7)中,相当于加了一个新的突触,输入是x0=1,突触权值是wk0=bk