基于神经网络的电气火灾时间序列预测模型研究
杨舟
(中国人民武装警察部队学院研究生四队,河北 廊坊)
摘要:利用全国电气火灾时间序列资料,选择电气火灾发生起数、死亡人数、受伤人数、直接财产损失、烧损建筑、受灾户数为预测因子,构造预测因子指数,采用BP神经网络方法建立了电气火灾预测数学模型。应用所建立的模型和MATLAB软件对我国10年的电气火灾统计数据进行了拟合,并利用2012年数据对下一年电气火灾发生起数进行预测。结果表明该模型作为电气火灾起数随年份变化的曲线模型历史拟合率高达96.99%、模型预测准确率为76.78%,其性能指标符合实际要求,具有较好的实际应用价值。
关键词:电气火灾;时间序列;BP神经网络;预测模型
1 引言
随着我国城市化建设水平不断提高,国民生活得到极大地改善,电气化、自动化事业取得了显著性的成果。但是由于电气故障引发的火灾事故逐年递增所造成的人员和财产损失也是十分惊人的,为最大限度地减少电气火灾,人们逐渐将预测决策理论和方法引入火灾科学领域,以便更直观认识电气火灾发展趋势,在电气火灾突发时段、激增区域进行干预、遏制,减少损失[1]。因此,研究电气火灾预测模型,对减少我国火灾损失和提高电气灾害水平具有重要现实意义。
但是在电气火灾态势预测方面,国内研究相对较少,大都停留在基于数据统计的电气火灾特点、火灾规律分析上,主要的研究成果有:定性预测法、数理统计法、回归预测法和灰色预测法。上述方法易于操作,能够从多角度、多方面对电气火灾发生态势进行预测分析,但方法相对单一,适用范围、参考因素与预测结果也具有一定局限性。
2 BP神经网络预测方法
人工神经网络(Artificial Neural Networks,简称ANN),由于具有自学习、自组织、自适应的非线性映射能力,使其在联想记忆、非线性映射、分类与识别和预测分析上表现出较好的应用效果,常用于解决知识背景不清楚、要素信息复杂、推理规则不明确的问题。
根据神经网络学习规则、网络层次以及互联方式的不同,通常可将其分为感知神经网络、自组织神经网络、BP神经网络、线性神经网络、径向基神经网络、Hopfield神经网络等多种类型。其中BP神经网络是应用最广泛的预测模型。它是建立在神经元的基础上,由大量神经元组成的非线性自适应神经网络系统,表现出类似人脑的学习、归纳、推理和判断的特征,具有学习、记忆和计算以及智能处理功能,较好地解决了多层网络中隐含单元链接权的学习问题。在模型训练过程中可以通过改变阈值、权值、输入参量对模型进行优化,能够良好的适应电气火灾受多元因素影响、时序分布不均匀、突变等特点。
2.1 BP神经网络基本结构
BP神经网络是利用误差反向传播训练算法的神经网络,其人工神经元基本功能是:对每个输入信号进行处理以确定其强度(权值);确定所用输入信号的组合效果;确定其输出。另外可以给一个神经元模型加一个外部偏置,用以改变激活函数的网络输入。简化的BP神将网络结构图如图1所示[2]。
图1 BP神将网络模型
结构模型可描述如下。
设神经元k的输入向量为
Xk=(x1,x2,x3,…,xi)T
式中,xi(i=1,2,…,m),表示第i个神经元输入,是神经元k的多个输入之一,n表示输入神经元的个数。
输入神经元节点连接到神经元节点k的加权向量为
Wk=(w1k,w2k,w3k,…,wik)T
式中,wik(i=1,2,…,m)表示从第i个输入神经元街道到第k个输入神经元节点的加权值,即节点i与节点k之间的连接强度。
由此可得神经元k的输入加权和为
对于神经元k的阈值为bk,神经元k的输出状态为
其中f表达了神经元的输入与输出之间的非线性关系,称为激活函数,其作用就是将可能的无限域变换到一个制定的有限范围内输出。BP神经网络的转移函数采用sigmoid函数f(x)=1/(1+e-x)。
2.2 BP算法基本思路
BP算法基本思想对于样本集S=[(X1,Y1),(X2,Y2),…,(Xk,Yk)]中的样本,逐一计算出实际输出O和误差测度E,对样本集权值W(m)分别进行调整,重复这一循环直到误差测度小于所要求的误差范围,即∑Ep<ε[3]。
BP网络训练方法和步骤如下。
(1)设三层BP网络只有一个输出y,给定N个样本(xk,tj)(k=1,2,3…,N),输入节点xi,隐含层节点oj,输出节点yj。输入节点与隐层节点的网络权值为wji。
当输入第i个样本时,节点j的输入为:
节点j的输出为:
yj=f(netj)
式中,f是传递函数,为S型(Sigmoid function)函数。
(2)设期望输出为t1,隐层节点与输出节点的网络权值为v1j。
输出节点的网络输出:
输出节点误差为
正权值
式中,μ>0。
3 BP神经网络在电气火灾事故预测的应用
3.1 背景资料
本文以我国近十年全国电气火灾发生概况为研究背景,利用《中国消防统计年鉴》电气火灾统计数据相关资料,以我国2002~2011年全国电气火灾发生起数、死亡人数、受伤人数、直接财产损失、烧毁建筑、受灾户数为样本数据[4],具体如表1所示。
表1 全国电气火灾发生起数
3.2 因子的选取
预测结果的准确率不仅与预测方法的选择、预测模型的结构等有关,并且在一定程度上受预测因子的影响。因此,为了提高预测模型可靠性,选取的预测因子应选择具有显著物理意义、相关性强的要素。参照《中国消防统计年鉴》火灾统计方法归类方法,选择电气火灾发生起数、死亡人数、受伤人数、直接财产损失、烧损建筑、受灾户数六个因子组成预测因子集。为使各预报因子之间的量级差异归一,加入电气火灾在受概念自然、社会环境影响因素,故引入电气火灾预测因子指数概念,对应上一年份火灾发生总起数、总死亡人数、总受伤人数、直接财产损失总量、烧损建筑总数、受灾户数总数,对样本的因子进行数据处理,通过公式(1)使其标准化到[0,1]。
(1)
归一化结果如表2所示。
表2 预测因子指数
3.3 火灾起数预测模型训练
本文中选择2002~2011年的电气火灾数据作为BP神经网络的训练输入样本,选用2012年数据作为检验样本。选择上一年的火灾起数因子、死亡人数因子、受伤人数因子、直接财产损失、烧毁建筑因子、受灾户数因子神经网络的输入向量,第二年的火灾起数因子和直接财产损失因子作为神经网络的输出向量,该模型训练样本如表3所示。
表3 电气火灾预测模型训练样本
预测模型建立后,采取随机数多次赋值方法对网络的权值和阈值进行初始化,经多次实验,最终确定BP神经网络拓扑结构为6-25-1,隐含层传递函数“logsig”,输出层传递函数为“tansig”。网络所用的训练函数为“traingdx”,根据上述的预测模型,循环重复建立输入样本集。利用MATLAB神经网络工具箱函数进行网络训练和验证,网络训练步数设为10000次,训练精度设为0.0001,调整中间层个数得到最优化结果,得到网络输出如表4所示。
表4 电气火灾预测模型仿真输出向量
通过训练得出电气火灾预测序列数值,绘制出电气火灾发生起数历史拟合曲线图,如图2所示。从对图2的对比分析可以得出初步结论,BP神经网络对全国电气火灾发生其实时间序列有较好的预测效果。
图2 2003~2012年电气火灾发生起数、直接财产损失与预测模型拟合曲线
3.4 预测结果分析
根据误差计算公式,2002~2011年电气火灾发生起数拟合预测值与实测值的平均绝对值误差MAE=0.208,均方根误差RMSE=0.456,均方误差性能函数MSEREG=0.9028。2003~2012年电气火灾直接财产损失拟合预测值于实测值的平均绝对值误差MAE=0.147,均方根误差RMSE=0.383,均方误差性能函数MSEREG=0.9533[3]。
利用实测数据序列中抽出2011年样本作为预测模型试测输入检验结果,得到2012年电气火灾发生起数为37655起,电气火灾直接财产损失87104.91万元,2012年实际发生电气火灾起数49043起,电气火灾直接财产损失98747.2万元。
对比图2及2012年预测结果可以得出,该预测模型的电气火灾发生起数历史拟合率高达96.99%,模型预测准确率为76.78%;预测模型的电气火灾直接财产损失历史拟合率高达97.82%,模型预测准确率为88.21%,说明该预测模型具有一定实际意义和较好的应用价值。
4 结语
应用BP神经网络建立电气火灾时间序列预测模型,并对火灾发生起数进行预测,该预测模型对电气火灾发生趋势有比较理想的拟合和预测效果。对2003~2012年电气火灾进行仿真拟合,历史拟合率高达96.99%;对2013年电气火灾发生起数预测准确率达76.78%,具有很好的实际应用价值。
受限于现有统计数据,对于研究电气火灾预测因子的研究仍不完整,且各因子在电气火灾时间序列起何种作用,还有待于数值模拟和敏感性实验予以验证,这也将是今后工作中做预测时需要不断探索改进的。
参考文献
[1] 刘东海,嵇涛,高锦田,等.火灾统计问题的探讨.消防产品与信息,2005,(2):35-37.
[2] 李国勇.智能预测控制及其MATLAB实现.北京:电子工业出版社,2010:16-24.
[3] 李学桥,马莉.神经网络工程应用.重庆:重庆大学出版社,1996:37-44.
[4] 公安部消防局.中国消防年鉴(2003~2013).北京:中国人事出版社,2013.