徐华1 ,赵军2
(1.宁夏大学 数学与计算机学院,宁夏 银川 750000;2.宁夏大学 经济与管理学院,宁夏 银川 750000)
摘要:提出了一种基于遗传算法优化的BP神经网络工业经济运行指标的预测方法,用遗传算法来优化BP神经网络各连接层的权值和阈值,用训练好的BP神经网络模型来预测工业经济运行指标以求得最优解。以工业经济运行指标工业总产值为例,将该遗传BP神经网络模型应用到工业总产值和工业用电量的预测中,并与BP神经网络预测模型进行了对比。由结果可知,该模型对工业经济运行指标趋势的判断和预测更加准确,可为宏观决策提供可靠的依据,促进工业经济能够健康可持续发展。
关键词:工业经济;运行指标;遗传算法;BP神经网络
0引言
近年来,宁夏工业经济运行情况不断下滑,同时节能减排的任务压力增加。为保持工业经济能够平稳增长,同时把控工业经济运行的情况,就需要分析和预测全区工业经济运行趋势,为此需要对核心经济指标做出科学、准确的预测,从而可以反映出经济发展的走势,为分析判断、制定计划提供参考。目前,对工业经济指标的预测主要有定性分析、数量经济学和神经网络等研究方法[12]。在这些预测模型中,定性分析主要依靠经济研究者的经验积累;数量经济学研究方法主要是建立数学预测模型,有诸多的限制和假设。目前,BP神经网络预测模型是预测效果相对较好的一种。但该模型有两个明显的不足:一是容易陷入局部极小值;二是收敛速度慢[3]。为避免上述问题,本文利用遗传算法优化的BP神经网络(遗传BP神经网络)预测模型对工业经济运行指标做出预测。
遗传算法(Genetic Algorithm,GA)由美国Michigan大学的J.Holland教授首先提出。遗传算法通过模拟自然界中的繁殖、交叉和突变现象,按照某一适应度函数从每一代种群中选择一组候选染色体,让其进行交叉和变异以产生新一代种群,反复迭代,在此过程中个体的适应度不断提高,直到满足一定的条件[4],是一种针对生物进化过程提出的算法,此算法不仅适应性强而且鲁棒性高。其特点主要表现在:(1)演化是概率性的,因此,搜索过程很难达到局部最优;(2)采用自然进化机制,充分利用适用度函数提供的信息;(3)易于和局部搜索算法相结合,进而构造更加高效的混合策略搜索算法;(4)演化计算具有并行性 [5]。另外,演化计算具有自适应性,能够自发学习环境特性与规律。基于遗传算法的特点和BP神经网络的不足,本文提出了遗传BP神经网络预测模型对工业经济运行指标进行预测。该模型首先根据工业经济运行指标预测时输入输出的参数个数来确定BP神经网络的拓扑结构,然后用遗传算法对BP神经网络各层连接的权值和阈值进行优化,将利用遗传算法得到的最优个体的值作为BP神经网络权值和阈值的初始值,用此初始值初始化BP神经网络模型,之后训练,以得到最优解。用遗传算法来优化BP神经网络模型能有效地解决BP 神经网络易陷入局部极小值、收敛速度慢的问题。
1BP神经网络预测模型
经济分析预测是一门艺术,要准确地判断经济运行中的各种指标未来的发展趋势,才能有效地预测经济的发展。许多学者对预测模型进行了研究,在目前诸多预测模型中,BP神经网络模型是应用最广泛的神经网络模型之一[6]。它根据实际的输入与输出数据来计算模型的参数,通过误差反传算法[7]来持续调整BP网络各层的权值和阈值,使模型的误差平方和达到最小。3层BP神经网络的拓扑结构如图1所示,由输入层、隐含层和输出层组成,每个层中包含多个神经元。
图13层BP神经网络拓扑结构在该BP神经网络模型中,设输入层的节点数为n,隐含层的节点数为p,输出层的节点数为m。在本文对工业经济运行指标的预测中取输出层节点数m=1,则BP神经网络完成映射f:Rn→R1,其隐含层各节点的输入为:Rj= f1(∑ni = 1wkixi-θj)(j=1,2,…,p),其中wki是输入层到隐含层的权值;θj为隐含层节点的阈值。输出层节点的输入为:C=∑pk=1vjkzj-γ,其中vjk为隐含层到输出层的权值;γ为输出层的阈值。BP神经网络采用Sigmoid转移函数f(x)=1/(1+e-x),则隐含层节点的输出为:Oi=11+exp(-∑ni=1wkixi+θj)(j=1,2,…,p),同理,输出层节点的输出为:
BP 神经网络的连接权值 wki、vjk和阈值θj、γ可由BP神经网络训练求得,式(1)即为BP神经网络的预测模型。BP神经网络先将各层的权值和阈值随机赋值为[0,1]之间的任意值,然后进行训练。这样会使BP神经网络在训练过程中出现收敛速度慢、很难达到最优解的问题。由遗传算法的特点可知,若采用遗传算法对BP神经网络模型的初始权值以及阈值分布进行优化,可提高BP神经网络模型的预测精度。
2遗传BP(GA-BP)神经网络预测模型
工业经济运行指标BP神经网络预测模型通过神经元之间的信息传递和误差逆传播来实现经济指标的预测。BP神经网络采用误差反传算法,这种算法实质上是一个无约束、非线性和最优化的计算过程。当有较大的网络结构时,这种算法计算时间长,很容易收敛于局部极小值点,从而无法达到最优解,影响了BP神经网络解决问题的能力。遗传算法具有全局搜索能力,能有效地解决局部极小值的问题。于是提出遗传BP神经网络预测模型,它以历史数据为网络训练样本,最终得到的输出为综合预测状态值。用遗传BP神经网络建立宁夏工业经济运行指标预测模型,可提高在工业经济运行中经济指标的预测精度,根据预测的走势更好地制定相应的法规和政策以对经济实体进行宏观调控。
遗传算法不依赖于问题的具体领域,直接在解空间进行搜索以求得最优解,具有很强的鲁棒性。通过遗传算法能使BP神经网络各连接层的权值、阈值在预定的进化次数内得到最优解,从而提高BP神经网络处理问题的能力。遗传BP神经网络预测模型的流程图如图2所示,其主要步骤有:
(1)选择编码方式。在这里编码的对象是权值和阈值。因权值和阈值都是实数,为避免编码过长和解码频繁,故选择实数编码[8]。编码的长度由图1中的BP神经网络结构决定,编码串的顺序也按照图1中从输入到输出的顺序排列。
(2)选择操作。采用赌轮法选择算子,即个体被选中的概率与适应度函数成正比。选择的概率为[9]:pi=fi∑pi=1fi (fi=1fit,i=1,2,…,p),式中,p为种群的规模。
(3)交叉操作。由于用实数编码方法对对象编码,所以这里交叉操作的方法也应用实数交叉法。第 m个基因 φm和第n个基因 φn在 k位的交叉操作为:
φmk=φmk(1-θ)+φnjθ
φnk=φnk(1-θ)+φmkθ
式中,θ是[0,1]间的随机数。
(4)变异操作。选取第i个个体的第l个基因进行变异,则:
式中,φmax为基因φil取值的上界,φmin为基因φil取值的下界;r 为[0,1]间的随机数;r2为一个随机数;g为当前迭代次数;Gmax为最大进化代数。
(5)计算适应度。设网络训练输出值为i,以训练误差的平方和作为个体的适应度,则每个个体ti的适应度定义为:fit=∑(i-oi)2(i=1,2,…,p),平均适应度定义为:=∑pi=1fitiP,式中,i为训练输出值,oi为训练输出期望值,P为种群规模。
(6)利用遗传算法优化的权值和阈值对BP神经网络预测模型进行训练,得到所求预测问题的最优解。
3实验
根据经济指标的选取原则即经济指标应具有重要性、灵敏性、及时性和可操作性等[10],以及宁夏自治区经信委提供的宁夏工业经济运行情况,以工业经济指标工业总产值和工业用电量为例,应用遗传BP神经网络和BP神经网络预测模型对其预测。通过提供基于数据的预测模型来辅助决策,可以提高宁夏地方政府工业经济运行分析能力,为宁夏地方政府工业经济运行的科学预测提供辅助决策。表1是宁夏2001~2014年的工业总产值。
选取2001~2010年工业总产值的发展状况作为训练样本,2011~2014年工业总产值的发展状况作为检验样本。分别用BP神经网络预测模型与遗传BP神经网络预测模型对工业经济运行指标工业总产值进行预测,结果如表2所示。BP和遗传BP(GABP)神经网络模型的工业总产值预测如图3所示。从表2和图3可以看到,遗传BP神经网络模型预测结果更接近于实际值。
表3为宁夏2005~2014年的工业用电量。选取2005~2011年工业用电量的发展状况作为训练样本,2012~2014年工业用电量的发展状况作为检验样本。分别用BP神经网络预测模型与遗传BP神经网络预测模型对工业经济运行指标工业用电量进行预测,结果如表4所示。BP和遗传BP(GABP)神经网络模型的工业用电量预测如图4所示。从图中可以直观地看到,遗传BP神经网络模型预测结果更接近于实际值。
4结论
本文针对在工业经济运行指标预测中BP神经网络模型存在易陷入局部极小值、收敛速度慢等问题,提出了遗传BP神经网络预测模型,并与BP神经网络预测模型进行了比较。实验结果表明,遗传算法优化的BP神经网络模型的预测结果更接近于实际值,提高了预测的准确度。实际上工业经济运行指标是一个非常复杂的问题,很难对其进行准确预测。在宁夏工业运行数据基础上运用遗传BP神经网络建立模型,通过持续学习,提高了宁夏工业经济运行的预测准确度,有一定的适用性,但仍需根据实际运行状况来进行验证。
参考文献
[1] 赵春标. 工业经济监测预测模型的研究与应用[D]. 合肥:合肥工业大学,2012.
[2] 朱蓉华. 工业经济运行监测系统的建设研究[J]. 电子政务,2011(4):2125.
[3] 贺国光,李宇,马寿峰. 基于数学模型的短时交通流预测方法探讨[J]. 系统工程理论与实践,2000,20(12):110112.
[4] 唐明. 短时交通流特性及其预测方法研究[D]. 长沙:长沙理工大学,2004.
[5] TANG H,WU E X. MRI brain image segmentation by multiresolution edge detection and region selection[J]. Computerized Medical Imaging and Graphics,2000,24(9):349357.
[6] CHEN H,GRANT MULLER S. Use of sequential learning for shortterm traffic flow forecasting[J].Transportation Research,2001,9(5):319336.
[7] 李松,罗勇,张铭锐. 遗传算法优化BP神经网络的混沌时间序列预测[J]. 计算机工程与应用,2011,47(29):5255.
[8] MONTANA D J, DAVIS L. Training feed forward neural networks using neural networks and genetic algorithm[C]. Proc. of International Conference on Computing, Communications and Control Technologies, Austin, USA, 1989: 762767.
[9] 张良均,曹晶,蒋世忠. 神经网络实用教程[M]. 北京:机械工业出版社,2008.
[10] 王敏,周博,李阳. 北京工业经济运行监测预警指标体系的构建[C]. 北京市统计学会:北京市第十五次统计科学讨论会获奖论文集,2009:189190.