神经网络的本质范文
时间:2024-04-12 15:48:51
导语:如何才能写好一篇神经网络的本质,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:边坡;自组织映射神经网络;BP神经网络;权值
中图分类号:TU753.8
文献标识码:B
文章编号:1008-0422(2008)05-0157-03
1引言
自从上世纪80年代以来,神经网络技术已经得到了长足的发展。运用强大的神经网络功能,可以对许多难以解决的问题求解。BP网络现在已经广泛应用于工程的各方面[1],但是由于其自身的缺点,也存在很多问题。对于边坡工程,由于测量手段、仪器、人的主观性等原因,得出的数据不可避免的具有干扰性[2],即用于训练神经网络的学习数据存在很大的噪声,影响网络的推广及泛化能力[3]。
为了解决工程数据样本在进行网络计算时噪声较大的问题,本文阐述了一种新的方法,即:首先将边坡样本的数据归一化到[-1,1]区间,实现对样本的“奖优罚劣”;然后利用自组织映射(SOM)神经网络对各学习样本数据进行分类,优化BP网络的初始状态,从而有利于适度控制BP网络求解的误差范围。
2SOM网络过程的推导
自组织竞争的主要目的是将任意维数的输入信号模式转变为一维或二维的离散映射,并且以拓扑有序的方式自适应实现这个转变[4]。本文采用Kohonen模型推导适合用于工程样本分类的自组织竞争神经网络结构。
2.1 竞争过程
令m表示输入数据的维数。从输入空间中随机选择输入模式记为
(1)
网络中每个神经元的突触权值向量和输入空间的维数相同。神经元j的突触权值向量记为
(2)
其中是网络中神经元的总数。这里假定所有的神经元有相同的阈值;阈值是偏置取负。在通过选择具有最大内积WjTX的神经元,确定兴奋神经元的拓扑邻域中心的位置。
因为基于内积WjTX最大化的最优化匹配准则在数学上等价于向量X和Wj的Euclid距离的最小化。用标号i(x)表示最优匹配输入向量x的神经元,可以通过下列条件确定i(x):
(3)
2.2 合作过程
设hj,i表示以获胜神经元i为中心的拓扑邻域,设di,j表示在获胜神经元i和兴奋神经元j的侧向距离。它们必须满足的条件为:
1) 当di,j=0时,hj,i达到最大值;
2) hj,i随di,j绝对值的增加而单调递减;
3) di,j∞,hj,i= 0。
本文选取高斯函数满足以上条件,即:
由于对工程样本的划分采用一维模式即可,这里假定di,j是整数,而且有:di,j = | j - i |。
som算法中hj,i的宽度σ是随时间的推移而收缩的,这里设定一个指数函数来描述这一衰减过程:
其中σ0是σ的初值,τ1是时间常数。将式(4)代入式(5)中可得:
2.3 自适应过程
由Kohonen模型可知网络中神经元j的权值向量表示为:
式中:η是算法的学习率;g(yj)是响应yj的正的标量函数;wj是神经元j的突触权值向量。
这里将g(yj)设定成一个线性函数以简化计算:
将式(7)和式(8)代入式(9)可得:
由此可得更新权值向量wj(n+1)为:
为了得到更好的网络性能,可以将学习率函数η(n)设定成时变形式,这也是它用于随机逼近的要求。η(n)和hj,i一样,从初始值开始,然后随时间n增加而逐渐递减。因此将它设定为一个指数函数:
其中τ2是另外一个时间参数。
3自适应过程的排序和收敛
根据式(11),可以把网络权值的自适应分解为排序和收敛两个阶段。要求对上述公式中的参数进行合适的设定。
3.1排序阶段
3.1.1学习率函数η(n)初始值η0=0.1;然后递减,但应该大于0.01;并设定时间常数τ2=1000。
3.1.2邻域函数hj,i (n)的初始化应包括以获胜神经元i为中心的所有神经元,然后随时间慢慢收缩。这里通过设定时间常数τ1=1000/logσ0来实现。
3.2收敛阶段
3.2.1当学习率η0.01。
3.2.2邻域函数hj,i (x)应该仅包括获胜神经元的最近邻域,并最终减小到一个或零个邻域神经元。
4无量纲化方法的选用
边坡稳定性受到多种因素的影响,在分析各影响因素时,由于各分指标具有不同的量纲,且类型不同,故指标间具有不可共度性,难以进行直接比较,因此在综合评价前必须把这些分指标按某种效用函数归一化到某一无量纲区间[5]。显然,构造不同的效用函数将直接影响最终的评价结果,因此效用函数的构造十分重要。
设P={P1,P2,・・・,PM}是评估对象集,Z={Z1,Z2,・・・,ZM}是综合评价指标体系中的n个分指标,评价指标矩阵X如下:
式中,Xij代表第i个评估对象的第j个分指标值。记第j个分指标Zj的平均值 ,
则将原始指标值按以下公式(3.7)转换到[-1,1]区间上的效用函数值Xij。
5实例及算法检验
将资料收集到的57个边坡样本[6~8]作为学习样本,数据从略,并将原始数据归一化到[-1,1]区间之后的边坡样本作为SOM网络的输入向量。
现在取目标边坡如表1所示:
将待求边坡样本归一化后与其它边坡样本一起输入到已经训练好的SOM网络进行分类,可以得到与这两组边坡样本相近的样本集合。
网络学习1000次后分类结果如图1所示,其中箭头所指的两个样本即为目标边坡在分类结果中所处的位置,它们的网络分类数值为57、81。对于56号样本,可以取分类数值为39~76之间的17个样本作为其学习样本;57号样本可以取分类数值为62~100之间的18个样本作为其学习样本。它们的学习样本集合见表2。
为了验证SOM网络对边坡样本的归类确实能够提高网络的性能,本文利用BP网络设计了两个试验:
试验(1):用SOM网络归类后的学习样本分别对两组目标边坡进行求解,然后观察其网络性能;
试验(2):用已得的全部55组边坡样本中的前20组样本作为BP网络的学习样本,对两组目标边坡求解,然后观察其网络性能。
因为此处仅用来验证SOM网络的归类结果,所以两组试验所用的BP网络模型用同一初始设置。初始网络权值为(-1,1)之间的随机值、学习速率0.1、隐含层个数为1,隐含层单元数12。
在试验1中,网络在对样本学习了4000次左右的时候,达到了收敛。网络性能可以在图2、图3、图4、图5中看到。
试验2,将55组边坡样本的前20组样本作为网络的学习样本。网络结果分析及误差分布如图6、图7所示:
从以上两个试验的结果可以看到,试验1的网络结果明显要好于试验2;试验1中两个网络的误差也均较试验2中的网络误差要小。这就证明经过SOM网络分类得到的目标样本确实能够提高网络的泛化、推广能力,而且分类之后BP网络的学习次数也较不分类时要少。
6结论
实际工程中,由于测量手段、仪器、人的主观性等原因,得出的数据不可避免的具有干扰性,造成以往的边坡样本数据对网络的学习形成很大的噪声。
6.1本文推导的自组织映射神经网络过程,可以自动对外界未知环境进行学习和仿真,适用于对边坡样本进行归类。
6.2本文所述的方法可以剔除一些隐含的网络干扰太大的样本,通过对学习样本的选择提高BP神经网络的计算精度。
6.3通过对55个边坡样本进行分析计算,相对于将不分类样本作为学习样本的同一BP神经网络,本文所述的方法能得到精度更高的近似解。
6.4由于神经网络方法的局限性,本文所述的方法不能反映边坡样本之间的实际区分界线,且计算中各参数的物理意义不明确。
参考文献:
[1] 周维垣等.岩石高边坡的稳定与治理.岩土工程的回顾与瞻[M].北京人民交通出版社,2001:15~24.
[2] 杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社.2001:41~58.
[3] 何翔,刘迎曦.岩土边坡稳定性预报的人工神经网络方法[J].岩土力学,2003.10:32~34.
[4] 罗四维.大规模人工神经网络理论基础[M].北京:清华大学出版社,北方交通大学出版社.2004.57~70.
[5] 李炳军,朱春阳,周杰.原始数据无量纲化处理对灰色关联序的影响[J].河南农业大学学报.2002.36(2):199~202.
[6] 吴建生,金龙.遗传算法BP神经网络的预报研究和应用[J].数学的实践与认识,2005.1(1):12~15.
[7] 熊海丰.基于神经网络技术的边坡稳定性评价[D].武汉理工大学,2003.
篇2
【关键词】 遗传算法 BP神经网络 结构参数 优化
一、引 言
传统的滤波器设计需要大量繁琐计算和曲线查找,在商用电磁仿真软件出现后,微波滤波器的设计得到了很大的改善,但是在实际操作中对经验依赖性还是很强。如何快速准确的设计出符合要求的滤波器,是传统的滤波器设计方法和目前的商用电磁仿真软件难以有效解决的。针对以上问题,本文将遗传算法和BP神经网络结合[1],在MATLAB环境下实现了对腔体滤波器结构参数的设计。
二、遗传神经网络优化
BP神经网络尤其适用在有大量实验数据,而数据间的内在关系很难用明确的表达式的非线性系统中,但在实际应用中神经网络存在学习时间长,容易陷入局部极小点等弊端。因为该算法从本质上来说属于局部寻优算法,为此利用遗传算法全局搜索能力强的特点,结合神经网络的局部寻优能力,可以更好的实现对非线性系统的预测,其基本思想是通过遗传算法得到更好的网络初始权重。
2.1算法实现过程
遗传神经网络分为BP神经网络结构确定、遗传算法优化和BP神经网络预测3个部分。本文是以三腔体滤波器为例,将滤波器的频率f和耦合系数c作为输入向量
其次,使用改进的遗传算法对网络初始权重进行优化,将初步得到的权重赋给尚未开始训练的BP神经网络。然后,设置训练参数,开始训练网络,将 90组数用于网络训练,10组作为测试样本。最后将预测结果反归一化,观察得到的误差值,其流程图如图1所示。
2.2 优化结果
采用上述遗传神经网络算法对腔体滤波器的结构参数进行优化,均方误差为5.0972×10-5, 时间为1.056s;BP网络的均方误差为2.8871×10-4,时间为2.103s,可以看出遗传神经网络优化值更加精确,速度快。
三、结论
本文针对遗传算法和神经网络的优缺点,将遗传算法与BP神经网络有机地结合在一起,应用在腔体滤波器结构参数的优化中,优化结果表明此方法可以在较短的时间内达到精度范围内的优化值,为腔体滤波器的结构参数优化设计提供了一种新方法。
篇3
简而言之模糊神经网络就是具有模糊权值和输入信号的神经网络。模糊神经网络是自动化控制领域内一门新兴技术,其本质上是将常规的神经网络输入模糊信号,因而模糊神经网络具备了模糊系统和神经网络的优势,集逻辑推理、语言计算等能力于一身,具有学习、联想、模糊信息处理等功能。模糊神经网络是智能控制和自动化不断发展的产物,在充分利用神经网络的并行处理能力的基础上,大大提高了模糊系统的推理能力。模糊神经网络是科技发展的产物,有效吸收了神经网络系统和模糊系统的优点,在智能控制和自动化发展等方面有着重要的作用,能够有效地处理非线性、模糊性等诸多问题,在处理智能信息方面能够发挥巨大潜力。模糊神经网络形式多种多样,主要包括逻辑模糊神经网络、算术模糊神经网络、混合模糊神经网络等多种类型,被广泛的运用于模糊回归、模糊控制器、模糊谱系分析、通用逼近器等方面的研究中,随着智能控制和自动化领域的不断发展,模糊神经网络广泛应用于智能控制领域。
2基于模糊神经网络的生物质气化炉的智能控制系统
2.1温度智能控制系统
生物质热值、给料理以及一次风量等因素变化能够影响到生物质气化炉的炉温,但是最重要的影响因素是在气化炉工作过程中物料物理和化学反应的放热和吸热。由于生物质气化工作过程中的生物质热值的变化范围较小,在实际运行中很难测量与控制,有时可以忽略不计,同时,该工作过程中存在非线性和大滞后等问题,采用传统的数学模型达不到预期测量效果,因此需要利用模糊神经网络设计气化炉炉温控制系统,不断的提高温度的控制效果。模糊神经网络首先根据当前温度以及设定温度设,主控制器对最优的生物质物料添加量进行预测,然后由副控制根据该添加量,全面跟踪控制送料速度,从而能够进行精确上料和控制炉温。模糊神经网络系统十分庞大复,其中包含了大量错综复杂的神经元,蕴含对非线性的可微分函数训练权值的基本理念。模糊神经网络具有正向传递和反向传播两个不同的功能,在信息的正向传递中,采用逐步运算的方式对输入的数据信息进行处理,信息依次进入输入层、隐含层最终到达输出层。假如在输出层获得的输出信息没达到预期效果时,就会在计算输出层的偏差变化值后通过网络将偏差信号按原路反向传回,与此同时各层神经元的权值也会随之进行改变,直到符合预期的控制效果。
2.2含氧量智能控制系统
在生物质气化工作过程中,可燃气体的含氧量是衡量其生产质量的重要依据,能够严重影响气化产物的安全使用,因此,通过模糊神经网络实现生物质气化炉含氧量的智能控制十分重要。其含氧量智能控制系统的目的是为了合理控制可燃气体的含氧量,从而稳定气化炉的温度。但是,一次风进风量是影响可燃气体的含氧量的重要因素,所以可以把控制一次风量作为主要调节手段,有效地解决含氧量控制和炉温控制之间的矛盾,在控制炉温的前提条件下,最大程度地降低可燃气体含氧量,进而有效控制气化产物含氧量的。生物质气化炉含氧量的智能控制系统是严格运用模糊神经网络控制原理,主控制器采用温度模糊免疫PID控制,根据炉内含氧量和温度的偏差进行推算,查找出鼓风机转速的最优状态,副控制则以此为根据,全面跟随与控制鼓风机的速度,确保鼓风机转速。生物质气化炉工作过程中的不同阶段和部件具有不同的控制要求,模糊神经网络就要充分发挥被控对象的优良性能,根据不同的控制要求,合理运用模糊神经网络控制原理对PID参数模型中的数据信息进行在线修改,从而达到预期的控制效果。
3基于模糊神经网络的生物质气化炉智能控制系统的仿真实验
为了验证运用模糊神经网络进行生物质气化炉的智能控制的真实效果,对生物质气化炉的温度智能控制系统进行仿真实验,并进行详细地分析。为了保证生物质气化炉能够在条件大体一致的状态下进行运行状况,仿真实验可以采用组合预测算法。首先要到某厂气化炉现场采集2000组干燥层温度数据,并且从中选取连续1500组作为仿真实验样本数据,然后对剩余500组实验样本数据进行研究,通过两组数据的分析建立预测模型。然后采用模糊神经网络对生物质气化炉的温度控制系统进行三次模拟化实验,三种不同情况下的仿真试验结果为:在无外界任何干扰的情况下,模糊神经网络控制无论在超调量还是其他方面,都比单纯的模糊控制效果好;在生物质给料量扰动的情况下,模糊神经网络控制要比单纯的模糊控制所受的影响要小很多;在发生一次风量搅动的情况下,模糊神经网络控制仍受到极小的影响。从三种不同情况下的仿真试验中可以看出基于模糊神经网络的生物质气化炉的炉温智能控制系统效果较好,具有极强的抗干扰性,能够有效地预测气化炉温度实时值,把平均误差控制在很小范围内,并且智能控制系统能实时跟踪实际温度的变化,根据实际温度的变化做出相应的变化,从而能够有效地控制气化炉温度和可燃气体含氧量。
4结束语
篇4
[关键词] 广义回归神经网络 经济预测 评价指标体系
一般常用的预测方法包括时间序列方法(移动平滑法、指数平滑法、随机时间序列方法),相关(回归)分析法,灰色预测方法等。这些方法大都集中于对因果关系回归模型和时间序列模型的分析,建立的模型不能全面和本质的反映所预测的动态数据的内在结构和复杂特性。人工神经网络是有大量简单的处理单元组成的非线形、自适应、自组织系统,它的重要特点是通过网络学习达到其输出与期望输出相符的结果,具有很强的自学自适应、鲁棒性、容错性、存储记忆的能力,人工神经网络具有传统建模方法所不具备的很多优点,有很好的非线形映射能力,对被建模对象的经验知识要求不多,一般不必事先知道有关被建模对象的结构、参数和动态特性等方面的知识。只需要给出对象的输入和输出数据,通过网络本身的学习功能就可以达到输入和输出的映射关系。相对于传统的根据数据分析预测方法,它更适合处理模糊、非线形的和模式特征不明确的问题。人工神经网络中有各种模型,其中广义回归神经网络(Generalized Regression Neural Network, GRNN)是Donald F.Specht提出的一种新型神经网络,本文将探讨该神经网络模型在经济预测中的应用。
一、广义回归神经网络
广义回归神经网络(GRNN)是径向基函数神经网络的一种,有三层组织结构。第一层为输入层,有信号源结点组成。第二层为径向基隐含层,神经元个数等于训练样本数,由所描述问题而定,第三层为线性输出层,其权函数为规范化点积权函数,计算网络的输出。
GRNN网络连接权值的学习修正使用BP算法,由于网络隐含层结点中的作用函数采用高斯函数,从而具有局部逼近能力,此为该网络之所以学习速度快的原因,此外,由于GRNN中人为调节参数很少,只有一个阈值,网络的学习全部依耐数据样本,这个特点决定网络得以最大可能地避免人为主观假定对预测结果的影响。
二、GRNN在经济预测中的应用
本文根据对GDP影响因素的分析,这里分别取固定资产投资、从业人员数量、能源生产总量、财政支出、货运量、人均收入、进出口量,货币供应量等8项指标作为GDP预测的影响因子,以第一产业,第二产业,第三产业生产总值作为GDP的输出因子,即网络的输出。由此来构建广义回归神经网络。
我们通过查《中国统计年鉴》,利用1990年~1999年共10年的历史统计数据作为网络的训练样本,2000年~2003年共4年的历史统计数据作为网络的外推测试样本。
应用MATLAB7编程,创建一个GRNN网络,输入向量组数为10,每组向量的元素个数为8,中间层径向基神经元个数为10,输出层有线性神经元个数3。对网络进行训练和测试。我们将光滑因子分别设置为0.01,0.02,0.03,0.04,0.05,通过不断的尝试,我们得到光滑因子为0.01时,网络的误差最小,逼近效果相对最好,如图1所示,网络此时的逼近误差基本均在0附近,网络训练符合要求。
通过2000年至2003年共4年的数据进行网络外推预测测试,得到预测误差曲线如图2,网络的输出误差分别在0.12和0.25之间。应该说在训练样本较少的情况下这种误差是可以接受的。因此可以用GRNN神经网络进行预测,将2007年的相关数据进行输入网路中,就可以得到2008年的各产业的经济生产总值了。
三、结论
通过以上对GRNN在经济预测中的应用分析可以看出,GRNN神经网络模型在预测方面有很好的优势,其预测精度较高,对参数的要求较低,只需一个光滑因子,但模型本身也有一定局限,其对样本数据依耐很强,随着时间推移,其预测结果偏差会越来越大,因此模型更适合于短期预测。如要应用于长期预测,就需不断增加新样本数据,对模型进行完善。
参考文献:
[1]乔维德:基于BP神经网络的电力企业信息化水平评价指标体系的研究[J].电气时代,2004,A20
[2]欧邦才:基于BP神经网络的经济预测方法[J].南京工程学院学报(自然科学版),2004(2),11~14
[3]飞思科技产品研发中心:神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005,117
篇5
关键词:二级倒立摆;神经网络;逆系统
中图分类号:O231文献标识码: A
倒立摆平衡系统是一种典型的非最小相位、强耦合、自然不稳定、具有参数不确定性的非线性多变量系统,其是现代控制理论的一个重要的研究对象之一,也是检验包括智能控制方法在内的各种先进控制方法的稳定跟踪控制系能、鲁棒控制性能的理想平台。
目前,人们对倒立摆的研究越来越多,倒立摆的种类也由简单的单级倒立摆发展为多种多样的形式,已经出现了球摆、柔性摆、倾斜轨道式倒立摆、旋转式倒立摆等。而对倒立摆的控制方法主要有以下几种:(1)状态反馈 控制;(2)PID控制;(3)自适应控制;(4)非线性控制;(5)神经网络控制;(6)采用遗传算法与神经网络相结合的方法;(7)模糊控制等。
本文研究了直线二级倒立摆的神经网络逆控制方案。采用线性二次最优(LQR)控制器控制倒立摆并采集倒立摆的输入输出数据;然后,以这些数据为基础训练倒立摆的神经网络逆系统;针对神经网络逆系统和原二级倒立摆系统设计比例微分(PD)控制器,实现闭环控制。仿真结果表明,所采用的神经网络逆控制有较短的调节时间和小的超调,能较好地实现倒立摆的稳定控制。
一、二级倒立摆数学模型及可逆性分析
对于二级倒立摆系统,当取以下六个变量为系统的状态变量:,其中,x为小车的位置,和分别为二级倒立摆的摆角1和摆角2。并且取小车加速度为输入变量,即:,那么,可得系统的状态空间表达式:
(1)
(2)
经计算,有,根据逆系统理论,可知系统可逆。
二、二级倒立摆的神经网络逆控制
由于二级倒立摆系统存在参数难以精确获取、系统在实际运行中存在各种扰动等影响,因此难以精确获得其逆系统。神经网络逆控制方法作为一种不依赖于被控系统精确模型的控制方法,已广泛应用于许多控制对象。本文提出基于神经网络逆系统的二级倒立摆控制方法,其控制原理图如图1。
图1小车倒立摆系统的控制结构图
神经网络逆控制的主要包括数据采集与处理、神经网络逆控制器设计和闭环控制器设计三步:
(1)数据采集与处理
要成功地进行神经网络逆控制,第一步是产生数据样本集,这也是特别关键和重要的一步。由于倒立摆系统本质为一不稳定系统,因此难以采用对被控系统直接施加激励信号进行开环控制并采样的数据采集方法,因此本文首先使用LQR控制使得二级倒立摆系统实现稳定控制,并取LQR控制下的输出、、、作为输入数据,原系统输入u作为输出数据。为便于神经网络学习和训练,我们将采样数据归一化处理到[-1 1],即y=(x-MinValue)/(MaxValue-MinValue)*2-1。其中,x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值,可以用MATLAB中min和max函数容易得出样本最大最小值;并对输出u作反归一化处理,即y=(x* (MaxValue-MinValue)+ (MaxValue-MinValue))/2。
(2)神经网络逆控制器设计
理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。同时,由于BP网络被广泛成功应用于许多对象控制中,因此本文选用三层BP网络。三层BP神经网络的隐层采用tansig函数,输出层采用purelin函数,隐节点个数采用“试差法”确定。将采样数据2/3作为训练样本,1/3作为测试样本,经过离线训练多次达到满意的控制性能和测试样本检验,得到神经网络逆系统,然后将离线训练的神经网络逆系统与被控二级倒立摆系统串联起来,构成复合伪线性系统,并检验神经网络逆与二级倒立摆组成的复合系统的线性化效果(见图2)。
(3)闭环控制器设计
由于二级倒立摆系统可逆,且当取输出为、时,系统的相对阶为2,由经典控制理论可知,对2阶积分系统,设计PD控制器可使闭环系统稳定。因此,本文对神经网络逆系统与被控系统组成的伪线性复合系统设计PD控制器()以实现二级倒立摆系统的闭环控制。
图2输入输出线性化效果
三、数值仿真
基于Matlab软件,进行数值仿真,构建的仿真模型如图3。
图3复合控制系统图
其中,设计PD控制器为20+5s,控制效果如图4-6。
图4 小车位置
图5 角度1波形
图6 角度2波形
由以上波形可知小车位置在3秒后能够跟踪给定值,摆杆也能在一定的小范围内振荡,即实现了二级倒立摆的稳摆控制。
四、结语
本文研究了二级倒立摆的神经网络逆控制方案。首先,采用线性二次最优(LQR)控制器控制倒立摆并采集倒立摆的输入输出数据;然后,以这些数据为基础训练倒立摆的神经网络逆系统;针对神经网络逆系统和原二级倒立摆系统设计PD控制器,实现系统的闭环控制。仿真结果表明,所采用的神经网络逆控制有较短的调节时间和小的超调,能较好地实现倒立摆的稳定控制。
参考文献:
[1]任祖华.倒立摆系统的智能控制研究[D].武汉:华中科技大学.2006.
[2]陈谋,姜长生,吴庆宪. 基于非线性控制方法的倒立摆系统控制[J].控制理论与应用,2004,21(5):684-688.
篇6
关键词:农田有效灌溉面积;BP神经网络;支持向量机;预测
中图分类号:S279.2;TP183 文献标识码:A 文章编号:0439-8114(2013)09-2157-04
农田有效灌溉面积指有固定水源、灌溉工程设施配套、土地平整、在一般年景下能够进行正常灌溉的耕地面积,包括机灌面积、电灌面积、自流灌溉面积和喷灌面积[1]。它是反映农田水利建设和水利化的重要指标,也是我国各地区制定水利发展规划的重要指标之一。对农田有效灌溉面积进行预测可以为了解未来农村水利基础设施的建设状况提供有价值的参考信息,同时也可为相关部门合理制定行业发展规划提供理论支持。
1 预测方案的确定与预测方法的选择
1.1 预测方案的确定
农田有效灌溉面积的变化受多方面因素的影响,比如政策、中央财政资金投入、地方财政资金投入、农民收入状况等。这些因素并不是孤立地对农田有效灌溉面积产生影响,而是耦合在一起以非线性的方式影响农田有效灌溉面积的变化。
农田有效灌溉面积的预测有两大类方案:一种为结构式的预测方法,就是通过一定的方式建立起各主要影响因素与农田有效灌溉面积之间的关系,然后根据未来各影响因素的变化去预测相对应的农田有效灌溉面积;另一种为数据序列预测法,就是将各年度的农田有效灌溉面积数值作为连续的时间序列看待,可以认为农田有效灌溉面积的变化规律已经蕴含在数据序列之中,再采用合适的方法对该序列在未来的取值进行预测。
在第一种方案中,首先需要确定具体影响农田有效灌溉面积变化的因素种类及其影响规律,另外还需要对各因素的未来变化进行预测。准确地确定影响农田有效灌溉面积变化的各种因素本身就很有难度,各因素对有效灌溉面积影响规律的辨识也同样是一个比较复杂的问题,而预测各因素未来的变化更是一个几乎和预测农田有效灌溉面积难度相当的问题。在第二种方案中,首先需要建立起能够充分反映农田有效灌溉面积变化规律的预测模型,然后通过求取该预测模型在未来的输出值即可实现预测。两种方案相比,显然第二种方案更容易实现。因此,在以下研究中采用数据序列预测方案。
1.2 预测方法的选择
在数据序列的预测中,目前广泛采用的方法有移动平均法、指数平滑法、线性回归法、灰色预测法、神经网络法和支持向量机方法等。这些方法中神经网络法和支持向量机方法从本质上来说更为适合应用于非线性预测问题。而农田有效灌溉面积所构成的数据序列是一个典型的非线性序列。显然在该研究中采用神经网络法和支持向量机方法较为合适。为了充分研究这两种方法的适用性,以下对这两种方法进行对比分析。
2 两种预测方法的理论基础及特性分析
2.1 BP神经网络预测的理论基础及特性分析
在各类神经网络中,BP神经网络堪称最经典、使用最为广泛的一种神经网络[2,3]。
BP神经网络是误差反向传播(Back error propagation,简称BP)神经网络的简称。BP神经网络通常由1个输入层、若干隐含层和1个输出层组成,在每层中可以包括若干个神经元。各相邻层神经元之间多为全连接方式,而同层神经元之间则无连接[4]。各神经元间的连接传递相应的权值,隐含层及输出层各神经元都有自己的阈值。BP神经网络作为一种前馈网络,具有前馈网络的共性。研究表明,三层前馈网络就能够以任意精度逼近任意连续函数及其各阶导数[5]。对序列进行建模,从本质上来说就是获得序列的变化泛函,BP神经网络的函数逼近功能正好可以实现此过程。
但BP神经网络也存在若干缺陷,其中比较突出的是网络结构的不易确定、易限于局部收敛和收敛速度慢。其中网络结构的不易确定是指在确定网络结构参数的过程中没有准确的依据可以遵循。而局部收敛则对BP神经网络的函数逼近功能影响较大。
2.2 支持向量机预测的理论基础及特性分析
3 预测模型的建立
3.1 样本数据的准备
从河南统计年鉴中收集了1986-2010年河南省农田有效灌溉面积的统计数据[10]。为了降低预测模型的复杂程度,采用峰值法对这些数据进行了归一化处理。将归一化后的1986-2009年数据作为训练样本,2010年数据作为检验样本。
确定预测模型每次的输入样本中包含6个数据,即用连续6年的数据预测第七年的数据。据此可建立训练时的输入样本矩阵(6×18)和输出样本向量(1×18)。
3.2 预测模型基本参数的确定与训练
1)BP神经网络基本参数的确定与训练。确定BP神经网络的隐含层数为1,输入层神经元数为6,输出层神经元数为1,隐含层神经元数为11。隐含层和输出层的激励函数分别采用正切型Sigmoid函数和对数型Sigmoid函数。为了提高收敛速度,训练时采用了Levenberg-Marquardt数值优化算法。
2)支持向量机基本参数的确定与训练。采用Epsilon型支持向量机回归算法,经过多次试验,确定拉格朗日乘子上界为5,不敏感函数取值为0.000 01,核函数采用高斯型,高斯核函数的宽度取0.15。
4 预测与分析
4.1 两种模型预测能力对比
利用训练完毕的两种预测模型仿真预测1992-2009年的河南省农田有效灌溉面积并进行反归一化处理。反归一化后的各预测值、预测误差的绝对值和预测相对误差的绝对值见表1。从表1可以看出,支持向量机的各预测值与实际值更为接近,其预测误差的绝对平均值、预测相对误差的绝对平均值都远小于BP神经网络预测结果的对应参数。图1中的各预测数据也全部经过了归一化处理,从图1中1992-2009部分也可以看出,支持向量机的预测值基本和实际值重合在一起,而BP神经网络的预测值在一些地方则与实际值相差较大,说明基于支持向量机的预测模型泛化能力更强。
利用这两种预测模型分别预测作为检验样本的2010年河南省农田有效灌溉面积,反归一化后的预测结果如表2和图1所示。从表2和图1可以看出,基于支持向量机的预测模型在检验样本处的实际预测精度也远高于BP神经网络,其预测误差仅为BP神经网络预测误差的11.8%。
4.2 河南省“十二五”期间农田有效灌溉面积的预测与分析
实际上,预测结果是在现有条件的基础上从数据序列的角度进行的预测,如果在“十二五”期间,政府大幅增加水利行业的资金投入,最终的发展情况将会比该预测结果更好。
5 小结
在对农田有效灌溉面积进行预测时,数据序列预测法比结构式预测法更为简单易行。在各种数据序列预测方法中,神经网络预测方法和基于支持向量机的预测方法更为适合农田有效灌溉面积的非线性变化规律。
研究针对BP神经网络和支持向量机两种预测方法进行了对比分析。理论研究表明,基于支持向量机的预测方法可以克服BP神经网络的诸多缺陷,具有优越性。
以河南省1986-2010年的农田有效灌溉面积统计数据为基础,详细阐述了利用两种预测方法建立预测模型的过程,并进行了应用验证。验证结果表明,基于支持向量机的预测方法具有更好的泛化能力,预测精度更高。最后获得了河南省“十二五”期间农田有效灌溉面积的预测数据并指出了其发展趋势。
参考文献:
[1] 郑家亨.统计大辞典[M]. 北京:中国统计出版社,1995.
[2] 卞凤兰,黄晓明,刘 睿.城镇化进程中公路网用地的BP神经网络预测模型[J].东南大学学报(自然科学版),2010,40(5):1073-1076.
[3] 尹健康,陈昌华,邢小军,等. 基于BP神经网络的烟田土壤水分预测[J]. 电子科技大学学报,2010,39(6):891-895.
[4] 陈 明. 神经网络模型[M]. 大连:大连理工大学出版社,1995.
[5] 柳小桐. BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123,126.
[6] 张 华,曾 杰.基于支持向量机的风速预测模型研究[J]. 太阳能学报,2010,31(7):928-932.
[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.
篇7
关键词:神经网络;医院预算;全面预算管理
全面预算管理主要是指全员参与、财务及经营收支全额纳入预算、预算全过程的管理。它最早产生于企业,先后在美国通用电器、通用汽车公司提出并应用,并随着企业的发展而日益完善。近几年在国内医院也得到了应用,全面预算管理的实施,促进了医院内部人与人、部门与部门间的了解与合作,使医院战略目标与预算得到落实。
一、国内外医院预算管理的对比
医院的预算管理,国内外差别较为明显。以澳大利亚为例,该国每年对公立医院实行全额预算补贴,支付形式是按病种结算。医院必须按照就诊人次和诊断的疾病种类来计算收费金额,而后同政府部门或保险公司结算,这一方式与医院为患者提供的实际服务项目及成本无关。因此,医院对医疗成本的控制十分重视,在保证医疗质量的前提下,想方设法减少药品、检查、检验及材料的成本,严格禁止患者进行重复检查。项目的预算要求非常具体,数据精确度也非常高。而国内,医院的收费是按服务项目收取,每项医疗服务由物价部门统一确定收费标准,这种收费模式,导致医院把主要精力集中在“创收”上。但随着我国医疗体制改革的推进,特别是目前已经试点的单病种、临床路径管理,很多项目也逐步向国外先进管理模式靠拢。从新《医院财务制度》中可以看出,医院独立性越来越强,对预算管理要求也会越来越高,医院内部预算管理将更加全面,这就需要医院预算管理要在精、细、准上下功夫。
二、对现有医院预算管理方法的分析
现行医院预算管理方法不够科学,很难达到精、准要求。为了求得预算值,实际工作中一般采用平均值法,表示公式为:项目预算=其中,i为拆分的某个子项目;x为上期预算;y为上期决算;n为项目拆分后的子项目总数;k为调整系数。该方法是以上期预决算作为基础参照,求得一个参考值。值得注意的是,上期预算和上期决算的合理性并不能得到保证,因此这个参考值是不准确量。为使参考值趋于合理,并符合一般项目预算变化率,通常需要经专家组综合评价后,进行部分校正,确定相对合理的调整系数,最终将预算参考值与调整系数的乘积作为本期预算。而确定的系数合理到什么程度,很难判断,只能靠经验,很容易出现预算偏差。传统预算编制方法主要有固定预算、增量预算、零基预算、确定性预算和概率预算。所有这些预算方法都是按照线性思维考虑,各有利弊,在医院部分预算项目管理中,也可能综合运用,但很难考虑到医院整体的综合性、复杂性,以及项目之间的相互影响力。因此,单靠人为估算不是科学的办法,在实际执行中存在许多不确定性,不能保证预算目标得以实现,无法满足医院精细化和全面管理的需要。而新型的神经网络预算方法基于非线性,有较高的复杂度,而且考虑了误差反馈校验。该方法应用到医院全面预算管理全过程,可以满足医院全面预算的精细化需求。
三、神经网络的特点
神经网络(NeuralNetworks)是20世纪80年代兴起的一种实用的多学科交叉处理技术,是模仿人脑行为特征、进行分布式并行信息处理的数学算法模型。它具有非线性和自适应的动态系统特征,这一处理方法依靠系统的复杂程度,通过调整内部大量节点之间相互连接的权重,从而达到处理信息的目的。神经网络有两大智能特性,即具有自学习和自适应调控的能力,可以通过预先提供的一组相互对应的输入——输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出目标结果,这种学习分析的过程通常被称为“训练”,就像人类一样,通过学习和训练,学习新技术、新方法,用于解决实际工作中的新问题。神经网络已经成为一种智能控制方法,广泛应用于生产、企业管理等多种社会实践中,进行预测、控制。
四、神经网络应用于医院预算管理的可行性
医院信息化建设的普及,给精细化管理提供了基础数据元,为全面预算的精准控制打下了基础。特别是部分医院建立了大数据中心、信息系统平台,可以直接通过接口采集各类原始数据。将相关数据进行模型化处理,采用神经网络算法,即可应用于预算管理的全过程。使用神经网络算法,仿人脑思考,使得预算计算方法更加科学,由过去的一般线性计算发展到非线性,增加了复杂度,与实际更趋一致。以人员工资支出为例,过去只作正常增资额,作线性处理,而现在可以把员工工资分成三部分,一是人员变动情况;二是基本工资正常增资,可使用人事信息,采用分段函数准确计算出下一预算周期的基础工资额;三是绩效工资,它处于比较复杂的非线性变化,因为要参考每月的实际工作量及医院收支变化,还要引入各种医疗因素的反馈信息,再加上医院上期数据对下期发展的影响因素等等。面对这种诸多因素的复杂影响时,一般算法很难进行合理处理,而采用神经网络算法,却可以解决。这只是列举了一个较为简单的例子,相对于人员工资支出,医院新建项目、新技术应用等的预算精确管理则更为复杂,需要考虑的因素也更多。针对医院全面预算中出现的一些不确定性和高度非线性因素的影响,神经网络的独特优点有了用武之地,它能够充分接近复杂的非线性映射关系,可以学习和适应不确定因素的动态特质,具有较强的容错性,此外,由于神经网络采用矩阵算法,可以进行快速的海量数据运算。
五、神经网络在医院全面预算管理中的应用
(一)神经网络的构成
神经网络一般包括三层:输入层、隐含层和输出层。针对医院全面预算,输入层可以是各种医院基本元数据以及医院综合运行指标,越细化越好。隐含层是神经网络的算法核心,是复杂的智能化处理的中间态,这对神经网络使用者来说是不可见的。输入层参数主要包括:科室基本情况,包括床位、科室人员、影响力等;患者基本情况,指本科室患者信息,如年龄、性别、职业等;疾病情况,包括ICD10疾病诊断、病程及入出院情况等;患者医保类型;检查、检验、治疗、手术等情况;科室请领的相关物耗等信息;科室设备使用情况;科室消耗的水、电、氧气等;门诊诊疗情况;输液用药情况;医院运行指标,如门诊人次、住院床日等;按账单类别分类的门诊、住院费用;人员工资成本;患者满意情况;其它各类指标(整个医院相关运行指标近百种)。输出层:包含单项目预算、患者医保预算、科室预算等各种收入预算、支出预算,涵盖医院全面预算涉及的各方面内容。
(二)神经网络的建设
决定神经网络拓扑结构的是隐含层(隐含层可能是多层)及其所含节点数,以及节点与节点之间的连接方式。要从零开始建设一个神经网络,首先要做的是确定隐含层和节点数,对应的活动函数的形式以及权重限制等。如果采用成熟的工具软件箱,将会大大节约调整时间,减少建设适应周期。数据从输入层到输出层的过程是一个从前向后的传播过程,后面节点的数值通过它前面相连的节点传递过来,然后把这个值按照各个连接权重的大小加权,输入活动函数再得到新的数值,继续传播到下面的节点。当节点的输出值与我们预期的值不同,也就是发生误差时,神经网络就要“学习”。学习过程如下:如果一个节点输出发生较大误差,那么就需要看这一误差是受哪些输入节点的影响而造成的,是不是受到了权重最高的节点的影响,如果是,则要降低这一节点的权重,同时升高其它节点的权重值。对那些降低权重的节点来说,也需要用同样的方法来进一步降低它前面的节点的权重。按照这样的做法把权重值进行调整,一步步向前传播,直到权重调整到输入节点为止。对训练的每一条记录都要重复这个步骤,用向前传播得到输出值,如果发生较大误差,则用此方法进行学习。当把训练的每一条记录都运行过一遍之后,便完成了一个训练周期。结合医院实际运作方式,一般一个训练周期定为一个月,要完成神经网络的训练可能需要很多个训练周期,至少要几十次,经常要经过上百次学习。神经网络学习次数越多,误差越小,未来的医院预算执行越准确。训练学习完成之后得到的神经网络就是相对完善的模型,描述了全面预算受医院基础变量影响的变化规律。
(三)误差校正
对于单输入、单输出神经网络模型,非线性系统可用如下差分方程表示:y(t+1)=f[y(t),y(t-1),…,y(t-k+1);x(t),x(t-1),…,x(t-k+1)]其中,y(t)、x(t)分别表示在t时刻的输出、输入变量,f()为未知的非线性映射,k为输入输出的系统阶次。针对医院预算实际情况,我们按上图中所示的神经网络模型,有n个医院基础信息和运行指标输入变量,m个预算种类输出变量,此非线性系统可用差分方程表示为:通常有两种方法,可以预测神经网络未来的输出,一是递推法,二是非递推法。由于神经网络结构相当复杂,建模难度极大,一般不采用非递推法。在此我们利用递推法,来预测神经网络未来d步的预算输出。
六、结束语
篇8
[关键词]FRP;混凝土;人工神经网络
中图分类号:TU375 文献标识码:A 文章编号:1009-914X(2017)07-0380-01
引言
纤维增强复合材料(fiber reinforced polymer,简称FRP)是由纤维材料与基体材料按一定比例混合并经过一定工艺复合形成的高性能新型材料。这种材料强度高、材质轻、耐腐蚀性好等众多优点使其越来越多应用于土木工程领域,如对已发生破坏的混凝土结构进行加固、与钢和混凝土形成新的组合结构等。国内外众多学者都对FRP混凝土组合结构进行研究,使其成为土木工程领域的热点研究问题。
神经网络技术是人工智能计算领域较为常用的方法,其本质是种数学方法,是一种通用的逼近器。它由许多互相连同的神经元构成,组成一个神经网络,来摸拟人脑处理信息。神经网络技术的最大优势在于能够建立隐式的数学模型,即通过训练试验数据,即可建立起输入与输出的数学关系,实现低误差预测。
本课题组在FRP混凝土组合结构方向进行了大量的研究工作,积累了较多试验数据[1-7]。本次研究工作是以这些试验数据为基础,利用人工神经网络技术对试验结果进行预测,为FRP混凝土组合结构力学性能研究提供了新思路。
1 BP神经网络
BP(back propagation)神经网络是一种多层前馈神经网络,该网络的主要特点是信号向前传递,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。
2 网络训练
本研究选择2隐含层,每个隐含层7个节点,节点传递函数选择logsig和tansig函数,训练迭代次数设置为200,学习速率为1%,学习目标设为0.1,由于输入数据之间的单位差异,为提高训练精度,训练前对输入数据进行归一化处理。数据归一化处理把所有数据都转化为[0,1]之间的数,避免因输入输出数据数量级差别较大而造成网络预测误差较大。网络拓扑图如下图所示:
3 模型验证
随机选择6组试验数据(未参与网络训练)验证网络精度,预测值与实验值(包括训练数据)对比如图2所示:
通过对比可以发现,预测误差最大为15.2%,除傻阃馄溆辔蟛钊部在10%之内,并且变化趋势与真实试验值相符。所以我们认为通过之前的27组数据训练出来的神经网络,有较高精度和泛化能力。
4 结论
通过对FRP混凝土组合结构力学性能试验结果的数据的训练,得到精度较高的神经网络模型,并可运用该模型进行力学性能分析,证明该方法可以运用到土木工程领域。
基金项目
国家级大学生创新项目(201510220006)、黑龙江省教育厅科研项目(12543023)
参考文献
[1] 张云峰,陈佳楠,赵德望,王先一.FRP混凝土连续梁极限承载力及挠度[J].辽宁工程技术大学学报(自然科学版),2016,03:265-269.
[2] 于洋,陈思同,管海伟,张云峰,赵德望.中空率对中空GFRP管钢筋混凝土柱性能影响[J].辽宁工程技术大学学报(自然科学版),2016,04:398-401.
[3] 张云峰,吴紫阳,赵德望.后张有黏结预应力混凝土连续梁弯矩调幅分析[J].黑龙江科技大学学报,2016,01:95-99.
[4] 詹界东,李赛,赵德望.尺寸效应对GFRP约束钢筋混凝土方柱力学性能的影响[J].黑龙江科技大学学报,2016,04:433-438.
[5] 于洋,邬亚滨,张云峰,吴殿臣,朱士伟.混凝土强度对GFRP管-混凝土-钢管组合柱性能的影响[J/OL].郑州大学学报(理学版),2016(03).
[6] 李文,那昱,吴殿臣,赵德望,邢振中.空心率对GFRP-混凝土-钢双管柱力学性能的影响[J].辽宁工程技术大学学报(自然科学版),2015,09:1037-1041.
[7] 詹界东,任梦,管海伟,赵德望.不同配筋率下中空GFRP管钢筋混凝土柱的性能研究[J].辽宁石油化工大学学报,2015,05:49-53.
作者简介
刘金强,学士,主要从事混凝土结构相关领域研究。
篇9
关键词: 隧道; 遗传算法; BP网络; 施工监控; 监测
中图分类号: TU7文献标识码: A文章编号: 1009-8631(2010)03-0079-02
智能计算理论也称为软计算(Soft Computing),是新发展起来的一门十分活跃和具有挑战性的领域,其主要研究对象可以归纳为:神经网络、遗传算法、模糊逻辑、概率理论、混沌理论等。软计算与传统的“硬计算”有本质的不同,其目的在于适应现实世界普遍的不精确性,其指导原则是开拓对不精确性、不确定性和部分真实性的容忍,以达到可处理性、鲁棒性、低成本性求解,土木工程面对的是工程岩土体,具有很大的随机性、模糊性、信息不完整,因而土木工程特别是特长隧道的许多问题通常具有复杂性、动态性和不可重复的高度非线性特点,问题涉及的变量多,且有噪声,传统分析方法常常面临着困难,而智能计算在处理这些问题方面具有优势。
一、BP神经网络模型及遗传算法[1, 2]
BP神经网络作为智能计算的一个重要组成部分,神经网络具有很强的非线性映射和自适应训练功能,特别是BP 网络近年来广泛应用于预测评估、模式识别等领域并取得良好效果。
BP网络模型处理信息的基本原理是:输入Xi通过隐层节点作用于输出节点,经过非线形映射,产生输出Yk,网络训练样本包括输入向量X和期望输出量t,网络输出值Y与期望输出值t之间的偏差,通过调整输入节点与隐层节点的联接强度取值Wij和隐层节点与输出节点之间的联接强度Tjk以及阈值,使误差沿梯度方向下降,经过反复训练,确定与最小误差相对应的网络参数(权值和阈值),训练即停止。经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形映射的信息。当隐层神经元足够多时,这种结构可以保证网络以任意精度逼近任意的非线性函数。
遗传算法(genetic algorithm)是一种模拟自然进化过程搜索最优解的方法,具有群体寻优的增强式学习能力及全局性、并行性、快速性和自适应性。遗传算法的出现使神经网络的训练有了一个崭新的面貌,目标函数既不要求连续,也不要求可导,仅要求该问题可计算,而且它的搜索遍及整个解空间,容易得到全局最优解。可利用遗传算法优化神经网络的拓扑结构。
(一)BP神经网络模型的确定
1. 输入和输出神经元的确定。可利用多种方法对神经网络的输入参数进行分析,确定无相关性或相关性较弱的输入参数(节点),使之尽可能得少,以降低网络复杂度,减少网络训练时间。
2. 隐层单元的数量对网络影响较大,选择隐含层的单元数是神经网络设计最困难的部分之一。若隐层单元数过少,则网络的泛化能力较差;若隐层单元数过多,又使得训练时间增加,训练误差也不一定最佳。隐层单元数的选取目前尚无公认的理论来指导,一般采用试算法和经验性的公式来确定。最佳层隐节点数L可参考下面经验公式计算[1],本文用遗传算法来优化BP神经网络结构。
其中m为输入节点数;n为输出节点数;c介于1~10的常数。Berk和Hajela建议[3]:隐含层单元数应在(k+i)/2与k+i之间随机选取。其中k为输入单元个数;i为输出单元个数。
3. 选择训练样本,训练神经网络。
对系统的输入输出数据进行归一化处理,作为训练样本,训练网络系统。训练样本应尽可能地反映各种状态。神经网络的训练过程,即根据训练样本,对网络的联接权值和误差进行反复修正的过程。
4. 确定传递函数,一般选择非线形S型函数等。
二、应用实例
工程概况:横山特长隧道位于陕北黄土高原梁峁区,沟壑纵横、地形起伏、冲沟发育。隧道起迄里程为DK333+265~DK344+713,全线长11448m,设计为双线隧道。隧道最大埋深为283.68m,主洞开挖面积最大177.4m2,最小120.53m2,隧道通过的围岩主要为新黄土、老黄土、泥岩、砂岩以及砂泥岩互层。
工程地质特点,目前主要以泥岩、砂岩以及砂泥岩互层为主,层理较发育,基岩裂隙水,部分段落渗水呈泉眼股状流出、拱部滴水呈线。洞内砂岩呈黄褐色薄~厚层状与泥岩不等厚互层,细粒砂状结构,泥质胶结;泥岩呈灰黑色,泥质结构,含煤线或薄煤层,自稳能力差,强度较低,遇水易软化,薄层泥岩或薄层砂岩出现在洞室起拱线以上时容易产生掉顶、滑层、剥落、塌方等现象。
从以上可以看出,横山隧道地质情况复杂。在开挖之前的原始土体处于平衡稳定的弹性阶段。由于开挖成洞后围岩原有各质点间的应力平衡状态,受到扰动破坏,应力轨迹发生变化,产生相对位移与调整。岩性软弱、地质构造发育、岩性风化及地下水作用,使隧道开挖后,原有的应力场平衡状态遭到破坏,引发应力重分布;若再迭加其它不利因素,例如不利结构面组合、膨胀、崩解等物理化学作用,将出现塌方。所以必须强化施工过程中的监测。围岩变形时间序列数据中蕴含着系统演化的信息。在施工条件、施工方法不变的情况下,利用神经网络较强的非线性映射能力,对隧道实测位移变形值直接建模,以获得高度复杂和非线性的内在变形规律。本文采用上述遗传算法来优化神经网络,称为遗传神经网络,利用MATLAB7自带的神经网络工具箱和英国Sheffield大学的遗传算法工具箱,结合横山特长隧道施工的实例进行研究。
(一)顶拱下沉的遗传神经网络预测步骤
1. 样本的处理
样本的处理,一般隧道施工顶拱下沉变形有这样的特点:前期部分位移值变化较大,后期位移值变化较小。据此,笔者将数据转换到(0.1,0.9)区间。
1. 训练及测试样本
本文所采用数据为2007年10月11日至10月30日时间段,DK333+610断面,开挖的顶拱下沉位移监测数据,开挖时即埋设监测点进行监测。监测期内施工稳步进行,循环周期稳定,位移预测受意外因素干扰少,有利于直接以实测位移建模的可靠性。本文用前15天的相对位移值作为训练样本,见表一,用后四天的监测值作为测试样本,见表二。
(二)预测结果及误差分析
从测试样本的结果来看,其误差比较小,是相当成功的,最大的误差仅为1.15%,这在工厂上已经是相当不错,但这只是一个断面的拱顶沉降的预测。
三、结语
本文利用遗传算法的全局搜索特性,对变形预测的神经网络结构进行最优搜索,从而获得具有最优预测效果的遗传神经网络。采用遗传神经网络对隧洞施工顶拱变形的动态过程进行预测,解决了在常规采用的回归曲线预测法效果误差较大的问题,解决了在神经网络构建中根据经验公式和试算法确定神经网络结构和学习参数的困难,从而减少结构选择的盲目性。从以上数据表明遗传神经网络具有更佳的预测效果,对于围岩变形监测中异常情况可提前预报,提高预测的准确性,从而为变更设计、调整支护参数、调整施工工艺赢得宝贵的时间。
不足之处及后续要进行的工作,隧道是个三维空间结构,目前的施工监测的断面还属于二维空间的范畴,尚有许多工作要做;另外隧道地质情况复杂,各个断面上的地质条件有许多的差异,智能计算或神经网络的解决方案还有许多不足之处,尚需不然改进完善。
参考文献:
[1] 飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005.
篇10
关键字 :神经网络,BP模型,预测
中图分类号:TP183文献标识码: A
1 引言
在系统建模、辨识和预测中,对于线性系统,在频域,传递函数矩阵可以很好地表达系统的黑箱式输入输出模型;在时域,Box-Jenkins方法、回归分析方法、ARMA模型等,通过各种参数估计方法也可以给出描述。对于非线性时间序列预测系统,双线性模型、门限自回归模型、ARCH模型都需要在对数据的内在规律知道不多的情况下对序列间关系进行假定。可以说传统的非线性系统预测,在理论研究和实际应用方面,都存在极大的困难。相比之下,神经网络可以在不了解输入或输出变量间关系的前提下完成非线性建模[4,6]。神经元、神经网络都有非线性、非局域性、非定常性、非凸性和混沌等特性,与各种预测方法有机结合具有很好的发展前景,也给预测系统带来了新的方向与突破。建模算法和预测系统的稳定性、动态性等研究成为当今热点问题。目前在系统建模与预测中,应用最多的是静态的多层前向神经网络,这主要是因为这种网络具有通过学习逼近任意非线性映射的能力。利用静态的多层前向神经网络建立系统的输入/输出模型,本质上就是基于网络逼近能力,通过学习获知系统差分方程中的非线性函数。但在实际应用中,需要建模和预测的多为非线性动态系统,利用静态的多层前向神经网络必须事先给定模型的阶次,即预先确定系统的模型,这一点非常难做到。近来,有关基于动态网络的建模和预测的研究,代表了神经网络建模和预测新的发展方向。
2 BP神经网络模型
BP网络是采用Widrow-Hoff学习算法和非线性可微转移函数的多层网络。典型的BP算法采用梯度下降法,也就是Widrow-Hoff算法。现在有许多基本的优化算法,例如变尺度算法和牛顿算法。如图1所示,BP神经网络包括以下单元:①处理单元(神经元)(图中用圆圈表示),即神经网络的基本组成部分。输入层的处理单元只是将输入值转入相邻的联接权重,隐层和输出层的处理单元将它们的输入值求和并根据转移函数计算输出值。②联接权重(图中如V,W)。它将神经网络中的处理单元联系起来,其值随各处理单元的联接程度而变化。③层。神经网络一般具有输入层x、隐层y和输出层o。④阈值。其值可为恒值或可变值,它可使网络能更自由地获取所要描述的函数关系。⑤转移函数F。它是将输入的数据转化为输出的处理单元,通常为非线性函数。
图1 BP神经网络结构
2.1 基本算法
BP算法主要包含4步,分为向前传播和向后传播两个阶段:
1)向前传播阶段
(1)从样本集中取一个样本(Xp,Yp),将Xp输入网络;
(2)计算相应的实际输出Op
在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时的执行过程。
2)向后传播阶段
(1)计算实际输出Op与相应的理想输出Yp的差;
(2)按极小化误差的方式调整权矩阵。
这两个阶段的工作受到精度要求的控制,在这里取 作为网络关于第p个样本的误差测度,而将网络关于整个样本集的误差测度定义为 。图2是基本BP算法的流程图。
图2 BP基本算法流程
2.2 动态BP神经网络预测算法
在经典的BP算法以及其他的训练算法中都有很多变量,这些训练算法可以确定一个ANN结构,它们只训练固定结构的ANN权值(包括联接权值和结点转换函数)。在自动设计ANN结构方面,也已有较多的尝试,比如构造性算法和剪枝算法。前一种是先随机化网络,然后在训练过程中有必要地增加新的层和结点;而剪枝法则正好相反。文献[2]中提出了演化神经网络的理念,并把EP算法与BP进行了组合演化;也有很多学者把遗传算法和BP进行结合,但这些算法都以时间复杂度以及空间复杂度的增加为代价。根据Kolmogorov定理,对于任意给定的L2型连续函数f: [ 0, 1 ]n Rm , f可以精确地用一个三层前向神经网络来实现,因而可以只考虑演化网络的权值和结点数而不影响演化结果。基于此,在BP原有算法的基础上,增加结点数演化因子,然后记录每层因子各异时演化出的结构,最后选取最优的因子及其网络结构,这样就可以避免由于增加或剪枝得到的局部最优。根据实验得知,不同的预测精度也影响网络层神经元的结点数,所以可根据要求动态地建立预测系统。具体步骤如下:
(1)将输入向量和目标向量进行归一化处理。
(2)读取输入向量、目标向量,记录输入维数m、输出层结点数n。
(3)当训练集确定之后,输入层结点数和输出层结点数随之而确定,首先遇到的一个十分重要而又困难的问题是如何优化隐层结点数和隐层数。实验表明,如果隐层结点数过少,网络不能具有必要的学习能力和信息处理能力。反之,若过多,不仅会大大增加网络结构的复杂性(这一点对硬件实现的网络尤其重要),网络在学习过程中更易陷入局部极小点,而且会使网络的学习速度变得很慢。隐层结点数的选择问题一直受到神经网络研究工作者的高度重视。Gorman指出隐层结点数s与模式数N的关系是:s=log2N;Kolmogorov定理表明,隐层结点数s=2n+1(n为输入层结点数);而根据文献[7]:s=sqrt(0.43mn+0.12nn+2.54m+0.77n+0.35)+0.51[7]。
(4)设置结点数演化因子a。为了快速建立网络,可以对其向量初始化,
并从小到大排序[4,7]。
(5)建立BP神经网络。隐含层传递函数用tansig,输出层用logsig,训练函数采用动态自适应BP算法,并制订停止准则:目标误差精度以及训练代数。
(6)初始化网络。
(7)训练网络直到满足停止判断准则。
(8)用测试向量对网络进行预测,并记录误差和逼近曲线,评估其网络的适应性。其适应度函数采取规则化均方误差函数。
(9)转到(5),选取下一个演化因子,动态增加隐含层结点数,直到最后得到最佳预测网络。
3 基于神经网络的预测原理[4]
3.1 正向建模
正向建模是指训练一个神经网络表达系统正向动态的过程,这一过程建立的神经网络模型称为正向模型,其结构如图3所示。其中,神经网络与待辨识的系统并联,两者的输出误差用做网络的训练信号。显然,这是一个典型的有导师学习问题,实际系统作为教师,向神经网络提供算法所需要的期望输出。当系统是被控对象或传统控制器时,神经网络多采用多层前向网络的形式,可直接选用BP网络或它的各种变形。而当系统为性能评价器时,则可选择再励学习算法,这时网络既可以采用具有全局逼近能力的网络(如多层感知器),也可选用具有局部逼近能力的网络(如小脑模型控制器等)。
图3 正向建模结构
3.2 逆向建模
建立动态系统的逆模型,在神经网络中起着关键作用,并且得到了广泛的应用。其中,比较简单的是直接逆建模法,也称为广义逆学习。其结构如图4所示,拟预报的系统输出作为网络的输入,网络输出与系统输入比较,相应的输入误差用于训练,因而网络将通过学习建立系统的逆模型。但是,如果所辨识的非线性系统是不可逆的,利用上述方法将得到一个不正确的逆模型。因此,在建立系统时,可逆性应该先有所保证。
图4 直接逆建模结构
4 应用实例分析
以我国西南某地震常发地区的地震资料作为样本来源,实现基于动态神经网络的地震预报。根据资料,提取出7个预报因子和实际发生的震级M作为输入和目标向量。预报因子为半年内M>=3的地震累计频度、半年内能量释放积累值、b值、异常地震群个数、地震条带个数、是否处于活动期内以及相关地震区地震级。在训练前,对数据进行归一化处理。由于输入样本为7维的输入向量,一般情况下输入层设7个神经元。根据实际情况,输出层神经元个数为1。隐含层神经元的传递函数为S型正切函数,输出层也可以动态选择传递函数。实例数据来自文献[4],将数据集分为训练集、测试集和确定集。表1中的7×7数组表示归一化后的训练向量,第一个7表示预报因子数,第二个7表示样本数。
表1 归一化后的训练向量
在不同神经元数情况下,对网络进行训练和仿真,得到如图5所示的一组预测误差曲线。其中,曲线A表示隐层结点数为6时的预测误差曲线,曲线B表示隐含层结点数为3时的预测误差曲线,曲线C表示隐含层结点数为5时的预测误差曲线,曲线D表示隐含层结点数为4时的预测误差曲线。将五种情况下的误差进行对比,曲线C表示的网络预测性能最好,其隐含层神经元数为5,图中曲线E表示的是隐含层结点数为15时的预测误差曲线(文献[4]中的最好结果)。同时也证明,在设计BP网络时,不能无限制地增加层神经元的个数。若过多,不仅会大大增加网络结构的复杂性,网络在学习过程中更易陷入局部极小点,而且会使网络的学习速度、预测速度变得很慢。
图5 不同神经元数预测误差对比曲线
5 结论
本文针对基本的BP神经网络,提出了可动态改变神经元数(与精度相关)的BP神经网络预测方法,可以根据实际情况建立预测系统。用此种方法可以建立最好的神经网络,不会有多余的神经元,也不会让网络在学习过程中过早陷于局部极小点。
参考文献
[1]潘正君,康立山,陈毓屏. 演化计算[M ]. 北京:清华大学出版社,1998
[2]飞思科技产品研发中心. 神经网络理论与实现. 北京:电子工业出版社,2005
[3]蔡晓芬,方建斌. 演化神经网络算法. 江汉大学学报,第33卷第3期,2005.9
- 上一篇:基层卫生服务管理
- 下一篇:包装车间绩效考核制度